当前位置：首页 > news >正文

Hinge Loss 和 Zero-One Loss

news 2026/2/8 11:16:38

文章目录

Hinge Loss 和 Zero-One Loss
- Hinge Loss
- Zero-One Loss

Hinge Loss 和 Zero-One Loss

维基百科：https://en.wikipedia.org/wiki/Hinge_loss

图表说明：

纵轴表示固定 $t = 1$ 的 Hinge loss（蓝色）和 Zero-One Loss（绿色）的值，而横轴表示预测值 $y$ 的值。
该图显示，Hinge loss 惩罚了预测值 $y < 1$ ，对应于支持向量机中的边际概念。

Hinge Loss

Hinge Loss是一种常用的机器学习损失函数，通常用于支持向量机（SVM）模型中的分类问题。该函数的定义如下：
$\max(0, 1 - y_i \cdot f(x)) \\ f(x)=w^{\mathrm{T}}x_i+b \tag{1}$
其中， $y_i$ 是样本的真实标签， $f (x)$ 是模型的预测值。该函数的取值范围是非负实数，当预测值和真实值之间的误差越大时，损失函数的值越大。

当样本被正确分类时，即 $yi⋅f(x)>0y_i \cdot f(x) > 0$ ，此时 Hinge Loss 的取值为0，表示模型分类正确，没有产生误差。

当样本被错误分类时，即 $yi⋅f(x)<0y_i \cdot f(x) < 0$ ，此时 Hinge Loss 的取值为 $y_i \cdot f(x)$ ，表示模型的分类错误，并且分类误差越大，Hinge Loss 的值就越大。

Hinge Loss 的目标是最小化分类误差，同时鼓励模型产生较大的间隔（即正确分类和分类超平面之间的距离）。

在支持向量机中，目标是找到一个最大间隔的超平面来分类样本，因此，可以将 Hinge Loss 和间隔相关联。对于一个样本点 $x_i, y_i)$ ，其与超平面之间的距离为：
$yiwTxi+b∥w∥(2)\frac{y_i w^T x_i + b}{\|w\|} \tag{2}$
其中， $w$ 和 $b$ 是支持向量机模型中的权重和偏置。将这个距离记为 $γi\gamma_i$ ，可以将 Hinge Loss 重新表达为：
$L(yi,f(xi))=max⁡(0,1−yi(γi∥w∥))(3)L(y_i, f(x_i)) = \max(0, 1 - y_i (\gamma_i \|w\|)) \tag{3}$
因此，Hinge Loss 不仅能够表达分类误差，还能够促进模型产生较大的间隔，从而增加模型的泛化能力。

Zero-One Loss

Zero-One Loss 是机器学习中的一种常见的分类损失函数。对于一个二分类问题，假设 $\in {-1, 1}$ 为真实标签， $f (x)$ 为模型对样本 $x$ 的预测值，Zero-One Loss 定义为：
$\begin{cases} 0 & \text{if } y = f(x) \\ 1 & \text{otherwise} \end{cases} \tag{4}$
也就是说，当模型的预测结果与真实标签一致时，Zero-One Loss为0；否则，Loss为1。从表达式上可以看出，Zero-One Loss对预测的错误惩罚非常高，因为无论错误的预测有多么接近正确，Loss都会被计算为1。与其他的损失函数相比，Zero-One Loss往往被认为是一种非常严格的评估方式。

然而，由于 Zero-One Loss 本身是不可导的，因此在训练模型时通常会选择使用一些可导的近似函数，如 Hinge Loss 或 Cross Entropy Loss 等。相对于 Zero-One Loss，这些损失函数更为平滑，可以帮助模型更快、更稳定地收敛。

需要注意的是，尽管 Zero-One Loss 在评估模型性能时非常严格，但在实际应用中往往不是最优的选择。特别是当数据集中的标签存在一定的噪声时，使用 Zero-One Loss 可能会导致模型过于拟合训练集，而无法有效地泛化到测试集。因此，在实际应用中，我们通常会使用更加平滑的损失函数，同时结合一些常见的正则化技术，如L1/L2正则化等，来控制模型的复杂度和泛化能力。

Hinge Loss 和 Zero-One Loss

文章目录

Hinge Loss 和 Zero-One Loss

Hinge Loss

Zero-One Loss

相关文章：

Hinge Loss 和 Zero-One Loss

Linux下zabbix_proxy实施部署

Rust之错误处理(二)：带结果信息的可恢复错误

[ vulhub漏洞复现篇 ] Drupal Core 8 PECL YAML 反序列化任意代码执行漏洞(CVE-2017-6920)

如何将数据库结构导入到word

FreeRTOS内存管理 | FreeRTOS十五

【数字电路】数字电路的学习核心

day45【代码随想录】动态规划之完全平方数、单词拆分、打家劫舍、打家劫舍 II

java程序，springboot程序找不到主类，找不到符号解决思路

AntD-tree组件使用详析

spring的事务控制

4.如何靠IT逆袭大学？

提供网络可测试的接口【公共Webservice】

【深入理解计算机系统】库打桩 - 阅读笔记

RocketMQ高性能原理分析

前端面试当中CDN会问啥------CDN详细教程来啦

刷题记录:牛客NC19429红球进黑洞区间拆位异或+区间求和

信息数智化招采系统源码——信息数智化招采系统

20230217使AIO-3399J开发板上跑通Android11系统

Java 基础面试题——面向对象

大数据学习栈记——Neo4j的安装与使用

【Python】 -- 趣味代码 - 小恐龙游戏

React Native 开发环境搭建（全平台详解）

解锁数据库简洁之道：FastAPI与SQLModel实战指南

前端开发面试题总结-JavaScript篇(一)

微信小程序云开发平台MySQL的连接方式

#Uniapp篇：chrome调试unapp适配

掌握 HTTP 请求：理解 cURL GET 语法

Vue3 PC端 UI组件库我更推荐Naive UI

高分辨率图像合成归一化流扩展