当前位置：首页 > news >正文

机器学习（15）---代价函数、损失函数和目标函数详解

news 2025/7/8 16:06:38

文章目录

一、各自定义
二、各自详解
三、代价函数和损失函数区别
四、例题理解

一、各自定义

1. 代价函数：代价函数（Cost Function）是定义在整个训练集上的，是所有样本误差的平均，也就是损失函数的平均。它用于衡量模型在所有样本上的平均表现。代价函数通常包含一些正则化项以防止过拟合。在训练过程中，我们希望最小化代价函数。

2. 损失函数：损失函数（Loss Function）是定义在单个样本上的，算的是一个样本的误差。它用于衡量模型在每个单独样本上的表现。对于训练过程来说，我们希望所有样本上的损失函数之和最小。

3. 目标函数：目标函数（Object Function）通常是指最终需要优化的函数。在监督学习中，目标函数通常由经验风险（Empirical Risk）和结构风险（Structural Risk）两部分组成，即目标函数是代价函数（Cost Function）加上正则化项（Regularization Term）。

正则化：（1）机器学习中的正则化是一种修改学习算法的方法，旨在降低模型的泛化误差。它属于结构风险最小化策略的实现，在经验风险上加上一个正则化项（罚项）以限制模型的复杂度。正则化项一般是模型复杂度的单调递增函数，模型越复杂，正则化值就越大。（2）正则化项可以有不同的形式。在回归问题中，如果损失函数是平方损失，正则化项可以是参数向量的L2范数（L2正则化）或者L1范数（L1正则化）。L2正则化项是参数向量的二范数，也就是各个参数的平方和；L1正则化项是参数向量的L1范数，即各个参数的绝对值之和。（3）正则化在训练过程中可以帮助调整模型参数，防止模型过拟合训练数据，从而提高模型的泛化能力。

二、各自详解

1. 代价函数通常是在训练阶段使用的，它的目标是找到模型参数的最优解，使得代价函数的值最小。代价函数通常是将所有样本的损失函数进行平均或者加权平均得到的，它反映的是模型整体的性能。

2. 损失函数则是在训练的每个步骤或者每次迭代中使用的，它的目标是找到每个样本的最优解，使得每个样本的损失函数值最小。损失函数通常用于更新模型的参数，以便在下次迭代时改进模型的预测。

3. 目标函数中的经验风险是模型对训练数据的预测误差的平均，即所有样本的损失函数的平均。结构风险则反映了模型复杂度，通常由正则化项来实现，目的是防止模型过拟合训练数据。在训练过程中，我们通常会选择一个特定的目标函数，然后通过优化该目标函数来改进模型的性能。目标函数的选取取决于具体的学习问题和数据集。例如，线性回归问题的目标函数可以是均方误差（Mean Squared Error），分类问题的目标函数可以是交叉熵（Cross Entropy）等。

三、代价函数和损失函数区别

1. 通俗来说，如果我们将目标比作是山顶，那么代价函数就是从山脚到山顶的平均路程，而损失函数则是从山脚到当前位置的路程。我们需要在训练中不断优化模型，使得从山脚到山顶的平均路程（代价函数）以及每个样本上的路程（损失函数）都尽可能短，从而到达山顶。

2. 不同的机器学习算法对应着不同的代价函数和损失函数。例如线性回归的代价函数是均方误差，损失函数是平方差；逻辑回归的代价函数是交叉熵，损失函数是负对数似然；神经网络的代价函数则可以是均方误差、交叉熵等，损失函数则是对应代价函数的梯度。因此，选择适当的代价函数和损失函数要根据具体的任务和模型来进行。

四、例题理解

在这里插入图片描述

机器学习（15）---代价函数、损失函数和目标函数详解

文章目录

一、各自定义

二、各自详解

三、代价函数和损失函数区别

四、例题理解

相关文章：

机器学习（15）---代价函数、损失函数和目标函数详解

计算机专业大学规划之双非

2.策略模式

算法通过村第七关-树(递归/二叉树遍历)黄金笔记|迭代遍历

MySQL数据库简介+库表管理操作+数据库用户管理

PyTorch实战：卷积神经网络详解+Python实现卷积神经网络Cifar10彩色图片分类

MapRdeuce工作原理

完整指南：使用JavaScript从零开始构建中国象棋游戏

PG-DBA培训19：PostgreSQL高可用集群项目实战之Patroni

数据库管理-第105期安装Database Valut组件（20230919）

企望制造ERP系统RCE漏洞复现

【unity小技巧】Unity 存储存档保存——PlayerPrefs、JsonUtility和MySQL数据库的使用

2023-9-22 滑雪

基于Yolov8的工业小目标缺陷检测（6）：多检测头结合小缺陷到大缺陷一网打尽的轻量级目标检测器GiraffeDet，暴力提升工业小目标缺陷检测能力

exe文件运行后无输出直接闪退如何找解决办法

OpenHarmony应用开发—ArkUI组件集合

Linux(CentOS)安装msf

工作几年还是悟不懂自动化测试的意义

Redis面试问题三什么是缓存雪崩怎么解决

【Unittest】自动化测试框架核心要素

Python爬虫实战：研究MechanicalSoup库相关技术

系统设计 --- MongoDB亿级数据查询优化策略

linux arm系统烧录

拉力测试cuda pytorch 把 4070显卡拉满

【Oracle】分区表

Reasoning over Uncertain Text by Generative Large Language Models

LeetCode - 199. 二叉树的右视图

AirSim/Cosys-AirSim 游戏开发（四）外部固定位置监控相机

Java求职者面试指南：计算机基础与源码原理深度解析

【Linux手册】探秘系统世界：从用户交互到硬件底层的全链路工作之旅