当前位置：首页 > news >正文

【机器学习】分类任务：二分类与多分类

news 2026/2/8 7:36:12

二分类与多分类：概念与区别

二分类和多分类是分类任务的两种类型，区分的核心在于目标变量（label）的类别数：

二分类：目标变量 y 只有两个类别，通常记为 y∈{0,1} 或 y∈{−1,1}。
示例：垃圾邮件分类（垃圾邮件或非垃圾邮件）。
多分类：目标变量 y 包含三个或更多类别，记为 y∈{1,2,…,K}。
示例：手写数字识别（类别为 0 到 9 的数字）。

1. 二分类问题

特征与目标

输入：特征向量 $x \in \mathbb{R}^d$ 。
输出：目标 y ∈ {0,1}。
模型预测：预测值为类别 1 的概率 $P(y=1|x) = \hat{y}$ 。

模型与算法

常用模型：
- 逻辑回归
- 支持向量机（SVM）
- 决策树
- 随机森林
- 神经网络（二分类输出层使用 Sigmoid 激活）
损失函数：
- 对数似然损失（Log-Likelihood Loss）： $\mathcal{L} = -\frac{1}{N} \sum_{i=1}^N \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]$
评估指标：
- 准确率（Accuracy）
- 精确率（Precision）
- 召回率（Recall）
- F1 分数（F1-Score）
- AUC-ROC 曲线

案例代码

from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, roc_auc_score# 生成二分类数据
# 参数说明：n_samples=100表示生成100个样本，n_features=4表示数据有4个特征，n_classes=2表示二分类问题，
# n_informative=2表示其中2个特征是有信息的，n_redundant=1表示1个特征是冗余的，n_repeated=0表示没有重复的特征，
# random_state=0表示随机种子，保证结果可重复
X, y = make_classification(n_samples=100, n_features=4, n_classes=2, n_informative=2, n_redundant=1, n_repeated=0,random_state=0)# 数据集划分
# 将数据集划分为训练集和测试集，test_size=0.2表示测试集占20%，random_state=42保证划分结果可重复
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 使用逻辑回归模型进行训练
# 初始化逻辑回归模型
model = LogisticRegression()
# 使用训练集数据拟合模型
model.fit(X_train, y_train)
# 预测测试集的类别
y_pred = model.predict(X_test)
# 预测测试集的正类概率
y_prob = model.predict_proba(X_test)[:, 1]# 评估模型性能
# 输出测试集的准确率
print("Accuracy:", accuracy_score(y_test, y_pred))
# 输出测试集的AUC-ROC分数
print("AUC-ROC:", roc_auc_score(y_test, y_prob))

输出结果

Accuracy: 0.9
AUC-ROC: 0.9090909090909091

2. 多分类问题

特征与目标

输入：特征向量 $x \in \mathbb{R}^d$ 。
输出：目标 $y \in \{1, 2, \dots, K\}$ 。
模型预测：预测每个类别的概率 $P(y=k|x)$ ，所有类别概率之和为 1。

模型与算法

常用模型：
- Softmax 回归（多类别逻辑回归）
- 决策树与随机森林
- 梯度提升树（如 XGBoost、LightGBM）
- 神经网络（输出层使用 Softmax 激活）
损失函数：
- 交叉熵损失（Cross-Entropy Loss）： $\mathcal{L} = -\frac{1}{N} \sum_{i=1}^N \sum_{k=1}^K 1(y_i = k) \log(\hat{y}_{i,k})$ ,k 是样本 i 被预测为类别 k 的概率。
评估指标：
- 准确率（Accuracy）
- 混淆矩阵（Confusion Matrix）
- 平均精确率、召回率与 F1 分数（Macro / Micro / Weighted）

案例代码

from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report# 生成二分类数据
# 参数说明：n_samples=100表示生成100个样本，n_features=4表示数据有4个特征，n_classes=2表示二分类问题，
# n_informative=2表示其中2个特征是有信息的，n_redundant=1表示1个特征是冗余的，n_repeated=0表示没有重复的特征，
# random_state=0表示随机种子，保证结果可重复
X, y = make_classification(n_samples=100, n_features=4, n_classes=2, n_informative=2, n_redundant=1, n_repeated=0,random_state=0)# 数据集划分
# 将数据集划分为训练集和测试集，test_size=0.2表示测试集占20%，random_state=42保证划分结果可重复
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 初始化随机森林分类器模型
model = RandomForestClassifier()# 使用训练集数据拟合模型
model.fit(X_train, y_train)# 使用拟合好的模型对测试集进行预测
y_pred = model.predict(X_test)# 评估
# 输出模型的准确率
print("Accuracy:", accuracy_score(y_test, y_pred))
# 输出模型的分类报告，包含精确度、召回率、F1分数等指标
print("Classification Report:\n", classification_report(y_test, y_pred))

输出结果

Accuracy: 0.9
Classification Report:precision    recall  f1-score   support0       1.00      0.82      0.90        111       0.82      1.00      0.90         9accuracy                           0.90        20macro avg       0.91      0.91      0.90        20
weighted avg       0.92      0.90      0.90        20

3. 二分类与多分类的区别

属性	二分类	多分类
目标变量	y∈{0,1}	y∈{1,2,…,K}
损失函数	对数似然损失	交叉熵损失
预测输出	类别 0 或 1 的概率	每个类别的概率分布
模型复杂度	相对简单	更复杂，需要考虑类别间关系
评估指标	精确率、召回率、AUC 等	混淆矩阵、宏平均 F1 等

4. 注意事项

模型选择：
- 对于二分类问题，许多模型（如逻辑回归、SVM）内置支持；
- 多分类问题可通过**一对多（OvR）或多对多（OvO）**策略，将多分类问题分解为多个二分类问题。
不平衡数据：
- 二分类和多分类中，不平衡数据都会导致评估指标偏差，需要关注 AUC 或调整权重。
概率解释：
- 二分类中概率直接表示为某一类别的置信度；
- 多分类中概率分布表示样本属于每个类别的可能性。

总结而言，二分类和多分类的问题框架和方法类似，但多分类问题需要更复杂的模型和损失函数来捕捉类别间关系，是分类任务中的重要延伸！

【机器学习】分类任务：二分类与多分类

二分类与多分类：概念与区别二分类和多分类是分类任务的两种类型，区分的核心在于目标变量（label）的类别数： 二分类：目标变量 y 只有两个类别，通常记为 y∈{0,1} 或 y∈{−1,1}。示例&#xff…...

编程日记 2024/12/4 11:58:56

FreeSWITCH mod_conference 的按键会控

又是一篇命题作文 mod_conference 官方文档： https://developer.signalwire.com/freeswitch/FreeSWITCH-Explained/Modules/mod_conference_3965534/ 英文不好的可以看中文： http://www.freeswitch.org.cn/books/references/1.7-mod_conference.html…...

编程日记 2024/12/4 11:53:50

串口工作方式

串口工作方式方式0方式0输出方式0输入方式1方式1输出方式1输入方式2或方式3输出输入串口使用方法如何计算波特率串口初始化步骤串口回传实验模拟printf实验串口接收数据不丢失实验方式0 方式 0 时，串行口为同步移位寄存器的输入输出方式。主要用于扩展并行输入…...

编程日记 2024/12/4 11:49:45

统计Nginx的客户端IP，可以通过分析Nginx的访问日志文件来实现

要统计Nginx的客户端IP，可以通过分析Nginx的访问日志文件来实现。以下是一些常见的方法和步骤： 一、通过命令行工具统计查看Nginx访问日志： Nginx的访问日志通常默认存储在/var/log/nginx/access.log，但具体位置可能因安装和配置…...

编程日记 2024/12/4 11:47:43

Apache Airflow 快速入门教程

Apache Airflow已经成为Python生态系统中管道编排的事实上的库。与类似的解决方案相反，由于它的简单性和可扩展性，它已经获得了普及。在本文中，我将尝试概述它的主要概念，并让您清楚地了解何时以及如何使用它。 Airflow应用场景 …...

编程日记 2024/12/4 11:46:41

42 基于单片机的智能浇花系统

目录一、主要功能二、硬件资源三、程序编程四、实现现象一、主要功能基于51单片机，采样DHT11温湿度传感器检测温湿度，通过LCD1602显示 4*4按键矩阵可以设置温度湿度阈值，温度大于阈值则开启水泵，湿度大于阈值则开启风扇…...

编程日记 2024/12/4 11:44:39

乐橙云小程序插件接入HbuilderX

乐橙插件使用： 1.配置app.json文件，uniapp中在mainfest.json中配置 https://uniapp.dcloud.net.cn/collocation/manifest.html#mp-weixin ** 2、集成插件页面.json文件 ** uniapp在 pages.json 对应页面的 style -> usingComponents 引入组件&…...

编程日记 2024/12/4 11:43:36

VoCo-LLaMA: Towards Vision Compression with Large Language Models

视觉语言模型在各种多模态任务上取得了显著的成功，但经常受到有限上下文窗口和处理高分辨率图像输入和视频的高计算成本的瓶颈。视觉压缩可以通过减少视觉令牌数量避免该问题。先前方法使用额外模块压缩视觉令牌并强制LLM理解压缩的令牌。然而，LLM对视觉…...

编程日记 2024/12/4 11:42:35

Vue+vite 组件开发的环境准备

一.nodejs安装进入Node.js 官网（Node.js — Run JavaScript Everywhere），点击下载。双击打开，进行安装双击打开后，点击 next（下一步）,后面也是一直点击 next 无其他设置，直到 …...

编程日记 2024/12/4 11:41:34

基于社区发现的GraphRAG思路

GraphRAG出自2024年4月的论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》，其代码也在2024年年中开源。它在用图结构来完成RAG时，使用社区这个概念并基于社区摘要来回答一些概括性的问题。 Graph RAG流程如论文图1所…...

编程日记 2024/12/4 11:40:31

react学习记录

一、目录结构react优秀代码之react目录结构简洁之道React 作为一个库，不会决定你如何组织项目的结构。这是件好事，因为这样 - 掘金【React】项目的目录结构全面指南_react项目结构-CSDN博客 1、创建项目：开发文档 Getting Started | Create…...

编程日记 2024/12/4 11:39:29

Day2——需求分析与设计

教师端签到应用软件的需求分析； 产品经理如何写好产品需求文档（附模板） 需求分析是软件开发过程中的关键步骤，它确保了开发的软件能够满足用户的需求。以下是进行需求分析的具体步骤： 1. 确定分析目标明确教师端签到…...

编程日记 2024/12/4 11:38:28

VScode离线下载扩展安装

在使用VScode下在扩展插件时，返现VScode搜索不到插件，网上搜了好多方法，都不是常规操作，解决起来十分麻烦，可以利用离线下载安装的方式安装插件！亲测有效！！！ 1.找到VScod…...

编程日记 2024/12/4 11:33:22

【机器学习】机器学习的基本分类-监督学习-决策树（Decision Tree）

决策树是一种树形结构的机器学习模型，适用于分类和回归任务。它通过一系列基于特征的条件判断来将数据分割为多个子区域，从而预测目标变量的值。 1. 决策树的结构根节点（Root Node） 决策树的起点，包含所有样本。根据某…...

编程日记 2024/12/4 11:31:20

【第 1 章初识 C 语言】1.8 使用 C 语言的 7 个步骤

目录 1.8 使用 C 语言的 7 个步骤 1.8.1 第 1 步：定义程序的目标 1.8.2 第 2 步：设计程序 1.8.3 第 3 步：编写代码 1.8.4 第 4 步：编译 1.8.5 第 5 步：运行程序 1.8.6 第 6 步：测试和调试程序 1.8.…...

编程日记 2024/12/4 11:30:18

Docker 使用 Dockerfile 文件打包部署前端项目

编写 Dockerfile 文件： FROM nginx:latest ADD dist /etc/nginx/html/dist COPY nginx.conf /etc/nginx/nginx.conf ENV PATH /usr/sbin:$PATH EXPOSE 80 ENTRYPOINT ["nginx"] CMD ["-g","daemon off;"]编写 nginx.conf 文件&#…...

编程日记 2024/12/4 11:27:14

HTML-全

. CSS css后缀名的文件被html引用在HTML中，CSS（层叠样式表，Cascading Style Sheets）是一种用于设置网页上的文本内容、图片布局和版面设计等外观样式的样式表语言。简单来说，CSS定义了HTML元素如何显示在浏览器中。…...

编程日记 2024/12/4 11:26:12

高效流程图绘制：开发设计流程图利器

在选择画流程图的工具时，不同的项目和使用场景会决定最佳的工具。以下是几款常见的流程图工具，并结合具体项目使用场景提供建议： 1. Lucidchart 特点： 在线协作：支持多人实时协作，适合团队合作。模板丰富&…...

编程日记 2024/12/4 11:25:11

数据仓库的概念

先用大白话讲一下，数据仓库的主要目的就是存储和分析大量结构化数据的。 > 那么它的核心目的是：支持商业智能（BI）和决策支持系统，也就是说，它不仅仅是为了存储，更重要的是为了分析提供便利。…...

编程日记 2024/12/4 11:24:10

AI - 谈谈RAG中的查询分析（2）

AI - 谈谈RAG中的查询分析（2） 大家好，RAG中的查询分析是比较有趣的一个点，内容丰富，并不是一句话能聊的清楚的。今天接着上一篇，继续探讨RAG中的查询分析，并在功能层面和代码层面持续改进。功…...

编程日记 2024/12/4 11:22:07

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …...

编程新知 2026/2/8 4:37:20

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下，商品详情API作为连接电商平台与开发者、商家及用户的关键纽带，其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息（如名称、价格、库存等）的获取与展示，已难以满足市场对个性化、智能…...

编程新知 2025/9/15 5:56:53

Java 8 Stream API 入门到实践详解

一、告别 for 循环！ 传统痛点： Java 8 之前，集合操作离不开冗长的 for 循环和匿名类。例如，过滤列表中的偶数： List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

编程新知 2026/1/12 10:41:22

【Linux】C语言执行shell指令

在C语言中执行Shell指令在C语言中，有几种方法可以执行Shell指令： 1. 使用system()函数这是最简单的方法，包含在stdlib.h头文件中： #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

编程新知 2025/11/20 18:42:48

深入理解JavaScript设计模式之单例模式

目录什么是单例模式为什么需要单例模式常见应用场景包括单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量惰性单例通用的惰性单例结语什么是单例模式单例模式（Singleton Pattern&#…...

编程新知 2026/1/31 17:09:43

将对透视变换后的图像使用Otsu进行阈值化，来分离黑色和白色像素。这句话中的Otsu是什么意思？

Otsu 是一种自动阈值化方法，用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理，能够自动确定一个阈值，将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

编程新知 2026/1/9 19:36:58

（转）什么是DockerCompose?它有什么作用？

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用，而无需手动一个个创建和运行容器。 Compose文件是一个文本文件，通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

编程新知 2026/1/31 22:59:12