当前位置：首页 > news >正文

机器学习中的可解释性

news 2026/2/8 17:01:19

「AI秘籍」系列课程：

人工智能应用数学基础
人工智能Python基础
人工智能基础核心知识
人工智能BI核心知识
人工智能CV核心知识

为什么我们需要了解模型如何进行预测

我们是否应该始终信任表现良好的模型？模型可能会拒绝你的抵押贷款申请或诊断你患有癌症。这些决定的后果是严重的，即使它们是正确的，我们也希望得到解释。人类可以告诉你，你的收入太低，无法获得抵押贷款，或者特定的细胞群可能是恶性的。提供类似解释的模型比仅提供预测的模型更有用。

在这里插入图片描述

通过获得这些解释，我们说我们正在解释一个机器学习模型。在本文的其余部分，我们将更详细地解释可解释性的含义。然后，我们将继续讨论能够解释模型的重要性和好处。然而，仍然存在一些缺点。最后，我们将讨论这些问题，以及为什么在某些情况下，你可能更喜欢不太可解释的模型。

我们所说的可解释性是什么意思？

在之前的一篇文章中，我讨论了模型可解释性的概念以及它与 interpretable 和 explainable 的机器学习的关系。大部分时候，我们可以将 interpretable 理解为可解释模型，将 explainable 理解为解释性模型。其区别就在于前者通常比较简单、透明，人类可以很容易理解模型是如何得出结论的，而后者则需要通过后处理技术和工具来解释复杂和黑箱模型的决策过程，通过解释工具和方法，揭示模型的内部工作机制和决策依据。

总而言之，可解释性是指模型在人类眼中可以被理解的程度。如果人类更容易理解模型 A 如何进行预测，则模型 A 比模型 B 更具可解释性。例如，卷积神经网络的可解释性不如随机森林，而随机森林的可解释性又不如决策树。

考虑到这一点，如果一个模型无需任何其他辅助/技术就能被理解，我们就说它是一个可解释的模型。Interpretable 的模型具有高度可解释性。相比之下，Explainable 的模型太复杂了，如果没有其他技术的帮助就无法理解。我们说这些模型的可解释性很低。我们可以在图 1 中看到这些概念是如何关联的。一般来说，模型可以分为 interpretable 或者 explainable，但也存在人们意见不一致的灰色地带。

在这里插入图片描述

为什么可解释性很重要？

如上所述，我们需要额外的技术，例如[特征重要性](https://machinelearningmastery.com/calculate-feature-importance-with-python/#:~:text=Feature importance refers to techniques,at predicting a target variable.)¹或LIME: https://github.com/marcotcr/lime，来了解 explainable 模型的工作原理。实现这些技术可能需要付出很多努力，而且重要的是，它们只能提供模型工作原理的近似值。因此，我们不能完全确定我们理解了 explainable 模型。在比较 interpretable 模型时，我们可能会遇到类似的情况。

在这里插入图片描述

例如，逻辑回归和决策树。这些都不需要额外的技术，但逻辑回归可能仍需要更多努力来解释。我们需要了解 S 型函数以及系数与几率/概率的关系。这种复杂性也可能导致我们的解释错误。一般来说，模型越容易解释，它就越容易理解，我们就越能确定我们的理解是正确的。可解释性很重要，因为它有很多好处。

更容易解释

我们的第一个好处是 interpretable 模型更容易向其他人解释。对于任何主题，我们理解得越好，解释起来就越容易。我们还应该能够用简单的术语来解释它（即不提及技术细节）。在行业中，许多人可能希望对你的模型的工作原理进行简单的解释。这些人不一定具有技术背景或机器学习经验。

例如，假设我们创建了一个模型，可以预测某人是否会提出人寿保险索赔。我们希望使用此模型来自动化公司的人寿保险承保。为了批准该模型，我们的老板需要详细解释其工作原理。不满的客户可能会要求解释为什么他们没有获得人寿保险批准。监管机构甚至可以依法要求提供这样的解释。

在这里插入图片描述

试图向这些人解释神经网络如何进行预测可能会引起很多困惑。由于不确定性，他们甚至可能不会接受这种解释。相比之下，像逻辑回归这样的可解释模型可以用人类的术语来理解。这意味着它们可以用人类的术语来解释。例如，我们可以精确地解释顾客的吸烟习惯在多大程度上增加了他们的死亡概率。

更容易感知、检查和修复错误

上面描述的关系是因果关系（即吸烟导致癌症/死亡）。一般来说，机器学习模型只关心关联。例如，模型可以使用某人的原籍国来预测他们是否患有皮肤癌。但是，就像吸烟一样，我们能说某人的国家导致癌症吗？原因是皮肤癌是由阳光引起的，而有些国家比其他国家阳光更充足。所以我们只能说皮肤癌与某些国家有关。

在这里插入图片描述

华盛顿大学研究人员进行的一项实验很好地说明了关联可能出错的地方。研究人员训练了一个图像识别模型，将动物分类为哈士奇或狼。他们使用 LIME 试图了解他们的模型如何做出预测。在图 2 中，我们可以看到该模型的预测是基于图像背景。如果背景有雪，动物总是被归类为狼。他们基本上建立了一个检测雪的模型。

问题在于狼与雪有关。狼通常会在雪地里出现，而哈士奇则不会。这个例子告诉我们，模型不仅可以做出错误的预测，还可以以错误的方式做出正确的预测。作为数据科学家，我们需要检查我们的模型，以确保它们不会以这种方式进行预测。你的模型越容易解释，就越容易做到这一点。

在这里插入图片描述

更容易确定未来表现

随着时间的推移，模型的预测能力可能会下降。这是因为模型特征和目标变量之间的关系可能会发生变化。例如，由于工资差距，收入目前可能是性别的良好预测指标。随着社会变得更加平等，收入将失去其预测能力。我们需要意识到这些潜在的变化及其对我们模型的影响。对于 explainable 模型来说，这一点更难做到。由于特征的使用方式不太清楚，即使我们知道对单个特征的影响，我们也可能无法判断对整个模型的影响。

更容易从模型中学习

试图在未知事物中寻找意义是人类的天性。机器学习可以帮助我们发现数据中未知的模式。但是，我们无法仅通过查看模型的预测来识别这些模式。如果我们无法解释我们的模型，那么任何教训都会丢失。最终，模型的可解释性越差，从中学习就越困难。

在这里插入图片描述

算法公平性

重要的是，你的模型必须做出公正的决策，这样它们才不会延续任何历史不公正。识别偏见的来源可能很困难。它通常来自模型特征与受保护变量（例如种族或性别）之间的关联。例如，由于南非有强制隔离的历史，种族与某人的所在地\邻里关系密切。位置可以作为种族的代理。使用位置的模型可能会偏向某一种族。

使用 interpretable 模型并不一定意味着你将拥有一个无偏见的模型。这也不意味着更容易确定模型是否公平。这是因为大多数公平性衡量标准（例如假阳性率、不同影响）与模型无关。对于任何模型，它们都很容易计算。使用 interpretable 模型确实可以更轻松地识别和纠正偏见来源。我们知道正在使用哪些特征，并且可以检查其中哪些与受保护的变量相关。

在这里插入图片描述

可解释性的缺点

好的，我们明白了…… interpretable 模型很棒。它们更容易理解、解释和学习。它们还使我们能够更好地感知当前性能、未来性能和模型公平性。然而，可解释性也存在缺点，在某些情况下我们更喜欢 explainable 模型。

容易被操纵

基于机器学习的系统容易受到操纵或欺诈。例如，假设我们有一个自动发放汽车贷款的系统。一个重要特征可能是信用卡数量。客户拥有的卡越多，风险就越大。如果客户知道这一点，他们可以暂时取消所有卡，申请汽车贷款，然后重新申请所有信用卡。

在这里插入图片描述

客户取消信用卡时偿还贷款的概率不会改变。客户操纵模型做出了错误的预测。模型越容易解释，就越透明，越容易操纵。即使模型的内部工作原理是保密的，情况也是如此。特征和目标变量之间的关系通常更简单，因此更容易猜测。

学习内容更少

我们提到，interpretable 模型更容易学习。但另一方面，它们不太可能教会我们新东西。像神经网络这样的 explainable 模型可以自动模拟数据中的交互和非线性关系。通过解释这些模型，我们可以发现这些我们从未知道存在的关系。

相比之下，线性回归等算法只能对线性关系进行建模。要对非线性关系进行建模，我们必须使用特征工程将任何相关变量纳入我们的数据集。这将需要事先了解这些关系，从而违背了解释模型的目的。

领域知识/专业知识要求

构建 interpretable 模型需要大量的领域知识和专业知识。通常，interpretable 模型（如回归）只能对数据中的线性关系进行建模。要对非线性关系进行建模，我们必须执行特征工程。例如，对于医学诊断模型，我们可能希望使用身高和体重来计算 BMI。了解哪些特征具有预测性以及创建哪些特征需要特定领域的领域知识。

你的团队可能不具备这些知识。或者，你可以使用 explainable 模型，该模型将自动对数据中的非线性关系进行建模。这样就无需创建任何新特征；本质上将思考留给了计算机。正如我们上面详细讨论的那样，缺点是，对如何使用这些特征进行预测的理解较差。

在这里插入图片描述

复杂性与准确性之间的权衡

从上面我们可以看出，一般来说，模型越简单，可解释性就越强。因此，为了获得更高的可解释性，可能会以较低的准确度为代价。这是因为，在某些情况下，较简单的模型可能会做出不太准确的预测。这实际上取决于你要解决的问题。例如，使用逻辑回归进行图像识别会得到较差的结果。

对于许多问题，interpretable 模型的表现与 explainable 模型一样好。在之前的文章「特征工程的力量」中，我们将 interpretable 模型 Logistic 回归与 explainable 模型神经网络进行了比较。我们证明，通过对我们的问题进行一些思考并创建新特征，我们可以用 interpretable 模型实现类似的准确性。这是对我们在本文中讨论的一些概念的一个很好的实践。

特征工程的力量

为什么你应该使用逻辑回归来建模非线性决策边界（使用 Python 代码）

参考

How to Calculate Feature Importance With Python, https://machinelearningmastery.com/calculate-feature-importance-with-python/#:~:text=Feature%20importance%20refers%20to%20techniques,at%20predicting%20a%20target%20variable. ↩︎

机器学习中的可解释性

「AI秘籍」系列课程： 人工智能应用数学基础人工智能Python基础人工智能基础核心知识人工智能BI核心知识人工智能CV核心知识为什么我们需要了解模型如何进行预测我们是否应该始终信任表现良好的模型？模型可能会拒绝你的抵押贷款申请或诊断你患…...

编程日记 2024/7/9 9:36:58

上海慕尼黑电子展开展，启明智显携物联网前沿方案亮相

随着科技创新的浪潮不断涌来，上海慕尼黑电子展在万众瞩目中盛大开幕。本次展会汇聚了全球顶尖的电子产品与技术解决方案，成为业界瞩目的焦点。启明智显作为物联网彩屏显示领域的佼佼者携产品亮相展会，为参展者带来了RTOS、LINUX全系列方案及A…...

编程日记 2024/7/9 9:35:57

Centos7离线安装ElasticSearch7.4.2

一、官网下载相关的安装包 ElasticSearch7.4.2： elasticsearch-7.4.2-linux-x86_64.tar.gz 下载中文分词器： elasticsearch-analysis-ik-7.4.2.zip 二、上传解压文件到服务器上传到目录：/home/data/elasticsearch 解压文件&#xff1…...

编程日记 2024/7/9 9:32:50

深入理解sklearn中的模型参数优化技术

参数优化是机器学习中的关键步骤，它直接影响模型的性能和泛化能力。在sklearn中，参数优化可以通过多种方式实现，包括网格搜索（GridSearchCV）、随机搜索（RandomizedSearchCV）和贝叶斯优化等。本文…...

编程日记 2024/7/9 9:31:48

【Elasticsearch】开源搜索技术的演进与选择：Elasticsearch 与 OpenSearch

开源搜索技术的演进与选择：Elasticsearch 与 OpenSearch 1.历史发展2.OpenSearch 与 Elasticsearch 相同点3.OpenSearch 与 Elasticsearch 不同点3.1 版本大不同3.2 许可证不同3.3 社区不同3.4 功能不同3.5 安全性不同3.6 性能不同3.7 价格不同3.8 两者可相互导入 4…...

编程日记 2024/7/9 9:29:43

欧拉openEuler 22.03 LTS-部署k8sv1.03.1

1.设置ip # vi /etc/sysconfig/network-scripts/ifcfg-ens32 TYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DEFROUTEyes IPV4_FAILURE_FATALno #IPV6INITyes #IPV6_AUTOCONFyes #IPV6_DEFROUTEyes #IPV6_FAILURE_FATALno #IPV6_ADDR_GEN_MODEeui64 NAMEens1…...

编程日记 2024/7/9 9:27:40

老年生活照护实训室：为养老服务业输送专业人才

本文探讨了老年生活照护实训室在养老服务业专业人才培养中的关键作用。通过详细阐述实训室的功能、教学实践、对学生能力的培养以及面临的挑战和解决方案，强调了其在提升人才素质、满足行业需求方面的重要性，旨在为养老服务业的可持续发展提供有力的人才…...

编程日记 2024/7/9 9:24:04

go语言中使用WaitGroup和channel实现处理多线程问题

WaitGroup 背景如果将一个任务分为任意个小任务，并且不关心小任务的执行顺序，并且希望等待全部的小任务执行完成后再去操作后面的逻辑，那我推荐你用sync.WaitGRoup 使用方法比如，有一个任务需要执行 3 个子任务，…...

编程日记 2024/7/9 9:23:00

Open3D 计算点云的平均密度

目录一、概述 1.1基于领域密度计算原理 1.2应用二、代码实现三、实现效果 2.1点云显示 2.2密度计算结果一、概述在点云处理中，点的密度通常表示为某个点周围一定区域内的点的数量。高密度区域表示点云较密集，低密度区域表示点云较稀疏。计算…...

编程日记 2024/7/9 9:21:59

C语言之数据在内存中的存储（1），整形与大小端字节序

目录前言一、整形数据在内存中的存储二、大小端字节序三、大小端字节序的判断四、字符型数据在内存中的存储总结前言本文主要讲述整型包括字符型是如何在内存中存储的，涉及到大小端字节序这一概念，还有如何判断大小端，希望对大…...

编程日记 2024/7/9 9:20:54

B端全局导航：左侧还是顶部？不是随随便便，有依据在。

一、什么是全局导航 B端系统的全局导航是指在B端系统中的主要导航菜单，它通常位于系统的顶部或左侧，提供了系统中各个模块和功能的入口。全局导航菜单可以帮助用户快速找到和访问系统中的各个功能模块，提高系统的可用性和用户体验。全局导航…...

编程日记 2024/7/9 9:17:50

什么是海外仓管理自动化？策略及落地实施步骤指南

作为海外仓的管理者，你每天都面临提高海外仓运营效率、降低成本和满足客户需求的问题。海外仓自动化管理技术为这些问题提供了不错的解决思路，不过和任何新技术一样，从策略到落地实施，都有一个对基础逻辑的认识过程。今天我们整…...

编程日记 2024/7/9 9:14:47

自定义控件三部曲之绘图篇（六）Paint之函数大汇总、ColorMatrix与滤镜效果、setColorFilter

在自定义控件的绘图篇中，Paint 类是核心的组成部分之一，它控制了在 Canvas 上绘制的内容的各种属性，包括颜色、风格、抗锯齿、透明度等等。下面将详细介绍 Paint 的主要功能以及如何使用 ColorMatrix 和 setColorFilter 来实现滤镜效果。 Pa…...

编程日记 2024/7/9 9:13:45

请写sql满足业务：找到连续登录3天以上的用户

为了找到连续登录超过 3 天的用户，我们可以使用 SQL 窗口函数和递归查询来实现。假设有一个 user_logins 表，包含以下字段： user_id（用户ID）login_date（登录日期） 假设 login_date 是 DATE 类…...

编程日记 2024/7/9 9:11:41

fatal error: apriltag/apriltag.h: No such file or directory 的参考解决方法

文章目录写在前面一、问题描述二、解决方法参考链接写在前面自己的测试环境： Ubuntu20.04，ROS-Noteic 一、问题描述自己编译ROS程序的时候遇到如下问题： fatal error: apriltag/apriltag.h: No such file or directory9 | #include &…...

编程日记 2024/7/9 9:09:38

C++继承（一文说懂）

目录一： 🔥继承的概念及定义1.1 继承的概念1.2 继承定义1.2.1 定义格式1.2.2 继承关系和访问限定符1.2.3 继承基类成员访问方式的变化二：🔥基类和派生类对象赋值转换三：🔥继承中的作用域四：&a…...

编程日记 2024/7/9 9:08:37

卷积神经网络可视化的探索

文章目录训练LeNet模型下载FashionMNIST数据训练保存模型卷积神经网络可视化加载模型一个测试图像不同层对图像处理的可视化第一个卷积层的处理第二个卷积层的处理卷积神经网络是利用图像空间结构的一种深度学习网络架构，图像在经过卷积层、激活层、池化层、全连…...

编程日记 2024/7/9 9:03:27

RxJava学习记录

文章目录 1. 总览1.1 基本原理1.2 导入包和依赖 2. 操作符2.1 创建操作符2.2 转换操作符2.3 组合操作符2.4 功能操作符 1. 总览 1.1 基本原理参考文献构建流：每一步操作都会生成一个新的Observable节点(没错，包括ObserveOn和SubscribeOn线程变换操作…...

编程日记 2024/7/9 9:00:20

Spring Boot Vue 毕设系统讲解 3

目录项目配置类项目中配置的相关代码 spring Boot 拦截器相关知识一、基于URL实现的拦截器： 二、基于注解的拦截器三、把拦截器添加到配置中，相当于SpringMVC时的配置文件干的事儿： 项目配置类项目中配置的相关代码首先定义项目认…...

编程日记 2024/7/9 8:58:18

Spring Boot对接大模型：实战价值与技巧

Spring Boot对接大模型：实战价值与技巧随着大数据和人工智能技术的飞速发展，大模型（Large-scale Models）在各个行业中的应用越来越广泛。为了充分利用这些大模型的能力，我们需要将其与现有的应用框架进行对接。Sprin…...

编程日记 2024/7/9 8:57:17

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周，有很多同学在写期末Java web作业时，运行tomcat出现乱码问题，经过多次解决与研究，我做了如下整理： 原因： IDEA本身编码与tomcat的编码与Windows编码不同导致，Windows 系统控制台…...

编程新知 2026/2/8 4:37:39

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/1/22 15:14:25

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

前一阵子在百度 AI 开发者大会上，看到基于小智 AI DIY 玩具的演示，感觉有点意思，想着自己也来试试。如果只是想烧录现成的固件，乐鑫官方除了提供了 Windows 版本的 Flash 下载工具之外，还提供了基于网页版的 ESP LA…...

编程新知 2026/2/3 8:13:35

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章，二者共同塑造了现代RESTful API的开发范式。本期就扒一扒其技术演进的关键节点与核心逻辑： 🔄 一、起源与初创期：Swagger的诞生（2010-2014） 核心…...

编程新知 2026/1/25 9:08:41

GC1808高性能24位立体声音频ADC芯片解析

1. 芯片概述 GC1808是一款24位立体声音频模数转换器（ADC），支持8kHz~96kHz采样率，集成Δ-Σ调制器、数字抗混叠滤波器和高通滤波器，适用于高保真音频采集场景。 2. 核心特性高精度：24位分辨率&#xff0c…...

编程新知 2026/1/27 4:58:14

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

2025年#高考将在近日拉开帷幕，#AI 监考一度冲上热搜。当AI深度融入高考，#时间同步不再是辅助功能，而是决定AI监考系统成败的“生命线”。 AI亮相2025高考，40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕，江西、…...

编程新知 2026/2/3 2:10:25

Reasoning over Uncertain Text by Generative Large Language Models

https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829 1. 概述文本中的不确定性在许多语境中传达，从日常对话到特定领域的文档（例如医学文档）（Heritage 2013；Landmark、Gulbrandsen 和 Svenevei…...

编程新知 2026/2/8 2:27:29

佰力博科技与您探讨热释电测量的几种方法

热释电的测量主要涉及热释电系数的测定，这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中，积分电荷法最为常用，其原理是通过测量在电容器上积累的热释电电荷，从而确定热释电系数…...

编程新知 2026/1/23 11:53:19

我们所说的可解释性是什么意思？

为什么可解释性很重要？

更容易解释

更容易感知、检查和修复错误

更容易确定未来表现

更容易从模型中学习

算法公平性

可解释性的缺点

容易被操纵

学习内容更少

领域知识/专业知识要求

复杂性与准确性之间的权衡

参考

相关文章：