中山市建设局投诉网站/十大引擎网址
目录
前言
一、隐马尔可夫模型
二、马尔可夫随机场
三、条件随机场
四、学习和推断
1.变量消去
2.信念传播
五、近似推断
1.MCMC采样
2.变分推断
六、话题模型
总结
前言
机器学习最重要的任务是根据一些已观察到的证据来对感兴趣的未知变量进行估计和推测。概率模型是其中的一种描述框架,在概率模型中,利用已知变量推测出未知变量的分布称为推断,核心是如何基于可观测变量推断出未知变量的条件分布。生成式模型先对联合分布进行建模,从而再来求解后验概率;判别式模型则是直接对条件分布进行建模。
概率图模型是一类用图来表达变量相关关系的概率模型。其图中的一个结点表示一个或一组随机变量,结点之间的边表示变量间的概率相关关系,即变量关系图。根据边的性质,可将概率图分为两类。第一类使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网;第二类使用无向图表示变量间的相关关系,叫做无向图模型或者马尔可夫网。
一、隐马尔可夫模型
隐马尔可夫模型(HMM)是结构最简单的动态贝叶斯网,主要用于时序数据建模。其结构如下图所示:
其中的变量大致分为两组,第一组为状态变量y,通常假定状态变量是隐藏的、不可被观察的,因此也叫隐变量;第二组是观测变量x,其值可以是连续的也可以是离散的。变量之间的依赖关系遵循马尔可夫链,即系统下一时刻的状态仅由当前状态决定,不依赖于以往的任何状态。因此可以得到所有变量的联合概率分布:
要想确定一个隐马尔可夫模型还需要一下的三种参数:
- 状态转移概率:模型在各状态间转换的概率,通常即为矩阵
,其中
- 输出观测概率:根据状态输出获得各个观测值的概率,即为矩阵
,其中
- 初始状态概率:模型在初始时刻各状态出现的概率,记为
,其中
前上述三种参数加上状态空间和观测空间都确定了之后,就可以确定一个隐马尔可夫模型,其产生观测序列的步骤为:
- 设置t=1,并根据初始状态概率
选择初始状态
- 根据状态
和输出观测概率B选择观测变量取值
- 根据状态
和状态转移矩阵A转移模型状态,即确定
- 若t<n,设置t=t+1,并执行第二步,否则停止
在实际应用中,人们主要关注的隐马尔可夫模型的三个基本问题:
- 如何评估模型与观测序列之间的匹配程度
- 如何根据观测序列推断出隐藏的模型状态
- 如何训练模型使其能最好的描述观测数据
二、马尔可夫随机场
马尔可夫随机场(MRF)是典型的马尔可夫网,是一种著名的无向图模型。图中的每一个结点表示一个或一组变量,结点之间的边表示两个变量之间的依赖关系。MRF有一组势函数,也叫因子,其定义在变量子集上的非负实函数,主要用于定义概率分布函数。
下图为一个简单的MRF,对图中结点的子集,若其中任意两结点间都有边相连,就叫结点子集为一个团;若在一个团中加入任意一个结点都不在形成团,叫说该团为极大团。
若所有变量构成的极大团的集合为C,则MRF的联合概率函数可以定义为:
其中为规范化因子。
对于条件独立性,马尔可夫随机场通过分离集来实现条件独立。如下图所示,若A结点集必须经过C结点集才能到达B结点集,则称C为分离集。
全局马尔可夫性:给定两个变量子集的分离集,则这两个变量子集条件独立。
局部马尔可夫性:给定某变量的邻接变量,则该变量与其它变量条件独立。
成对马尔可夫性:给定所有其他变量,两个非邻接变量条件独立。
MRF中的势函数主要用于描述团中变量之间的相关关系,且要求为非负函数,且在所偏好的变量取值上有较大的函数值。一般使用指数函数来定义势函数,即
其中为一个定义在变量
上的实值函数。
三、条件随机场
条件随机场(CRF)是一种判别式无向图模型。条件随机场试图对多个变量在给定观测值后的条件概率进行建模,即若令为观测序列,
为与之对应的标记序列,则条件随机场的目标是构建条件概率模型P。
理论上讲,图G可以具有任意结构,只要能表示标记变量之间的条件独立性关系即可;在现实应用之中,常用的为链式条件随机场(chain-structured CRF),结构大致如下图
与马尔可夫随机场定义联合概率类似地,CRF也通过团以及势函数的概念来定义条件概率P(y | x)。在给定观测值序列的条件下,链式条件随机场主要包含两种团结构:单个状态团及相邻状态团,通过引入两类特征函数便可以定义出目标条件概率:
其中的为定义在观测序列的两个相邻标记位置上的转移特征函数,用于刻画相邻标记变量之间的相关关系以及观测序列对它们的影响。
是定义在观测序列的标记位置i上的状态特征函数。要使用条件随机场,还需要合适的特征函数,一般为实值函数,以刻画数据的一些很可能成立或期望成立的经验特性。
条件随机场处理的是条件概率,马尔可夫随机场处理的是联合概率。
四、学习和推断
基于概率图模型定义的联合概率分布,能对目标变量的边际分步或以某些可观测变量为条件的条件分布进行推断。边际分布是指对无关变量求和或积分后得到结果。给定参数求解某个变量x的分布,就变成对联合分布中其他无关变量进行积分的过程,叫做边际化。
概率图模型推断大致分为两类:其一为精确推断方法,希望能计算出目标变量的边际分布或条件分布的精确值;其二为近似推断方法,希望在较低的时间复杂度的情况下获得原问题的近似解。
1.变量消去
精确推断的实质是一类动态规划算法,其利用图模型所描述的条件独立性来削减计算目标概率值所需的计算量。变量消去法是最直观的精确推断算法,是构建其他精确推断算法的基础。下图为其工作流程:
变量消去利用条件独立性来消减计算目标概率值所需的计算量,它通过运用乘法与加法的分配率,将对变量的积的求和问题转化为对部分变量交替进行求积与求和的问题,从而将每次的运算控制在局部,达到简化运算的目的。
其一个明显的缺点在于若需计算多个边际分布,重复使用变量消去法将会造成大量冗余计算。
2.信念传播
信念传播算法将变量消去法中的求和操作看做一个消息传递过程,较好的解决了求解多个边际分布时的重复计算问题。在信念传播算法中,一个结点仅在接收到来自其他所有结点的消息后才能向另一个结点发送消息,并且结点的边际分布正比于他所接受的消息的乘积。即:
若图结构中没有环,那么通过下述两个步骤就可以完成所有消息的传递(如下图所示):
- 指定一个根节点,从所有的叶节点开始向根节点传递消息,直到根节点收到所有邻接结点的消息(从叶到根)
- 从根节点开始向叶节点传递消息,直到所有叶节点均收到消息 (从根到叶)
五、近似推断
现实中近似推断更常用,其方法可大致分为采样和使用确定性近似完成近似推断。
1.MCMC采样
采样法基于的思路是基于概率分布来计算期望,并且可能进一步基于这些期望做出决策。概率图模型中最常用的采样技术是马尔可夫链蒙特卡罗(MCMC)方法。给定连续变量的概率密度函数p(x),假定有函数
,那么可以计算f(x)的期望为
若x为一个高维多元变量,且服从一个复杂的分布。MCMC先构造出服从p分布的独立同分布变量,再得到上式的无偏估计:
构造出服从p分布的独立同分布变量的关键在于通过构造平稳分布为p的马尔可夫链来产生样本:若马尔可夫链运行时间足够长(即收敛到平稳状态),那么产出的样本x近似服从分布p。
MCMC方法先设法构造一条马尔可夫链,使其收敛至平稳分布恰为待估计参数的后验分布,然后通过这条马尔可夫链来产生符合后验分布的样本,并基于这些样本来进行估计。不同的马尔可夫链转移概率的构造将会产生不同的MCMC算法。
MCMC的重要代表为MH算法,其基于拒绝采样来逼近平稳分布p,其基本步骤如下图所示:
吉布斯采样有时被视为MH算法的特例,其也使用马尔可夫链获取样本。
2.变分推断
变分推断通过使用已知简单分布来逼近需推断的复杂分布,并通过限制近似分布的类型,从而得到一种局部最优的、有确定解的近似后验分布。
概率图的一种简洁的表示方法为盘式记法,如下所示:
盘式记法中相互独立、由相同机制生成的多个变量会被放在同一个方框里面,并在方框里面标出类似变量重复出现的个数N。上图所对应的推断和学习任务主要是由观察到的变量x来估计隐变量z和分布参数变量。
概率模型的参数估计一般使用最大化似然函数的方法。再实践中使用变分法时最重要的是考虑对隐变量进行拆解,以及假设各变量子集服从何种分布。
六、话题模型
话题模型是一族生成式有向图模型,主要用于处理离散型数据。隐狄利克雷分配模型(LDA)是话题模型的典型代表。首先需要先了解话题模型的几个概念:词、文档和话题。
词:最基本的离散单元; 文档:由一组词组成,词在文档中不计顺序; 话题:由一组特定的词组成,这组词具有较强的相关关系。
现实任务中可通过统计文档中出现的词来获得词频向量,但不知道其对应的话题是什么,也不知道与哪些话题相关。LDA解决了这些问题,其认为每篇文档包含多个话题,那么可以认为可以通过下述的步骤由话题生成文档t:
1.根据参数为
的狄利克雷分布随机采样一个话题分布
2.在按下述步骤生成文档中的N个词:
(a)根据
进行话题指派,得到文档t中的词n的话题
(b)根据指派的话题所对应的词频分布
随机采样生成词
LDA的变量关系为:
其中文档的词频 为唯一的已观测变量,通过其可以得到LDA模型对应的概率分布为:
给定训练数据W,LDA的模型参数可通过极大似然法估计,即寻找和
已最大化似然估计下式:
在实践中通常采用变分法来求解。对于参数和
已确定的,根据词频
来推断文档集所对应的话题结构可通过求解下式:
在实践中常使用吉布斯采样或者变分法进行近似推断。
总结
本章主要从生成式模型与判别式模型出发,引入概率图模型基本概念,利用图结构表达变量依赖关系;介绍隐马尔可夫模型、马尔可夫随机场、条件随机场、精确推断方法及LDA话题模型。
相关文章:
机器学习 第十四章
目录 前言 一、隐马尔可夫模型 二、马尔可夫随机场 三、条件随机场 四、学习和推断 1.变量消去 2.信念传播 五、近似推断 1.MCMC采样 2.变分推断 六、话题模型 总结 前言 机器学习最重要的任务是根据一些已观察到的证据来对感兴趣的未知变量进行估计和推测。概率模…...

未来RPA财税的发展前景
近年来,全球数字化进程持续提速,越来越多企业受到效率及运营成本的压力,正努力寻求企业增长发展的新路径,而财务作为企业战略的“大脑”,成为企业数字化转型的重要突破口。RPA技术由于能够自动化各种重复性和繁琐的任务…...

快速设置 terminator 透明背景
看图,按步骤设置后⭐重启一个终端则为透明效果 效果展示:...

Redis+Unity 数据库搭建
游戏中需要存放排行榜等数据,而且是实时存放,所以就涉及到数据库的问题。这里找服务器大神了解到可以用Redis来做存储,免费的效率极高。 Redis的搭建参考上文的文章,同时也感谢这位网友。 搭建Redis 并测试数据 搭建Redis 1.下…...

WebTracing:如何使用一款SDK实现前端全链路监控
引言 在产品的开发和运营过程中我们经常会遇到一些问题,如用户反馈说无法对某某商品下单,而另一位负责运营的同事也提到某某广告在手机上打不开。尽管这些问题被多次报告,但我们却难以复现这些故障,这让团队感到十分棘手。如何有效地记录项目中的错误并能够重现这些问题,…...

【Story】编程迷航:从 “ 我怎么才学会 ? ” 到 “ 我怎么这么厉害 ! ”
目录 大学生编程入门指南:选择语言、制定计划与避坑技巧1. 选择适合的编程语言1.1 Python1.2 Java1.3 C/C1.4 JavaScript1.5 SQL 2. 制定有效的学习计划2.1 设定明确的目标2.2 制定学习时间表2.3 选择学习资源2.4 实践和项目 3. 避免常见学习陷阱3.1 避免过度焦虑3.…...

基于“日志审计应用”的 DNS 日志洞察实践
作者:羿莉 (萧羿) 基础背景 DNS(Domain Name System) [ 1] 是任何网络活动的基础。它将易于记忆的域名转换为机器能够理解的 IP 地址。监控 DNS 服务可以帮助用户识别网络活动并保持系统安全。出于合规和安全性的考虑,公司通常要求对网络日志进行存储和…...

大学按照学科类别、办学层次、教育性质分类有哪些?创龙教仪一文带您了解
大学的分类多种多样,主要可以从学科类别、办学层次、教育性质等方面进行划分。 一、按学科类别划分 综合类大学 特点:学科门类齐全,文理渗透,科研实力强。 优势:拥有较多的国家级重点学科和实验室,师资…...

数据结构与算法 - 递归
一、递归 1. 概述 定义:在计算机科学中,递归是一种解决计算问题的方法,其中解决方案取决于同一类问题的更小子集。 比如单链表递归遍历的例子: void f(Node node) {if(node null) {return;}println("before:" node…...

python:plotly 网页交互式数据可视化工具
pip install plotly plotly-5.22.0-py3-none-any.whl pip install plotly_express 包含:GDP数据、餐厅的订单流水数据、鸢尾花 Iris数据集 等等 pip show plotly Name: plotly Version: 5.22.0 Summary: An open-source, interactive data visualization librar…...

聊一聊 webpack5性能优化有哪些?
介绍 此文章基于webpack5来阐述 webpack性能优化较多,可以对其进行分类 优化打包速度,开发或者构建时优化打包速度(比如exclude、catch等)优化打包后的结果,上线时的优化(比如分包处理、减小包体积、CDN…...

公布一批神马爬虫IP地址,真实采集数据
一、数据来源: 1、这批神马爬虫IP来源于尚贤达猎头公司网站采集数据; 2、数据采集时间段:2023年10月-2024年1月; 3、判断标准:主要根据用户代理是否包含“YisouSpider”,具体IP没做核实。 二、神马爬虫主…...

uni-app全局文件与常用API
文章目录 rpx响应式单位import导入css样式及scss变量用法与static目录import导入css样式uni.scss变量用法 pages.json页面路由globalStyle的属性pages设置页面路径及窗口表现tabBar设置底部菜单选项及iconfont图标 vite.config中安装插件unplugin-auto-import自动导入vue和unia…...

连接器表面缺陷检测方案
连接器是一种用于连接电子设备或电路中不同部件之间的组件,通常用于传输电力、信号或数据。连接器的设计和类型各不相同,以适应不同设备和应用的需求。连接器用于连接电子设备之间的电线、电缆或电路板,实现信号传输和电力供应。连接器设计应…...

React项目动态设置index.html中的<title>标签内容
1. 安装react-helmet-async npm install react-helmet-async -S2. 如下修改App.tsx即可 import { ConfigProvider } from "antd"; import { RouterProvider } from "react-router-dom"; import { router } from "//router"; import { Helmet, …...

大龄程序员转型攻略:拥抱人工智能,开启新征程
前言 随着科技的飞速发展,人工智能浪潮席卷全球,相关岗位炙手可热。在这个背景下,许多大龄程序员开始思考如何转型,以适应时代的变化。结合自身编程基础,大龄程序员可以学习机器学习、深度学习算法,投身于…...

Jenkins保姆笔记(1)——基于Java8的Jenkins安装部署
前言 记录分享下Jenkins的相关干货知识。分2-3篇来介绍Jenkins的安装部署以及使用。还是和以前一样,文章不介绍较多概念和细节,多介绍实践过程,以战代练,来供大家学习和理解Jenkins 概念 Jenkins是一个开源的自动化服务器&…...

学习c语言第18天(字符串和内存函数)
1.函数介绍 1.1 strlen size_t(就是无符号整形) strlen(const char * str); 字符串已经\0作为结束标志,strlen函数返回的是在字符串中\0前面出现的字符个数(不包 含\0) 参数指向的字符串必须要以\0结束。 注意函数的返回值为size_t,…...

无心剑七绝《潘展乐神》
七绝潘展乐神 潘江陆海忘情游 展志凌云筑玉楼 乐创全球新纪录 神姿英发舞金钩 2024年8月1日 平水韵十一尤平韵 潘展乐神,这四个字,如同四座矗立的丰碑,分别代表了潘展乐在游泳领域的卓越成就、豪情壮志、快乐创新和非凡风采。无心剑的这首…...

Linux C++ 开发1 - 搭建C++开发环境
1. 安装GCC/GDB 1.1. 安装1.2. 校验 2. 安装CMake 2.1. 安装2.2. 校验 3. 安装IDE 3.1. VSCode3.2. CLion 1. 安装GCC/GDB 1.1. 安装 # 更新软件源 sudo apt update # 通过以下命令安装编译器和调试器 sudo apt install build-essential gdb Ubuntu 默认情况下没有提供C/C…...

吴恩达老师机器学习-ex4
梯度检测没有实现。有借鉴网上的部分 导入相关库,读取数据 因为这次的数据是mat文件,需要使用scipy库中的loadmat进行读取数据。 通过对数据类型的分析,发现是字典类型,查看该字典的键,可以发现又X,y等关…...

C语言-函数例题
函数经典例题 1、编写一个函数实现该功能:从键盘输入一个字串符, 再输入两个正整数 m 和 n, 输出字符串中从 m 开始, 连续 n 个字符。例如, 输入 abcdefg,2,3,输出 bcd. #include <stdio.h> /*作者: zcy日期:功能描述:编写…...

鸿蒙应用框架开发【多HAP】程序框架
多HAP 介绍 本示例展示多HAP开发,简单介绍了多HAP的使用场景,应用包含了一个entry HAP和两个feature HAP,两个feature HAP分别提供了音频和视频播放组件,entry中使用了音频和视频播放组件。 三个模块需要安装三个hap包ÿ…...

PG如何实现跨大版本升级
数据库进行升级,是一个再正常不过的功能,比如功能的需要,遇到BUG,安全漏洞等等,具体升级包含子版本升级,主版本升级。如果用过ORACLE的朋友,一定知道,在ORACLE中,如果要实…...

JDK 8 升级 17 及 springboot 2.x 升级 3.x 指南
JDK 8 升级 17 简介 从 JDK 8 升级到 JDK 17 的过程中,有几个主要的变化,特别是 Java Platform Module System (JPMS) 的引入,以及一些包路径的调整。以下是与 JDK 17 相关的一些重要变化: Java Platform Module System (JPMS) …...

基于java的人居环境整治管理系统(源码+lw+部署文档+讲解等)
前言 💗博主介绍:✌全网粉丝20W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 👇🏻…...

深入了解Pip:Python包管理器的详细指南
目录 Pip简介Pip的安装与升级Pip的基本使用 安装包卸载包列出已安装的包查看包的信息 管理依赖 使用requirements.txt冻结当前环境的包 Pip进阶用法 安装特定版本的包使用代理安装包从本地文件安装包 创建和发布Python包 创建一个Python包编写setup.py文件发布到PyPI 常见问题…...

Corsearch 用 ClickHouse 替换 MySQL 进行内容和品牌保护
本文字数:3357;估计阅读时间:9 分钟 作者:ClickHouse Team 本文在公众号【ClickHouseInc】首发 Chase Richards 自 2011 年在初创公司 Marketly 担任工程负责人,直到 2020 年公司被收购。他现在是品牌保护公司 Corsear…...

常见的应急救援设备有哪些_鼎跃安全
在我们的生活中,应急事件的发生常常是突如其来的,它们对人民的生命财产安全构成重大威胁,同时也对社会稳定提出严峻挑战。在这样的紧急情况下,迅速开展有效的救援工作显得尤为重要。而在整个救援过程中,应急设备的使用…...

Vue 项目部署后首页白屏问题排查与解决
引言 在部署 Vue.js 项目时,有时会遇到首页加载后出现白屏的情况,这可能是由于多种原因造成的。本文将介绍一些常见的排查方法和解决方案,帮助开发者快速定位问题并解决。 1. 常见原因分析 首页白屏的问题可能由以下几个方面的原因导致&am…...