【算法分析与设计】贪心算法(下)
目录
- 一、单源最短路径
- 1.1 算法基本思想
- 1.2 算法设计思想
- 1.3 算法的正确性和计算复杂性
- 1.4 归纳证明思路
- 1.5 归纳步骤证明
- 二、最小生成树
- 2.1 最小生成树性质
- 2.1.1 生成树的性质
- 2.1.2 生成树性质的应用
- 2.2 Prim算法
- 2.2.1 正确性证明
- 2.2.2 归纳基础
- 2.2.3 归纳步骤
- 2.3 Kruskal算法
- 2.3.1 证明思路
- 2.3.2 归纳步骤证明
- 2.3.3 T是G的最小生成树
- 2.4 应用:数据分组问题
- 2.5 单链聚类
- 三、多机调度问题
- 四、小结
一、单源最短路径
给定带权有向图G =(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源。现在 要计算从源到所有其它各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。
1.1 算法基本思想
Dijkstra算法是解单源最短路径问题的贪心算法。
Dijkstra算法有关概念:
X∈S←→x∈V且从s到x的最短路径已经找到
初始:S={s},S=V时算法结束
从s到u相对于S的最短路径:从s到u且经过S中顶点的最短路径
dist[u]:从s到u相对S最短路径的长度
short[u]:从s到u的最短路径的长度
dist[u]>=short[u]
1.2 算法设计思想
输入:有向图G=(V,E),V={1,2,…,n},s=1
输出:从s到每个顶点的最短路径
1.初始S={1}
2.对于i∈V-S,计算1到i的相对S的最短路,长度dist[i],没有路可记为∞或maxint
3.选择V-S中dist值最小的j,将j加入S,修改V-S中顶点的dist值
4.继续上述过程,直到S=V为止
其基本思想是,设置顶点集合S并不断地作贪心选择来扩充这个集合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知。
初始时,S中仅含有源。设u是G的某一个顶点,把从源到u且中间只经过S中顶点的路称为从源到u的特殊路径,并用数组dist记录当前每个顶点所对应的最短特殊路径长度。Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中,同时对数组dist作必要的修改。一旦S包含了所有V中顶点,dist就记录了从源到所有其它顶点之间的最短路径长度。
例如,对 右图中的有向图,应用Dijkstra算法计算从源顶点1到其它顶点间最短路径的过程列在下页的表中。
Dijkstra算法的迭代过程:
1.3 算法的正确性和计算复杂性
(1)贪心选择性质
(2)最优子结构性质
(3)计算复杂性
对于具有n个顶点和e条边的带权有向图,如果用带权邻接矩阵表示这个图,那么Dijkstra算法的主循环体 需要时间。这个循环需要执行n-1次,所以完成循环需要时间。算法的其余部分所需要时间不超过。
1.4 归纳证明思路
命题:当算法进行到第k步时,对于S中每个结点i,dist[i]=short[i]
归纳基础
k=1,S={s},dist[s]=short[s]=0
归纳步骤
证明:假设命题对k为真,则对k+1命题也为真
1.5 归纳步骤证明
假设命题对k为真,考虑k+1步算法选择顶点v(边<u,v>)。需要证明dist[v]=short[v]
若存在另一条s-v路径L,最后一次出S的顶点为x,经过V-s的第一个顶点y,再由y经过一段在V-S中的路径到达v
二、最小生成树
设G =(V,E)是无向连通带权图,即一个网络。E中每条边(v,w)的权为c[v][w]。如果G的子图G’是一棵包含G的所有顶点的树,则称G’为G的生成树。生成树上各边权的总和称为该生成树的耗费。在G的所有生成树中,耗费最小的生成树称为G的最小生成树。
网络的最小生成树在实际中有广泛应用。例如,在设计通信网络时,用图的顶点表示城市,用边(v,w)的权c[v][w]表示建立城市v和城市w之间的通信线路所需的费用,则最小生成树就给出了建立通信网络的最经济的方案。
2.1 最小生成树性质
用贪心算法设计策略可以设计出构造最小生成树的有效算法。本节介绍的构造最小生成树的Prim算法和Kruskal算法都可以看作是应用贪心算法设计策略的例子。尽管这2个算法做贪心选择的方式不同,它们都利用了下面的最小生成树性质:
设G=(V,E)是连通带权图,U是V的真子集。如果(u,v)E,且uU,vV-U,且在所有这样的边中,(u,v)的权c[u][v]最小,那么一定存在G的一棵最小生成树,它以(u,v)为其中一条边。这个性质有时也称为MST性质。
2.1.1 生成树的性质
设G是n阶连通图,那么
T是G的生成树,当且仅当T无圈且有n-1条边。
如果T是G的生成树,e不属于T那么T∪{e}含有一个圈C(回路)。
去掉圈C的任意一条边,就得到G的另一棵生成树T’。
2.1.2 生成树性质的应用
算法步骤:选择边
约束条件:不形成回路
截止条件:边数达到n-1
改进生成树T的方法:
在T中加一条非树边e,形成回路C,在C中去掉一条树边ei,形成一颗新的生成树T’
W(T’)-W(T)=W(e)-W(ei)
若W(e)<=W(ei),则 W(T’)<=W(T)
2.2 Prim算法
设G=(V,E)是连通带权图,V={1,2,…,n}。
构造G的最小生成树的Prim算法的基本思想是:首先置S={1},然后,只要S是V的真子集,就作如下的贪心选择:选取满足条件iS,jV-S,且c[i][j]最小的边,将顶点j添加到S中。这个过程一直进行到S=V时为止。
在这个过程中选取到的所有边恰好构成G的一棵最小生成树。
利用最小生成树性质和数学归纳法容易证明,上述算法中的边集合T始终包含G的某棵最小生成树中的边。因此,在算法结束时,T中的所有边构成G的一棵最小生成树。
例如,对于右图中的带权图,按Prim算法选取边的过程如下页图所示。
2.2.1 正确性证明
命题:对于任意k<n,存在一棵最小生成树包含算法前k步选择的边。
归纳基础:k=1,存在一棵最小生成树T包含边e={1,i},其中 {1,i}是所有关联1的边中权最小的。
归纳步骤:假设算法前k步选择的边构成一棵最小生成树的边,则算法前k+1步选择的边也构成一棵最小生成树的边。
2.2.2 归纳基础
证明:存在一棵最小生成树T包含关联结点1的最小权的边e={1,i}
证:设T为一棵最小生成树,假设T不包含{1,i},则T∪ {1,i}含有一条回路,回路中关联1的另一条边{1,j}。用{1,i} 替换{1,j}得到树T’,则T’也是生成树,且W(T’)<=W(T)
2.2.3 归纳步骤
假设算法进行了k步,生成树的边为e1,e2,…ek,这些边的端点构成集合S。由归纳假设存在G的一棵最小生成树T包含这些边
算法第k+1步选择顶点ik+1,则ik+1到S中顶点边权最小,设此边ek+1={ik+1,il},若ek+1∈T,算法k+1步显然正确
假设T不含有ek+1,则将ek+1加到T中形成一条回路。这条回路有另外一条中顶点的边e连接S与V-S中顶点的边e,
令T*=(T-{e})∪{ek+1}则T是G的一棵生成树,包含e1,e2,…ek+1,且W(T)<=W(T)算法到k+1步仍得到最小生成树
在上述Prim算法中,还应当考虑如何有效地找出满足条件iS,jV-S,且权c最小的边(i,j)。实现这个目的的较简单的办法是设置2个数组closest和lowcost。
在Prim算法执行过程中,先找出V-S中使lowcost值最小的顶点j,然后根据数组closest选取边(j,closest[j]),最后将j添加到S中,并对closest和lowcost作必要的修改。
用这个办法实现的Prim算法所需的计算时间为。
2.3 Kruskal算法
Kruskal算法构造G的最小生成树的基本思想是,首先将G的n个顶点看成n个孤立的连通分支。将所有的边按权从小到大排序。然后从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接2个不同的连通分支:当查看到第k条边(v,w)时,如果端点v和w分别是当前2个不同的连通分支T1和T2中的顶点时,就用边(v,w)将T1和T2连接成一个连通分支,然后继续查看第k+1条边;如果端点v和w在当前的同一个连通分支中,就直接再查看第k+1条边。这个过程一直进行到只剩下一个连通分支时为止。
例如,对前面的连通带权图,按Kruskal算法顺序得到的最小生成树上的边如下图所示。
命题:对于任意n,算法对n阶图找到一棵最小生成树。
2.3.1 证明思路
归纳基础 证明:n=2,算法正确。G只有一条边,最小生成树就是G
归纳步骤 证明:假设算法对于n阶图是正确的,其中n>1,则对于任何n+1阶图算法也得到一棵最小生成树
短接操作:任意给n+1个顶点的图G,G中最小边的权e={i,j},从G中合并i和j,得到图G’
2.3.2 归纳步骤证明
对于任意n+1阶图G短接最短边e,得到n阶图G’
根据归纳假设算法得到G’的最小生成树T’
将被短接的边e“拉伸”回到原来长度,得到树T
证明T是G的最小生成树
2.3.3 T是G的最小生成树
T=T’∪{e}是关于G的最小生成树
否则存在G的含边e的最小生成树
T*,W(T*)<W(T)。(如果e不属于T*,在T中加边e,形成回路。去掉回路中任意别的边 所得生成树的权仍旧最小)在T短接e得到G’的生成树T*-{e},
W(T*-{e})=W(T*)-w(e)<W(T)-w(e)=W(T’),与T’的最优性矛盾
关于集合的一些基本运算可用于实现Kruskal算法。
按权的递增顺序查看等价于对优先队列执行removeMin运算。可以用堆实现这个优先队列。
对一个由连通分支组成的集合不断进行修改,需要用到抽象数据类型并查集UnionFind所支持的基本运算。
当图的边数为e时,Kruskal算法所需的计算时间是: 。当 时,Kruskal算法比Prim算法差,但当 时,Kruskal算法却比Prim算法好得多。
2.4 应用:数据分组问题
一组数据(照片、文件等)要把它们按照相关性进行分类
用相似度函数或者“距离”来描述个体之间的差异
分成几类?使得每类内部的个体尽可能相近,不同类之间的个体尽可能地“远离”。如何划分?
2.5 单链聚类
类似于Kruskal算法。
按照边长从小到大对边排序
依次考察当前最短边e,如果e与已经选中的边不构成回路,则把e加入集合,否则跳过e。记数图的连通分支个数
直到保留了k个连通分支为止
三、多机调度问题
多机调度问题要求给出一种作业调度方案,使所给的n个作业在尽可能短的时间内由m台机器加工处理完成。
约定,每个作业均可在任何一台机器上加工处理,但未完工前不允许中断处理。作业不能拆分成更小的子作业。
这个问题是NP完全问题,到目前为止还没有有效的解法。对于这一类问题,用贪心选择策略有时可以设计出较好的近似算法。
采用最长处理时间作业优先的贪心选择策略可以设计出解多机调度问题的较好的近似算法。
按此策略,当 时,只要将机器i的[0, ti]时间区间分配给作业i即可,算法只需要O(1)时间。
当 时,首先将n个作业依其所需的处理时间从大到小排序。然后依此顺序将作业分配给空闲的处理机。算法所需的计算时间为O(nlogn)。
例如,设7个独立作业{1,2,3,4,5,6,7}由3台机器M1,M2和M3加工处理。各作业所需的处理时间分别为{2,14,4,16,6,5,3}。按算法greedy产生的作业调度如下图所示,所需的加工时间为17。
四、小结
贪心算法 通常用来求最优解
总是在当前情况下选择局部最优解,依次进行下去得到整体最优解。
当前最佳选择通常是很容易找到的
贪心算法必须进行正确性证明,一般使用数学归纳法
第一步是显然的
归纳步骤通常使用反证法证明,举反例证伪。
相关文章:
【算法分析与设计】贪心算法(下)
目录 一、单源最短路径1.1 算法基本思想1.2 算法设计思想1.3 算法的正确性和计算复杂性1.4 归纳证明思路1.5 归纳步骤证明 二、最小生成树2.1 最小生成树性质2.1.1 生成树的性质2.1.2 生成树性质的应用 2.2 Prim算法2.2.1 正确性证明2.2.2 归纳基础2.2.3 归纳步骤2.3 Kruskal算…...
Arm Cache学习资料大汇总
关键词:cache学习、mmu学习、cache资料、mmu资料、arm资料、armv8资料、armv9资料、 trustzone视频、tee视频、ATF视频、secureboot视频、安全启动视频、selinux视频,cache视频、mmu视频,armv8视频、armv9视频、FF-A视频、密码学视频、RME/CC…...
Docker 学习总结(79)—— Dockerfile 编写技巧总结
目标 更快的构建速度 更小的 Docker 镜像大小 更少的 Docker 镜像层 充分利用镜像缓存 增加 Dockerfile 可读性 让 Docker 容器使用起来更简单 总结 编写 .dockerignore 文件 容器只运行单个应用 将多个 RUN 指令合并为一个 基础镜像的标签不要用 latest 每个 RUN 指令后删除多…...
链表经典面试题(二)
返回中间结点 1.中间结点的题目2.中间结点的图文分析3.中间结点的基本代码4.中间结点的优化代码 1.中间结点的题目 2.中间结点的图文分析 方法1:先求整体长度,再除以2,所得到的就是中间结点 方法2:双指针法,快指针走两…...
89、Redis 的 value 所支持的数据类型(String、List、Set、Zset、Hash)---->Zset 相关命令
本次讲解要点: ** Set相关命令:是指value中的数据类型** 启动redis服务器: 打开小黑窗: C:\Users\JH>e: E:>cd E:\install\Redis6.0\Redis-x64-6.0.14\bin E:\install\Redis6.0\Redis-x64-6.0.14\bin>redis-server.exe …...
知识图谱02——使用python将信息录入neo4j
将文档传入chatgpt,生成对应的cypher语句 链接: https://pan.baidu.com/s/1Ny-ttbBSpqYEigwYiCWMeA?pwdc7sc 提取码: c7sc 使用命令行安装对应的包 pip install neo4jchatgpt生成出的txt文档中的内容如下: MERGE (Node1:Entity {name: 原始舱单提运单…...
greenDAO-Android轻量级快速ORM框架
官网 https://github.com/greenrobot/greenDAO 简介 greenDAO is a light & fast ORM for Android that maps objects to SQLite databases. Being highly optimized for Android, greenDAO offers great performance and consumes minimal memory. Home page, documen…...
结构型设计模式——组合模式
摘要 组合模式(composite pattern): 允许你将对象组合成树形结构来表现"整体/部分"层次结构. 组合能让客户以一致的方式处理个别对象以及对象组合。 一、组合模式的意图 将对象组合成树形结构来表示“整体/部分”层次关系,允许用户以相同的方式处理单独…...
40. 组合总和 II
给定一个候选人编号的集合 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。 candidates 中的每个数字在每个组合中只能使用 一次 。 注意:解集不能包含重复的组合。 示例 1: 输入: candidates [10,1,2,7,6,1,5…...
安卓玩机-----给app加注册码 app加弹窗 云注入弹窗
在对接很多工作室业务中有些客户需要在他们自带的有些app中加注册码或者验证码的需求。其实操作起来也很简单。很多反编译软件有自带的注入功能。例如注入弹窗。这个是需要对应的注册码来启动应用。而且是随机id。重新安装app后需要重新注册才可以继续使用,原则上可…...
NLP的不同研究领域和最新发展的概述
一、介绍 作为理解、生成和处理自然语言文本的有效方法,自然语言处理 (NLP) 的研究近年来迅速普及并被广泛采用。鉴于NLP的快速发展,获得该领域的概述和维护它是困难的。这篇博文旨在提供NLP不同研究领域的结构化概述,…...
1.物联网射频识别,RFID概念、组成、中间件、标准,全球物品编码——EPC码
1.RFID概念 RFID是Radio Frequency Identification的缩写,又称无线射频识别,是一种通信技术,可通过无线电讯号识别特定目标并读写相关数据,而无需与被识别物体建立机械或光学接触。 RFID(Radio Frequency Identificati…...
MySQL函数与控制结构
MySQL数据库管理系统在数据存储和检索方面发挥着重要作用。除了基础的数据操作外,MySQL还提供了丰富的函数和控制结构来进行更复杂的数据处理。 本文将详细介绍如何在MySQL中使用begin-end语句块、自定义函数、以及各种控制语句。通过《三国志》游戏数据的实例将更深入地了解…...
【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式
【论文极速读】Prompt Tuning——一种高效的LLM模型下游任务适配方式 FesianXu 20230928 at Baidu Search Team 前言 Prompt Tuning是一种PEFT方法(Parameter-Efficient FineTune),旨在以高效的方式对LLM模型进行下游任务适配,本…...
如何在 Elasticsearch 中使用 Openai Embedding 进行语义搜索
随着强大的 GPT 模型的出现,文本的语义提取得到了改进。 在本文中,我们将使用嵌入向量在文档中进行搜索,而不是使用关键字进行老式搜索。 什么是嵌入 - embedding? 在深度学习术语中,嵌入是文本或图像等内容的数字表示…...
世界第一ERP厂商SAP,推出类ChatGPT产品—Joule
9月27日,世界排名第一ERP厂商SAP在官网宣布,推出生成式AI助手Joule,并将其集成在采购、供应链、销售、人力资源、营销、数据分析等产品矩阵中,帮助客户实现降本增效。 据悉,Joule是一款功能类似ChatGPT的产品…...
嵌入式Linux应用开发-基础知识-第十八章系统对中断的处理③
嵌入式Linux应用开发-基础知识-第十八章系统对中断的处理③ 第十八章 Linux系统对中断的处理 ③18.5 编写使用中断的按键驱动程序 ③18.5.1 编程思路18.5.1.1 设备树相关18.5.1.2 驱动代码相关 18.5.2 先编写驱动程序18.5.2.1 从设备树获得 GPIO18.5.2.2 从 GPIO获得中断号18.5…...
【Python】返回指定时间对应的时间戳
使用模块datetime,附赠一个没啥用的“时间推算”功能(获取n天后对应的时间 代码: import datetimedef GetTimestamp(year,month,day,hour,minute,second,*,relativeNone,timezoneNone):#返回指定时间戳。指定relative时进行时间推算"""根…...
微服务moleculer03
1. Moleculer 目前支持SQLite,MySQL,MariaDB,PostgreSQL,MSSQL等数据库,这里以mysql为例 2. package.json 增加mysql依赖 "mysql2": "^2.3.3", "sequelize": "^6.21.3", &q…...
[React] react-router-dom的v5和v6
v5 版本既兼容了类组件(react v16.8前),又兼容了函数组件(react v16.8及以后,即hook)。v6 文档把路由组件默认接受的三个属性给移除了,若仍然使用 this.props.history.push(),此时pr…...
Linux命令(91)之mv
linux命令之mv 1.mv介绍 linux命令mv是用来移动文件或目录,并且也可以用来更改文件或目录的名字 2.mv用法 mv [参数] src dest mv常用参数 参数说明-f强制移动,不提示 3.实例 3.1.重命名文件1.txt为ztj.txt 命令: mv 1.txt ztj.txt …...
C++ 强制类型转换(int double)、查看数据类型、自动决定类型、三元表达式、取反、
强制类型转换( int 与 double) #include <iostream> using namespace std;int main() {// 数据类型转换char c1;short s1;int n 1;long l 1;float f 1;double d 1;int p 0;int cc (int)c;// 注意:字符 转 整形时 是有问题的// “…...
Android自动化测试之MonkeyRunner--从环境构建、参数讲解、脚本制作到实战技巧
monkeyrunner 概述、环境搭建 monkeyrunner环境搭建 (1) JDK的安装不配置 http://www.oracle.com/technetwork/java/javase/downloads/index.html (2) 安装Python编译器 https://www.python.org/download/ (3) 设置环境变量(配置Monkeyrunner工具至path目彔下也可丌配置) (4) …...
Neural Insights for Digital Marketing Content Design 阅读笔记
KDD-2023 很值得读的文章! 1 摘要 电商里,营销内容的实验,很重要。 然而,创作营销内容是一个手动和耗时的过程,缺乏明确的指导原则。 本文通过 基于历史数据的AI驱动的可行性洞察,来弥补 营销内容创作 和…...
BI神器Power Query(26)-- 使用PQ实现表格多列转换(2/3)
实例需求:原始表格包含多列属性数据,现在需要将不同属性分列展示在不同的行中,att1、att3、att5为一组,att2、att3、att6为另一组,数据如下所示。 更新表格数据 原始数据表: Col1Col2Att1Att2Att3Att4Att5Att6AAADD…...
中间件中使用到的设计模式
本文记录阅读源码的过程中,了解/学习到中间件使用到的设计模式及具体运用的组件/功能点 1. 策略模式 1. Nacos2.x中grpc处理时通过请求type来进行具体Handler映射,找到对应处理器。 2. 模板模式 1. Nacos配置数据读取,内部数据源、外部数据…...
运用动态内存实现通讯录(增删查改+排序)
目录 前言: 实现通讯录: 1.创建和调用菜单: 2.创建联系人信息和通讯录: 3.初始化通讯录: 4.增加联系人: 5.显示联系人: 6.删除联系人: 编辑 7.查找联系人: …...
基于Cplex的人员排班问题建模求解(JavaAPI)
使用Java调用Cplex实现了阿里mindopt求解器的案例(https://opt.aliyun.com/platform/case)人员排班问题。 这里写目录标题 人员排班问题问题描述数学建模编程求解(CplexJavaAPI)求解结果 人员排班问题 随着现在产业的发展&#…...
理解Go中的数据类型
引言 数据类型指定了编写程序时特定变量存储的值的类型。数据类型还决定了可以对数据执行哪些操作。 在本文中,我们将介绍Go的重要数据类型。这不是对数据类型的详尽研究,但将帮助您熟悉Go中可用的选项。理解一些基本的数据类型能让你写出更清晰、性能…...
【人工智能导论】线性回归模型
一、线性回归模型概述 线性回归是利用函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。简单来说,就是试图找到自变量与因变量之间的关系。 二、线性回归案例:房价预测 1、案例分析 问题:现在要预测140平方的房屋的价格&…...
手机网站app开发/今天特大新闻
输入两个递增排序的链表,合并这两个链表并使新链表中的节点仍然是递增排序的。 示例1: 输入:1->2->4, 1->3->4 输出:1->1->2->3->4->4限制: 0 < 链表长度 < 1000 注意࿱…...
做网站建设电话销售/营业推广策划
1.采用字符串形式: setInterval("foo(id)",1000); 2.匿名函数封装(推荐) setInterval(functionz() { foo(id); }, 1000); 3.定义返回无参函数的函数 function foo(id) { console.log(id); } function _foo(id) { return function(…...
怎么弄自己的网站卖东西/如何找到网络公关公司
切片 取list或者tuple中的部分元素采用切片操作。 在list中取前N个元素,也就是索引为0-(N-1)的元素,可以用循环: >>> r []>>> n 3>>> for i in range(n):... r.append(L[i])... >>> r[Michael, Sa…...
大连网站网站建设/seo课程培训班费用
先批一下小日本 最近看见有博友在谈论日方外包项目,刚好提到了SQL的编写。 后面给不少朋友拍了 那个select语句的想法是从三个表,进行连接查询。 劳动时间管理情报表提供主要查询结果 原X部门表提供部门名称(鸟文不会打) 最后一个表提供状态名称 主要最大…...
wordpress 自动升级/百度指数
Java运算符:自增和自减:放在前面是先把变量的值加1或者减1,在参与表达式的计算。放在后面是先参与表达式的计算,在把变量的值加1或者减1。java运算符:1. 赋值运算符: 2. 算术运算符: ࿰…...
wordpress+下载媒体库/广东疫情最新消息
基于LoadRunner的Web考试系统性能测试与优化中国农学通报 2014,30(34):250-256Chinese Agricultural Science Bulletin基于LoadRunner的Web考试系统性能测试与优化陈孟婕,刘慧媛,王振洲,王 宇,徐 硕(中国水产科学研究院渔业工程研…...