当前位置：首页 > news >正文

数据结构与算法基础（王卓）（15）：KMP算法详解（含速成套路和详细思路剖析）

news 2026/2/8 12:08:24

如果时间不够，急（忙）着应付考试没心思看，直接参考（照抄）如下套路：

PART 1：关于next [ j ]

PPT：P30

根据书上以及视频上给出的思路（提醒），我们对于KMP算法拥有了如下的初步（第一阶段）的了解：

书上的内容（经过简化和解释说明后的版本）：

分析模式串t：

对于模式串（子串）t的每个字符 t [ j ] (0≤j≤m-1)

即 j 在字符串最后一个字符前

存在一个整数k(k<j)，使得

模式串中开头的k个字符(t0…t[ k-1])

依次与t[ j ]的

前面k个字符（t[ j – k ]…t[ j – 1 ]）相同

其实就是说：

子串里面的第j个字符，这个字符他前面的k个字符刚好和子串最前面（开头）的k个字符一模一样

注：

这里，我们暂且就给这两串相同的玩意取个名字方便称呼：

我们将前者称之为前缀，后者称之为后缀

将其图像化可能更加直观：

这种属性落实到具体提高比较效率上，重点就是：当出现了前缀和后缀以后

我们可以把（子串）前缀移动到后缀的位置，主串不变，进行下一轮比较

换句话说，就是在（到）下一轮比较时

直接把前缀移动到（移动）之前后缀所处的位置，跳过这中间所有的字符

直接进行这个位置开始的，后面的比较

学习过程中遇到的问题（很容易踩的坑）：

按理说，这里接下来我们就可以进行顺理成章地归纳关于next [ i ]的公式了，比如说至少能理解书上的这一条：

但是，这里我们很容易就发现一个问题：

不是，你这个子串不是说是要往后移吗，怎么经过了这个公式怎么还越变越小了？？？

k都移动到第j位了，j 不得移动到 j +（j-k）位上？？？

这个大概就不对了吧？又或者说，next [ j ]其实并不代表下一次 j 的位置？

然而实际上，该问题的出现根源于没有真正的画图和敲代码（实践）

而该具体问题的核心在于：

j 往前指（指向字符串前面的第k个字符）

并不是说

让子串的位序为 j 的字符移动到主串的位序为next [ j ]的位置（正下方）开始匹配

把后缀移动到之前前缀的位置上来

另外，在这个算法案例中此 j （next【j】）非彼 j（前面文字介绍里面的 j）

这里的 j，相当于一个功能类似于指针的一个下标

要彻底搞清楚该问题过程的核心和本质，我们需要彻底从头开始，重新缕一缕这个KMP算法

（再整个比较过程中的流程和步骤）：

实践操作步骤：

直接匹配（一个一个字符往后匹配），直到匹配不上
看匹配不上的字符之前的字符有没有能实现前缀后缀一样的
（有一样的话）直接把前缀移动到后缀之前摆放的位置
继续匹配

这里 j 的执行过程是

从t【0】开始往后面排，匹配发现不一样以后，i 不变，j（不一样的前一位）

数值变为next [ j ]，指向子串内下标为next [ j ] 的字符

再次说明强调：

不是说让子串的位序为 j 的字符移动到主串的位序为next [ j ]的位置（的正下方）开始匹配

是主串不动，j 指向子串内下标为next [ j ] 的字符

相当于将子串内下标为next [ j ] 的字符向后移动到原来下标为 j 的字符的位置

注意：

这里写的所谓的“移动”的说法，只是我们为了方便初步理解匹配算法的过程

实际上并不存在什么子串的移动来移动去，只有说：

操作过程前，主串的同一个字符（位序为 i ），比较的是子串里（相对而言）靠前面的字符（位序为 j ）

操作后，主串的同一个字符（位序为 i ），比较的是子串里（相对而言）靠后面的字符（位序为 next [ j ] ）

关于next [ j ]的总结：

解决了这么大的一个问题，现在，我们终于可以可以归纳关于next [ i ]的公式了：

（1）：如上面所示，如果存在前缀后缀相同的情况，我们可以让 j （可移动的类似指针的）下标变为 k （指向子串中位序为k的，前缀的后面的第一位字符）来加速比较

（2）：上面我们都默认下标(位序) j 是从0开始，是因为我们的书上写的都是默认为0的情况

实际上下标可以从0开始，也可以从1开始（比如说PPT、网课里面）

但是

对于第一位下标的 next [ j ] 值，他们都选择了：

比第一个下标小1位（第一个下标的前面一位，也是我们实际上永远都取不到的一个位置）

对于“其他情况”（不是第一位但是也没有什么相同的前缀和后缀）的 next [ j ] 值

他们都选择了：第一个下标位

所以说实际上都可以，表面上两个归纳的结果的数值完全不一样

实际上他们的数值制定的原理本质都是一样的，似非而是

而在这里为了应用的方便，我们统一都采用（写成）书上（从0开始）的形式

但是我们也要知道：

如果我们不想从0开始，想要从1开始，这也都是可以的，只要直接按照PPT上面所执行的公式操作就行

next 代码思路：

那么接下来，就是我们把准备了那么多的时间的思想转换为代码的时候了：

框架

首先，我们先把整个（KMP）匹配算法的大框架搭建好:

int Index_KMP(SString S, SString T, int pos)
{int i = pos, j = 0;while (i <= S.length && j <= T.length){if (S.ch[i] == T.ch[j]){++i; ++j;}//主串和子串依次匹配下一个字符elsej = next[j];		}if (j > T.length) return i - T.length; //匹配成功,返回子串位置else return false;
}

难题：如何写出一个判断子串的前后缀是否相同的语句

另外在这里，一开始其实我想写的是不用写什么next【j】，直接在代码里通过算法实现倒退到next【j】的功能，但是这样反而有点混乱，逻辑不清，而且到后面其实已经写不下去了：

			int k = 0;while (1){if (T.ch[k] == T.ch[j]){k++; j--;//然后写一个判断子串的前后缀是否相同的语句//但是这里这样写的话我们可以说要写无穷个判断语句//根本无法实现}}

                   //然后写一个判断子串的前后缀是否相同的语句
                   //但是这里这样写的话我们可以说要写无穷个判断语句
                   //根本无法实现

所以，如何写出一个判断子串的前后缀是否相同的语句使该算法的核心/重点

下面我们来针对此方面开展工作

首先，我们按部就班根据公式：

写出如下程序：

void Get_next(SString T, int(&next)[])
//给你一个子串T，教你逐个算出每个位序对应的next[]
//&：返回所有我们算出的next[]
{int j = 0,//从头开始算起k = -1;//		k = 0; //不可以，根据公式和算法设计，即使是MAX[k]也必须要小于jnext[0] = -1;//根据公式while (j <= T.length - 1)//因为位序从0（而非1）开始{if (k == -1 || T.ch[k] == T.ch[j]){}}
}

然而写到具体如何一个一个判断匹配把比较前缀后缀的思想实现成代码的时候又卡壳卡住了

对此，我们的解决方法是：

多画图，一步一步、一格一格算，不用着急，慢慢来

画出步骤图如下：

在这个过程中，我们很容易就感受到：

其实如果上一步进行匹配运算结果为真的话

下一轮其实我们只需要比较上一轮比较的两个串的后面的一个字符就可以直接判定结果

下一轮的next 【j】是不是上一轮加一

有人说你这TM不是废话吗，但是这句废话在我们这里的程序设计中含有至关重要的意义：

事实上，根据上面这句废话，我们可以画出我们在采用这种方法的流程图

如下：

根据上述流程图，我们不难得到：

if情况：（新字符匹配）

（1）：实现前面所说的

实现一个一个判断匹配把比较前缀后缀的思想实现成代码的操作

至少这里我们可以通过废话：

其实如果上一步进行匹配运算结果为真的话

下一轮其实我们只需要比较上一轮比较的两个串的后面的一个字符就可以直接判定结果

下一轮的next 【j】是不是上一轮加一

以及流程图写出 if 判断语句后面的表达式：

思考逻辑流程：

第一次给next【j】赋值的时候
我们要意识到next【0】是在一开始我们就已经给了他初值的
也就是说第一个被赋值的，是next【1】

此时（系统给的条件）： j = 0, k = -1; 而我们要写入的，是next【1】

重新参考步骤图，我们知道：

给next【1】赋值时，k = 0 ，j = 1；

更何况后面每一步我们都要进行自增，然后再比较的操作

所以自然的：

j++;
k++;

的操作是不可少的

然后我们要考虑的就是赋值和自增操作的前后顺序安排问题了：

再对应着步骤图一个一个看：

next [ 1 ]

k = 0 ，j = 1

next [ 1 ] = 0；

next [ 2 ]

k = 1 ，j = 2

一样：next [ 2 ] = 1

不一样：next [ 2 ] = 0

next [ 3 ]

k = 2 ，j = 3

一样：next [ 3 ] = 2

不一样：next [ 3 ] = 1或0

我们可以看到：

如果（后面的那一个新的字符）匹配结果为真

则 next [ j ] 的值，就为新的（和上一轮不一样的）k的值（新的值其实这里也就是自增过以后得的值）

匹配结果为假，那是else情况里面的东西，我们先不管他

所以从上述操作我们大概就可以判断出来：如果（后面的那一个新的字符）匹配结果为真

那么就先自增，然后赋值next [ j ] = 新的k

else情况：（新字符不匹配）

现在，我们回过头去看看流程图，研究匹配结果为假的情况：

步骤：

（1）：我们会（可以）发现，无一例外，他们进行的操作都是去执行少一位的前缀和后缀的比较（匹配）的算法操作

（当然了，很多人会说，这又是一句废话，你TM介绍算法的基本原理的时候里面TM不就写着吗）

（2）：既然如此（他执行的还是这个比较的操作），比较的操作流程必须由前面的 if 语句执行：

一方面我不可能去再重复写一遍这个比较

另一方面如果一直这样写下去的话，后面就变成了无穷无尽的循环了

所以说到这一步，我们需要思考的：

是怎么让前缀和后缀这两个东西倒（回退）回去，而不是在 else 里面写比较的语句

（3）：在参考过课本上的思路以后，我们意识到：

其实回头去找前缀后缀里面最长的、能相等的两个串，本质上和我们比较子串和主串本质上其实没什么区别

也就是说，在这里，我们可以用KMP算法直接加速这一比较的过程

更巧的是，他前面其实已经给我们算好了 j 前面所有的 next [ j ]

当然，在这我写是这么写，但是总感觉要完整这个过程好像还缺点什么，不够确定就是这样（说不出来缺了什么东西）

总的来说，到了这一步，我们可以用KMP算法，在 else 语句后面写：

k = next[k];

也可以老老实实的就用BF算法：

k--;

是 k-- 吗？我好像不确定，欢迎大家指正😂

代码实现见下一节

数据结构与算法基础（王卓）（15）：KMP算法详解（含速成套路和详细思路剖析）

如果时间不够，急（忙）着应付考试没心思看，直接参考（照抄）如下套路： PART 1：关于next [ j ] PPT：P30 根据书上以及视频上给出的思路（提醒）&#x…...

编程日记 2023/3/12 5:46:07

【互联网架构】聊一聊所谓的“跨语言、跨平台“

文章目录序跨语言跨平台【饭后杂谈】为什么有人说Java的跨平台很鸡肋？序很多技术都具有跨语言、跨平台的特点比如JSON是跨语言的、Java是跨平台的、UniAPP、Electron是跨平台的跨语言和跨平台，是比较重要的一个特性。这些特性经常能够决定开发者是否…...

编程日记 2023/3/12 5:45:02

1.JVM常识之类加载器

1.jvm组成 JVM组成： 1.类加载器 2.运行时数据区 3.执行引擎 4.本地库接口各组件的作用： 首先通过类加载器（ClassLoader）会把 Java 代码转换成字节码，运行时数据区（Runtime Data Area）再把字节码…...

编程日记 2023/3/12 5:43:58

一天搞定《AI工程师的PySide2 PyQt5实战开发手册》

PySide2/PySide6、PyQt5/PyQt6：都是基于Qt 的Python库，可以形象地这样说，PySide2 是Qt的亲儿子(Qt官方开发的) ， PyQt5 是Qt还没有亲儿子之前的收的义子 （Riverbank Computing这个公司开发的，有商业版权限…...

编程日记 2023/3/12 5:42:49

身份推理桌游

目录杀人游戏（天黑请闭眼） （1）入门版 （2）标准版 （3）延伸版——百度百科 （3.1）引入医生和秘密警察 （3.2）引入狙击手、森林老人和…...

编程日记 2023/3/12 5:41:47

[LeetCode周赛复盘] 第 99 场双周赛20230304

[LeetCode周赛复盘] 第 99 场双周赛20230304 一、本周周赛总结二、 [Easy] 2578. 最小和分割1. 题目描述2. 思路分析3. 代码实现三、[Medium] 2579. 统计染色格子数1. 题目描述2. 思路分析3. 代码实现四、[Medium] 2580. 统计将重叠区间合并成组的方案数1. 题目描述2. 思路分析…...

编程日记 2023/3/12 5:40:40

Parcel Bundle漏洞学习

Bundle的序列化细节看上去还是有些复杂的，在之前已经讨论过，一般我们使用Parcel的时候，都是严格的write和read相对应。一些疏漏，不对应，竟然就可以成为漏洞，https://xz.aliyun.com/t/2364 里介绍了Bundle漏…...

编程日记 2023/3/12 5:39:35

RTP载荷H264（实战细节）

RTP包由两部分组成，RTP头和RTP载荷： RTP头 RTP头的结构如下： 代码结构： typedef struct RtpHdr {uint8_t cc : 4, // CSRC countx : 1, // header extendp : 1, // padding flagversion : 2; // versionuint8_t …...

编程日记 2023/3/12 5:38:33

软考高级信息系统项目管理师系列之四十三：信息系统安全管理

软考高级信息系统项目管理师系列之四十三：信息系统安全管理一、信息系统安全管理内容二、信息安全策略1.信息系统安全策略的概念与内容2.信息系统安全等级保护的概念三、信息安全系统1.信息安全系统三维空间2.信息安全系统三种架构体系四、PKI公开密钥基础设施1.PKI总体架构2…...

编程日记 2023/3/12 5:37:30

并发编程之AtomicUnsafe

目录原子操作定义术语处理器如何实现原子操作处理器自动保证基本内存操作的原子性使用总线锁保证原子性使用缓存锁保证原子性 Java当中如何实现原子操作 Atomic 定义原子更新基本类型类原子更新数组类原子更新引用类型原子更新字段类 Unsafe应用解析…...

编程日记 2023/3/12 5:36:27

GDB调试快速入门

什么是GDB： GDB - - - (GNU symbolic debugger)是Linux平台下最常用的一款程序调试器。自己的Linux是否安装GDB? 一般来说，使用Ubuntu的话，系统就会自带的有GDB调试器的命令窗口输入如下命令可以查看是否安装了gdb： gdb -v …...

编程日记 2023/3/12 5:35:22

Vim一次复制，多次粘贴

我们平常在使用Vim时候，通过viwy或者yy等复制操作之后，p操作粘贴的时候，只能粘贴一次，想要粘贴多次怎么办？ 解决方案：在使用p的是时候使用"0p，这样就能无限制的一直粘贴了。可是&#xff…...

编程日记 2023/3/12 5:34:19

如何修改Win11上的默认程序？

在Win10之前，更改特定文件格式的默认程序很简单，但在Win11发布之后，很多用户都不清楚关于Win11的修改默认程序的操作步骤，接下来我们就一起来看看吧，希望可以帮助到大家。步骤如下： 一、如何更改Windows 1…...

编程日记 2023/3/12 5:33:16

安装Linux虚拟机和Hadoop平台教程汇总及踩坑总结

📍主要内容介绍安装Linux虚拟机、ubuntu系统、安装hadoop三个环节的教程链接介绍及本机与虚拟机的FTP传输教程总结（直接找hadoop安装环节的5.filezilla传输文件）新鲜出炉的踩坑总结和填坑指南安装Linux虚拟机和ubuntu系统一、材料和工具1、下…...

编程日记 2023/3/12 5:32:12

Shell脚本的使用和介绍

为了方便以后工作使用和复习，吐血整理记录一下学习shell脚本的笔记，看这篇文章需要对linux系统熟悉，希望对大家有所帮助！文章目录目录文章目录一、什么是shell？为什么要学习和使用shell？二、shell的分类...

编程日记 2023/3/12 5:31:04

机械学习 - 基础概念 - scikit-learn - 数据预处理 - 1

目录安装 scikit-learn术语理解1. 特征（feature ）和样本（ sample / demo）的区别？2. 关于模型的概念一、机械学习概念1. 监督学习总结：2. 非监督学习总结：3. 强化学习总结：三种学习的…...

编程日记 2023/3/12 5:28:56

OLCNE cluster 配置 NFS Storage（英文）

OLCNE cluster 配置 NFS Storage（英文）Create an OLCNE cluster.Create an NFS server.a. Install the NFS utility package on the server and client instances.b. Create a directory for your shared files. Make sure that the server does not hav…...

编程日记 2023/3/12 5:27:51

RabbitMQ高级特性

RabbitMQ高级特性消息可靠性投递 Consumer ACK 消费端限流 TTL 死信队列延迟队列日志与监控消息可靠性分析与追踪管理消息可靠性投递在使用 RabbitMQ 的时候，作为消息发送方希望杜绝任何消息丢失或者投递失败场景。RabbitMQ 为我们提供了两种方式用来控制…...

编程日记 2023/3/12 5:26:47

利用Dockerfile开发定制镜像实战.

Dockerfile的原理 dockerfile是一种文本格式的文件，用于描述如何构建Docker镜像。在Dockerfile中，我们可以定义基础镜像、安装依赖、添加文件等操作，最终生成一个可以直接运行的容器镜像。 Dockerfile的原理可以分为以下几个步骤&#xff1a…...

编程日记 2023/3/12 5:25:41

PyInstaller 将DLL文件打包进exe

PyInstaller 将DLL文件打包进exe方法1：通过--add-data命令方法2：通过修改 .spec扩展：博主热门文章推荐：方法1：通过–add-data命令注意：这里 dll末尾添加的.为当前目录，则该dll要放到main.py同一…...

编程日记 2023/3/12 5:23:25

国防科技大学计算机基础课程笔记02信息编码

1.机内码和国标码国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制，因此这个了16进制的数据既可以翻译成为这个机器码，也可以翻译成为这个国标码，所以这个时候很容易会出现这个歧义的情况； 因此，我们的这个国…...

编程新知 2026/2/8 4:37:15

超短脉冲激光自聚焦效应

前言与目录强激光引起自聚焦效应机理超短脉冲激光在脆性材料内部加工时引起的自聚焦效应，这是一种非线性光学现象，主要涉及光学克尔效应和材料的非线性光学特性。自聚焦效应可以产生局部的强光场，对材料产生非线性响应，可能…...

编程新知 2026/2/4 16:43:14

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2026/2/6 3:59:37

基于FPGA的PID算法学习———实现PID比例控制算法

基于FPGA的PID算法学习前言一、PID算法分析二、PID仿真分析1. PID代码2.PI代码3.P代码4.顶层5.测试文件6.仿真波形总结前言学习内容：参考网站： PID算法控制 PID即：Proportional（比例）、Integral（积分&…...

编程新知 2026/2/6 17:50:11

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

服务端执行命令请求的过程【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

编程新知 2026/2/2 0:45:02

STM32F4基本定时器使用和原理详解

STM32F4基本定时器使用和原理详解前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...

编程新知 2026/1/26 21:56:38

【磁盘】每天掌握一个Linux命令 - iostat

目录【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景注意事项【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat（I/O Statistics）是Linux系统下用于监视系统输入输出设备和CPU使…...

编程新知 2025/9/30 16:39:11

数据链路层的主要功能是什么

数据链路层（OSI模型第2层）的核心功能是在相邻网络节点（如交换机、主机）间提供可靠的数据帧传输服务，主要职责包括： 🔑 核心功能详解： 帧封装与解封装封装： 将网络层下发…...

编程新知 2026/2/1 7:31:51

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题：docker pull 失败网络不同，需要使用镜像源按照如下步骤操作 sudo vi /etc/docker/dae…...

编程新知 2025/12/31 6:28:08

聊一聊接口测试的意义有哪些？

目录一、隔离性 & 早期测试二、保障系统集成质量三、验证业务逻辑的核心层四、提升测试效率与覆盖度五、系统稳定性的守护者六、驱动团队协作与契约管理七、性能与扩展性的前置评估八、持续交付的核心支撑接口测试的意义可以从四个维度展开，首…...

编程新知 2025/10/14 6:46:13