当前位置：首页 > news >正文

如何在我们的模型中使用Beam search

news 2026/2/8 0:16:30

在上一篇文章中我们具体探讨了Beam search的思想以及Beam search的大致工作流程。根据对Beam search的大致流程我们已经清楚了，在这我们来具体实现一下Beam search并应用在我们的seq2seq任务中。

1. python中的堆（heapq）

堆是一种特殊的树形数据结构。堆分为大根堆和小根堆两种类型，其中：

小根堆：父节点的值小于或等于其子节点的值。
大根堆：父节点的值大于或等于其子节点的值。

堆的应用场景主要是以下两个：

1. 堆排序，完成升序或降序排列；

2. 优先级队列，其中元素按照优先级顺序排列，优先级越低越先出队。在每次插入元素时，堆会自动调整以确保最高（或最低）优先级的元素位于堆的根部。

2. Beam search的实现

2.1 Beam search的流程

我们通过构建堆来实现Beam search，主要流程：

1. 构造 <SOS> 做为第一次输入信息保存在堆中；

2. 取出堆中的数据，开始forward操作，获取当前时间步的输出output、hidden；

3. 从output中选择top k个数据输出，做为下一个时间步的输入（其中Beam width = k）；

4. 把下一个时间步需要的输入数据保存在一个新的堆中；

5. 获取新的堆中概率最大的数据，判断数据是否为 <EOS> 或者序列是否达到输出最大长度，如果符合则停止输出，若不符合则继续循环2～5。

2.2 构建beam

class Beam:def __init__(self):self.heap = list()self.beam_width = 3def add(self, probability, complete, seq, decoder_input, decoder_hidden):"""入队:param probability: 概率乘积:param complete: 句子是否输出完成:param seq: 句子 包含token的list:param decoder_input: 下一个时间步进行解码的输入:param decoder_hidden: 下一个时间步进行解码的hidden:return: """heapq.heappush(self.heap, [probability, complete, seq, decoder_input, decoder_hidden])# 如果数据的个数大于beam_width则弹出if len(self.heap) > self.beam_width:# heappop会根据优先级从小到大弹出，所以优先级最大的beam_widt会被保存在堆中# 当两个元素的probability的优先级相同时，则根据complete优先级弹出heapq.heappop(self.heap)def __iter__(self):return iter(self.heap)

现在我们完成了保存数据的数据结构。

使用Beam search进行评估

在decoder中我们先定义一个函数处理序列

    def _prepar_seq(self, seq):"""去除seq中的<SOS>和<EOS>的token"""if seq[0].item() == ws.SOS:seq = seq[1:]if seq[-1].item() == ws.EOS:seq = seq[:-1]seq = [i.item() for i in seq]return seq

接下来在decoder中使用beam search

    def beam_search(self, encoder_outputs, encoder_hidden):"""使用堆来完成beam search:param encoder_outputs: [batch_size, seq_len, encoder_hidden_size]:param encoder_hidden: [1, batch_size, encoder_hidden_size]"""batch_size = encoder_hidden.size(1)# 1. 构造第一次需要的输入数据，保存在堆中decoder_input = torch.LongTensor([[ws.SOS]*batch_size]).to(device)  # [batch_size, 1]# 要输入的hiddendecoder_hidden = encoder_hiddenprev_beam = Beam()prev_beam.add(1, False, [decoder_input], decoder_input, decoder_hidden)while True:cur_beam = Beam()# 2. 取出堆中的数据，进行forward_step操作，获得当前时间步的output， hiddenfor _probability, _complete, _seq, _decoder_input, _decoder_hidden in prev_beam:# 判断前一次的 _complete是否为True，如果是则不需要forward# 有可能为True，但是概率并不是最大if _complete == True:cur_beam.add(_probability, _complete, _seq, _decoder_input, _decoder_hidden)else:# 需要进行forward操作decoder_output_t, decoder_hidden = self.forward_step(_decoder_input, _decoder_hidden, encoder_outputs)# 3. 从output中选择最大的beam width个输出，作为下一次的inputvalue, index = torch.topk(decoder_output_t, config.beam_width)  # [batch_size, beam_width]for m, n in zip(value[0], index[0]):decoder_input = torch.LongTensor([[n]]).to(config.device)seq = _seq + [n]  # 更新句子序列probability = _probability * m  # 更新概率乘积if n.item() == config.chatbot_ws_by_word_target.SOS:complete = Trueelse:complete = False# 4. 把下个时间步需要的输入等数据保存在一个新的堆中cur_beam.add(probability, complete, seq, decoder_input, decoder_hidden)# 5. 获取新的堆中的优先级最高（概率最大）的数据，判断数据是否以EOS结尾或者是达到最大长度# 若是则停止迭代# 若不是则继续best_prob, best_complete, best_seq, _, _ = max(cur_beam)if best_complete == True or len(best_seq) - 1 == config.chatbot_target_max_seq_len + 1:return self._perpar_seq(best_seq)else:prev_beam = cur_beam

如何在我们的模型中使用Beam search

在上一篇文章中我们具体探讨了Beam search的思想以及Beam search的大致工作流程。根据对Beam search的大致流程我们已经清楚了，在这我们来具体实现一下Beam search并应用在我们的seq2seq任务中。 1. python中的堆（heapq） 堆是一种特殊的树形…...

编程日记 2024/2/14 22:30:58

PKI - 借助Nginx 实现Https 服务端单向认证、服务端客户端双向认证

文章目录 Openssl操系统默认的CA证书的公钥位置Nginx Https 自签证书1. 生成自签名证书和私钥2. 配置 Nginx 使用 HTTPS3. 重启 Nginx 服务4. 直接访问5. 不验证证书直接访问6. 使用server.crt作为ca证书验证服务端解决方法1：使用 --resolve 参数进行请求域名解析解…...

编程日记 2024/2/14 22:29:57

WebSocket原理详解

目录 1.引言 1.1.使用HTTP不断轮询 1.2.长轮询 2.websocket 2.1.概述 2.2.websocket建立过程 2.3.抓包分析 2.4.websocket的消息格式 3.使用场景 4.总结 1.引言平时我们打开网页，比如购物网站某宝。都是点一下列表商品，跳转一下网页就到了商品…...

编程日记 2024/2/14 22:28:56

在面试中如何回复擅长vue还是react

当面试官问及这个问题的时候，我们需要思考面试官是否是在乎你是掌握vue还是react吗？？？ 在大前端的一个环境下，当前又有AI人工智能的加持辅助，我们是不是要去思考企业在进行前端岗位人员需求的时候&#xf…...

编程日记 2024/2/14 22:27:55

使用Vue.js输出一个hello world

导入vue.js <script src"https://cdn.jsdelivr.net/npm/vue2/dist/vue.js"></script> 创建一个标签 <div id"app">{{message}}</div> 接管标签内容，创建vue实例 <script type"text/javascript">va…...

编程日记 2024/2/14 22:25:52

15 ABC基于状态机的按键消抖原理与状态转移图

1. 基于状态机的按键消抖 1.1 什么是按键？ 从按键结构图10-1可知，按键按下时，接点（端子）与导线接通，松开时，由于弹簧的反作用力，接点（端子）与导线断开。从…...

编程日记 2024/2/14 22:24:50

原文链接定义. 对于 m n m \times n mn 的 λ \lambda λ-矩阵 A ( λ ) [ a 11 ( λ ) . . . a 1 n ( λ ) ⋮ ⋮ a m 1 ( λ ) . . . a m n ( λ ) ] \mathbf{A}(\lambda)\begin{bmatrix} a_{11}(\lambda) & ... & a_{1n}(\lambda)\\ \vdots & & \vdo…...

编程日记 2024/2/14 22:23:49

如何在PDF 文件中删除页面？

查看不同的工具以及解释如何在 Windows、Android、macOS 和 iOS 上从 PDF 删除页面的步骤： PDF 是最难处理的文件格式之一。曾经有一段时间，除了阅读之外，无法用 PDF 做任何事情。但是今天，有许多应用程序和工具可以让您用它们做…...

编程日记 2024/2/14 22:18:43

蓝桥杯官网填空题（质数拆分）

问题描述将 2022 拆分成不同的质数的和，请问最多拆分成几个？ 答案提交本题为一道结果填空的题，只需要算出结果后，在代码中使用输出语句将结果输出即可。运行限制 import java.util.Scanner;public class Main {static int …...

编程日记 2024/2/14 22:17:42

【数据结构】二叉树的顺序结构及链式结构

目录 1.树的概念及结构 1.1树的概念 1.2树的相关概念编辑 1.3树的表示 1.4树在实际中的运用（表示文件系统的目录树结构） 2.二叉树概念及结构 2.1二叉树的概念 2.2现实中的二叉树编辑 2.3特殊的二叉树 2.4二叉树的性质 2.5二叉树的存储结…...

编程日记 2024/2/14 22:13:37

海外IP代理：解锁网络边界的实战利器

文章目录引言：正文：一、Roxlabs全球IP代理服务概览特点：覆盖范围：住宅IP真实性：性价比：在网络数据采集中的重要性： 二、实战应用案例一：跨境电商竞品分析步骤介绍：代码示…...

编程日记 2024/2/14 22:12:35

如何写好一个简历

如何编写求职简历论Java程序员求职中简历的重要性好简历的作用在求职过程中，一份好的简历是非常重要的，它甚至可以直接决定能否被面试官认可。一份出色或者说是成功的个人简历，最根本的作用是能让看这份简历的人产生一定要见你的强烈愿…...

编程日记 2024/2/14 22:03:20

【AutoML】AutoKeras 进行 RNN 循环神经网络训练

由于最近这些天都在人工审查之前的哪些问答数据，所以迟迟都没有更新 AutoKeras 的训练结果。现在那部分数据都已经整理好了，20w 的数据最后能够使用的高质量数据只剩下 2k。这 2k 的数据已经经过数据校验并且对部分问题的提问方式和答案内容进行了不改变…...

编程日记 2024/2/14 21:59:15

H12-821_74

74.在某路由器上查看LSP，看到如下结果： A.发送目标地址为3.3.3.3的数据包时，打上标签1026，然后发送。 B.发送目标地址为4.4.4.4的数据包时，不打标签直接发送。 C.当路由器收到标签为1024的数据包，将把标签…...

编程日记 2024/2/14 21:58:14

有趣儿的组件（HTML/CSS）

分享几个炫酷的组件，起飞~~ 评论区留爪，继续分享哦~ 文章目录 1. 按钮2. 输入3. 工具提示4. 单选按钮5. 加载中 1. 按钮 HTML： <button id"btn">Button</button>CSS： button {padding: 10px 20px;text-tr…...

编程日记 2024/2/14 21:52:08

1、深度学习环境配置相关下载地址整理（cuda、cudnn、torch、miniconda、pycharm、torchvision等）

一、深度学习环境配置相关： 1、cuda：https://developer.nvidia.com/cuda-toolkit-archive 2、cudnn：https://developer.nvidia.com/rdp/cudnn-archive 4、miniconda：https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/?C…...

编程日记 2024/2/14 21:49:04

Spring Boot3自定义异常及全局异常捕获

⛰️个人主页: 蒾酒 🔥系列专栏：《spring boot实战》 🌊山高路远，行路漫漫，终有归途。目录前置条件目的主要步骤定义自定义异常类创建全局异常处理器手动抛出自定义异常前置条件已经初始化好一个…...

编程日记 2024/2/14 21:48:03

【python】网络爬虫与信息提取--Beautiful Soup库

Beautiful Soup网站：https://www.crummy.com/software/BeautifulSoup/ 作用：它能够对HTML.xml格式进行解析，并且提取其中的相关信息。它可以对我们提供的任何格式进行相关的爬取，并且可以进行树形解析。使用原理：它能…...

编程日记 2024/2/14 21:47:02

谷歌浏览器，如何将常用打开的网站创建快捷方式到电脑桌面？

打开谷歌浏览器，打开想要创建的快捷方式的网页点击浏览器右上角的三个点： 点击选择【更多工具】选择【创建快捷方式】然后，在浏览器上方会弹出一个框，让命名此创建的快捷方式的名称命名好之后，再点击【创…...

编程日记 2024/2/14 21:46:00

产品经理面试题解析：业务架构是通往成功的关键吗？

大家好，我是小米！今天我要和大家聊的是产品经理面试中的一个热门话题：“业务架构”！相信不少小伙伴在准备面试的时候都会遇到这个问题，究竟什么是业务架构？它又与产品经理的工作有着怎样的关系呢&#xff1…...

编程日记 2024/2/14 21:41:56

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/7 4:36:23

谷歌浏览器插件

项目中有时候会用到插件 sync-cookie-extension1.0.0：开发环境同步测试 cookie 至 localhost，便于本地请求服务携带 cookie 参考地址：https://juejin.cn/post/7139354571712757767 里面有源码下载下来，加在到扩展即可使用FeHelp…...

编程新知 2025/8/16 3:55:30

OpenLayers 可视化之热力图

注：当前使用的是 ol 5.3.0 版本，天地图使用的key请到天地图官网申请，并替换为自己的key 热力图（Heatmap）又叫热点图，是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...

编程新知 2025/12/9 21:15:58

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

美国西海岸的夏天，再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至，这不仅是开发者的盛宴，更是全球数亿苹果用户翘首以盼的科技春晚。今年，苹果依旧为我们带来了全家桶式的系统更新，包括 iOS 26、iPadOS 26…...

编程新知 2026/2/6 10:39:49

el-switch文字内置

el-switch文字内置效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

编程新知 2026/1/26 10:00:16

Robots.txt 文件

什么是robots.txt？ robots.txt 是一个位于网站根目录下的文本文件（如：https://example.com/robots.txt），它用于指导网络爬虫（如搜索引擎的蜘蛛程序）如何抓取该网站的内容。这个文件遵循 Robots…...

编程新知 2025/9/9 5:38:23

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken：OpenAI开发的专业"分词器" torch：Facebook开发的强力计算引擎，相当于超级计算器理解词嵌入：给词语画"…...

编程新知 2025/9/25 5:16:24

BCS 2025｜百度副总裁陈洋：智能体在安全领域的应用实践

6月5日，2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席，并作《智能体在安全领域的应用实践》主题演讲，分享了在智能体在安全领域的突破性实践。他指出，百度通过将安全能力…...

编程新知 2026/2/1 11:33:19

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

JVM暂停（Stop-The-World，STW）的完整原因分类及对应排查方案，结合JVM运行机制和常见故障场景整理而成：一、GC相关暂停 1. 安全点（Safepoint）阻塞现象：JVM暂停但无GC日志，日志显示No GCs detected。原因：JVM等待所有线程进入安全点（如…...

编程新知 2026/2/7 11:25:15

基于matlab策略迭代和值迭代法的动态规划

经典的基于策略迭代和值迭代法的动态规划matlab代码，实现机器人的最优运输 Dynamic-Programming-master/Environment.pdf , 104724 Dynamic-Programming-master/README.md , 506 Dynamic-Programming-master/generalizedPolicyIteration.m , 1970 Dynamic-Programm…...

编程新知 2025/12/7 23:28:25

如何在我们的模型中使用Beam search

1. python中的堆（heapq）

2. Beam search的实现

2.1 Beam search的流程

2.2 构建beam

使用Beam search进行评估

相关文章：

如何在我们的模型中使用Beam search

PKI - 借助Nginx 实现Https 服务端单向认证、服务端客户端双向认证

WebSocket原理详解

在面试中如何回复擅长vue还是react

使用Vue.js输出一个hello world

15 ABC基于状态机的按键消抖原理与状态转移图

λ-矩阵的多项式展开

如何在PDF 文件中删除页面？

蓝桥杯官网填空题（质数拆分）

【数据结构】二叉树的顺序结构及链式结构

海外IP代理：解锁网络边界的实战利器

如何写好一个简历

【AutoML】AutoKeras 进行 RNN 循环神经网络训练

H12-821_74

有趣儿的组件（HTML/CSS）

1、深度学习环境配置相关下载地址整理（cuda、cudnn、torch、miniconda、pycharm、torchvision等）

Spring Boot3自定义异常及全局异常捕获

【python】网络爬虫与信息提取--Beautiful Soup库

谷歌浏览器，如何将常用打开的网站创建快捷方式到电脑桌面？

产品经理面试题解析：业务架构是通往成功的关键吗？

网络六边形受到攻击

谷歌浏览器插件

OpenLayers 可视化之热力图

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

el-switch文字内置

Robots.txt 文件

LLM基础1_语言模型如何处理文本

BCS 2025｜百度副总裁陈洋：智能体在安全领域的应用实践

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

基于matlab策略迭代和值迭代法的动态规划