当前位置: 首页 > news >正文

14-41 剑和诗人15 - RLAIF 大模型语言强化培训

​​​​​​

14-41 剑和诗人15 - RLAIF 大模型语言强化培训

介绍

大型语言模型 (LLM) 在自然语言理解和生成方面表现出了巨大的能力。然而,这些模型仍然存在严重的缺陷,例如输出不可靠、推理能力有限以及缺乏一致的个性或价值观一致性。

为了解决这些限制,研究人员采用了一种名为“人工智能反馈强化学习”(RLAIF)的新技术。在 RLAIF 中,人工智能系统会对其自身行为和输出提供反馈,从而通过强化学习过程完善和提高自身。当应用于 LLM 时,RLAIF 提供了一种有趣的途径来灌输有益的行为,提高模型的安全性和可靠性。

为了介绍这一点,首先,我将讨论这项技术背后的主要动机和期望。接下来,我将深入研究所涉及的技术细节和算法。最后,我将调查 RLAIF 在价值对齐、意图分类和对话一致性等领域的一些最新和最有前景的应用。

到最后,您将深入了解人工智能安全和 LLM 研究前沿的这一关键进步。这里描述的技术前景广阔,但也面临着巨大的挑战和悬而未决的问题。总的来说,RLAIF 代表了一个令人兴奋的新方向,可以克服迄今为止困扰 LLM 的稳健性和可靠性问题。

大模型语言 (LLM) 中 RLAIF 背后的动机

在深入探讨技术细节之前,首先值得探讨一下 RLAIF 为何如此吸引 LLM 研究人员。哪些关键问题推动了其发展,它提供了哪些理想的特性?有几个主要卖点使 RLAIF 成为一条有希望的前进之路:

提高可靠性和稳健性

LLM 的一个长期问题是输出不可靠。细微畸形的输入可能会触发自信但明显不正确或无意义的响应。研究人员推测,GPT-4/LLaMA-2/Gemini 1.5 等模型中参数的规模会导致虚假统计模式的脆弱过度放大。RLAIF 为模型提供了一种系统途径,以确定其输出何时不足并相应地进行改进。通过提供有关故障和不良行为的反馈,RLAIF 可以潜在地增强跨边缘情况的稳健性。

提高透明度和可解释性

随着 LLM 功能越来越强大,用户越来越需要了解系统行为、限制和故障模式。然而,像 GPT-4 这样的系统的内部运作非常复杂,甚至连开发人员都很难解释为什么输出会以这种方式出现。通过形式化反馈渠道,RLAIF 为更透明和可解释的系统奠定了基础。模型可以更好地表达其优势、劣势以及产生响应的总体过程。

为有益行为搭建支架

人工智能伦理学的一个长期愿景是,从头开始可扩展地为模型灌输有益的目标和价值观。RLAIF 代表 LLM 朝着这一目标迈出了一步。反馈和强化过程引导系统远离不良行为,转向符合人类价值观的更具建设性的行为。早期工作探索了价值观一致、真实性和无毒性的技术。随着 RLAIF 的成熟,希望预训练模型能够通过这一自我完善过程从根本上实现稳定性和完整性。

迈向安全递归自我完善之路

在更先进的未来,人工智能系统可能会进行递归式自我改进 (RSI)——快速迭代地增强自身智能。虽然 RSI 有望带来巨大的好处,但不受控制的 RSI 也有可能大规模地产生有害行为。RLAIF 通过将增强植根于外部反馈和首选结果,为自我改进提供了一个“安全”的框架。如果模型能够进行稳健的自我反思并将成长引导到有用性上,那么 RLAIF 系统理论上可以安全地扩展到非凡的能力。

这四个激励人心的愿望强调了为什么 RLAIF 在 LLM 圈子中受到极大欢迎。它准确地攻击了阻碍可靠采用的失败模式,如脆弱性和意外伤害。然而,在实现这一有希望的潜力之前,研究人员必须解决一系列技术挑战,以形式化有效的学习框架。下一节将探讨成功应用 RLAIF 所涉及的这些算法细节。

14-41 剑和诗人15 - RLAIF 大模型语言强化培训

将 RLAIF 应用于 LLMS 的技术基础

强化学习在人工智能领域有着悠久的历史,其根基是马尔可夫决策过程和动态规划等公式。研究人员必须创造性地采用这些技术,以体现 RLAIF 对现代 LLM 的优势。本节将介绍当前支撑 RLAIF 系统的关键技术要素和算法。我将重点介绍直觉,并将严格的数学细节留给外部参考。核心要素包括:

  1. 定义适当的行动和奖励
  2. 用于提供反馈的数据集
  3. 建筑变革引发的自我反思
  4. 优化程序而非偏好
  5. 信用分配的挑战

理解这些部分构成了在 LLM 中成功安装 RLAIF 的算法基础。研究人员以这些元素为基础,瞄准更多应用目标,如真实性和避免伤害。后面的部分将重点介绍一些最有前景的方向。不过,首先,让我们为技术基础建立直觉。

定义适当的行动和奖励

任何强化学习设置都需要明确定义两个关键元素:代理可以采取的一组操作,以及提供对这些操作的反馈的奖励信号。在游戏和机器人等典型应用中,这些定义很简单。例如,下棋的代理会选择动作,并接收胜利和失败作为反馈。

然而,将强化学习应用于 LLM 会使清晰地形式化动作和奖励变得更加棘手。像 GPT-3 这样的模型可以在开放式环境中生成自由格式的文本。研究人员必须将这一巨大的可能性空间提炼为易于优化的编码行为。

早期的方法直接关注文本输出本身,设计奖励来塑造语法、长度、关键词等生成属性。然而,对原始文本输出进行操作会受到感知混叠挑战和优化环境中的稀疏性的影响。更有效的框架利用元学习让模型为自己提供行为反馈。例如,系统不是直接评估文本属性,而是对其输出执行辅助预测或分类任务,判断它们是否实现了预期目标。常见的辅助任务包括毒性检测、事实性预测、一致性检查和真诚性分析。然后,强化信号优化模型,使输出与这些次要空间中声明的目标保持一致。本质上,研究人员将部分偏好学习外包给中间的自我监督步骤。

此外,架构可以提供额外的信号作为有益行为的辅助奖励,例如承认无知并在适当的时候要求澄清。总体而言,创造性的辅助任务设计对于将有效的强化算法移植到 LLM 中仍然至关重要。如果不仔细考虑塑造行为空间,就会出现不稳定、博弈和不良行为。奖励黑客仍然是一个始终存在的挑战,需要主动进行工程设计以进行调整。

用于提供反馈的数据集

在确定了行动和奖励之后,RLAIF 系统还需要大量数据集来提供反馈。在标准强化学习中,与环境的在线交互提供了体验式监督。但对于 LLM,出于效率方面的考虑,需要大规模离线语料库。研究人员利用三个主要来源:

  1. 标记数据集:评估行为的(文本、标签)对的集合,例如有害评论分类器和事实注释。
  2. 自监督任务:比较模型样本的辅助生成目标,例如通过自洽进行诚意预测。
  3. 人类偏好:人类判断比较模型输出,得出一致结论,使系统更受欢迎。

这些来源为强化优化提供了核心数据。前两个来源具有便利性和可扩展性,可以根据所需标准自动对行为进行评分。然而,它们也受到数据集偏差、博弈激励和分布漂移的影响。第三个来源提供了更可靠和更通用的信号,但面临着费用和个人偏好差异的挑战。最先进的框架将这三个来源的数据集融合在一起,获得互补的优势。这有助于消除在单独依赖任何单一来源时出现的不准确性和差距。

建筑变革引发的自我反思

不过,除了数据和奖励之外,有效优化 RLAIF 还带来了架构复杂性。LLM 包含数十亿个参数,因此很难通过标准策略梯度强化直接更新权重。更可行的方法是采用元学习公式,其中较小的控制器通过操纵温度、top-k 截断和 logit 掩码等超参数来学习塑造行为。这些方法提供了更简单、更具体的接口。

此外,在大规模神经网络中,呈现精细的信用分配仍然很棘手。有希望的方向指向双编码器架构,该架构将模型分为行为生成器和批评者。生成器产生动作,而批评者提供辅助判断以指导改进。一些框架甚至利用具有不同组件的三元组结构进行生成、评级和比较。这些自我反思的设置缓解了不稳定性并提高了透明度,类似于同时拥有左脑和右脑系统如何启发人类认知。架构变化通过暴露自我监督渠道,实现了更清晰的强化学习。

优化程序而非偏好

一旦辅助任务将强化信号形式化,RLAIF 系统就会采用算法过程来实现学习,包括:

  • 策略梯度方法:更新影响生成行为的超参数以增加奖励
  • 人类偏好:直接优化以匹配人类判断的分布
  • 对抗性目标:通过对立损失来惩罚不需要的文本属性
  • 约束优化:分层惩罚或约束以强制实施有益行为
  • 合作逆向强化学习:从演示中推断出积极的一致目标

这些优化框架对模型动态进行了有针对性的改变,以达到预期目标。策略梯度技术因其简单性而广受欢迎,而对抗和约束方法则允许更直接的控制。通过偏好学习,比较人类样本仍然是校准的黄金标准。而逆向强化学习有望推断出一般价值外推器。

但总体而言,没有一种单一的程序可以普遍适用。实践者会根据具体用例和行为标准混合使用。下一节将更具体地介绍其中一些应用设置。不过在此之前,还有一个核心挑战值得讨论:大型网络中的信用分配问题。

信用分配的挑战

对于 RLAIF 来说,最难攻克的障碍或许在于如何让信号穿过庞大的神经结构。在 GPT-4/LLaMA-2 等模型中,考虑到跨层和模块的划分,细微的调整往往无法产生有意义的效果。本质上,优化被规模淹没了。所有学习都依赖于精确的信用分配——准确识别需要更新哪些参数才能实现目标。在 LLM 中,在数十亿个权重中隔离因果链被证明是艰巨的任务。

更明确的信用分配主要有两种途径:

  1. 注意机制:注意层关注输入输出相关性,提供一些归因。例如,系数将有毒触发词精确定位为优化目标。
  2. 模块化架构:将模型分解为半独立组件,可以实现更好的隔离和干预。混合搭配替换,然后扩展更改。

通过量化显著性,注意力被证明是有希望的,即使仍然是一个模糊的镜头。模块化设计最终可能会实现更强大的形式化,类似于大脑如何跨区域定位功能。但总体而言,信用分配仍然是一个核心技术障碍。所有其他算法都依赖于准确地将行为归因于模型片段,这在拜占庭神经连接中很困难。

了解了这些核心概念后,我们现在可以探索更多具体的应用,让 RLAIF 发挥影响力。接下来的部分将重点介绍三个针对价值一致性的关键有前景的方向。

综上所述,我们介绍了大模型语言课程中人工智能反馈强化学习背后的基本动机和技术基础。关键点包括:

  1. RLAIF 在可靠性、可解释性、价值一致和安全的自我完善等方面做出了诱人的承诺,而这些承诺在其他方面都不太稳定。
  2. 应用 RLAIF 需要制定适当的模型行动和强化奖励、收集反馈数据集、设计透明的批评者并开发优化方案。
  3. 尽管采用注意力机制和模块化结构的新兴方法有所帮助,但在大规模神经网络中实现明确的信用分配仍然是一个障碍。

在建立了这些算法基础之后,本文的第 2 部分将重点介绍将 RLAIF 带入有益的 LLM 的实际影响的具体用例。我们将重点关注价值一致性、真实性和一致性方面的进展作为驱动示例。

RLAIF 在 LLM 中的现代应用

到目前为止,我们介绍了大模型语言 (LLM) 中实现人工智能反馈强化学习 (RLAIF) 的基本动机和技术要素。在建立这些基础之后,我们现在探索展示具体进展的当代应用。

研究人员积极地在可靠性、可解释性和价值一致性等众多目标上测试 RLAIF。在本节中,我重点介绍了三个特别有前景的方向:

  1. 价值取向学习
  2. 真实性和事实一致性
  3. 会话连贯性

这些领域展示了之前讨论的算法与有效功能的集成。尽管范围不完整且狭窄,但它们为有益的 LLM 实现更广泛的愿望提供了宝贵的途径。让我们深入分析每个领域。

价值取向学习

RLAIF 最雄心勃勃的愿景或许在于价值观协调——塑造模型目标和偏好,使其与人类道德和乐于助人的精神可靠地保持一致。直接优化道德的尝试因复杂的规范问题和博弈动态而失败。RLAIF 提供了一种通过迭代反馈来规避这些问题的方法。

该领域的关键技术包括:

  • 偏好学习:将系统暴露给成对的人类判断,比较模型响应。反馈引导生成更受青睐的样本。
  • 合作逆向强化学习:调整奖励模型以匹配人类示例。这旨在推断助手,而不仅仅是直接模仿。
  • 宪法优化:在基础系统之上分层设定总体目标,通过诚实、能力和仁慈等原则进行定义。

这些方法共同灌输了亲社会行为的发展轨迹。实验表明,诚实、非暴力和非毒性等概念可以通过 RLAIF 机制衡量。希望在于将这些受约束的目标引导到诚信的一般外推器中。

虽然规模和规范挑战仍然存在,但价值协调构成了最雄心勃勃的 RLAIF 应用。围绕人类偏好构建更具表现力的宪法规范提出了一个活跃的研究问题。即使是像真诚和不伤害这样的狭隘例子也被证明是有价值的,而且是可以实现的。

真实性和事实一致性

除了抽象值之外,RLAIF 还可以优化真实性和事实准确性。不可靠的幻觉反映了不受控制的 LLM 的一大缺陷。与人类的社会学习相比,训练制度不足以保证一致性。

这里值得注意的 RLAIF 架构包括:

  • 对抗性真实性规则:惩罚来自外部检测器的事实不准确信号以促进诚实。
  • 真实性作为环境约束:塑造奖励以捕捉欺骗和真诚的倾向。
  • 自我反思信念追踪:对过去的主张保持不断发展的信心估计,促进确认或自我纠正。

这些模型既能反映事实性,也能反映说真话的倾向。到目前为止,收益仍然局限于狭隘的话题和对话背景。一旦超出分布范围,复合趋势就会趋向于不诚实或不准确,从而困扰后续互动。

然而,内在完整性的可衡量改进是有希望的。有了足够的数据广度和反馈信号的有效集中,RLAIF 为准确、诚实的人工智能助手带来了希望。围绕信心和证据来源加强可信度指标将是关键。用于表征可靠性和欺骗性的元学习也提供了自我监督信号。

总体而言,灌输诚实性可以弥补现有 LLM 版本的一个严重缺陷。RLAIF 提供了缓解无休止幻觉的工具,这对于问责至关重要。但围绕更广泛能力的复杂性经济学带来了持续的挑战。

会话连贯性

最后一个主要应用领域是会话连贯性和一致性。非结构化对话带来了独特的障碍,任性的语境漂移让人难以理解和沮丧。RLAIF 再次通过反馈渠道提供了潜在的监督。

这里采用的关键方法:

  • 对话评估电路:批评编码器-解码器结构,对各个回合中的对话流程进行评分。
  • 连贯性作为环境约束:塑造奖励以捕捉完整性、清晰度和凝聚力的语言属性。
  • 意图分类作为辅助任务:基于主题建模和命名实体链预测语义连续性。

本质上,这些方法通过优化反馈回路来保持对话的正常进行。基于连贯性的奖励可以实现稳定的参与。从架构上分离评论者可以提供评分函数的透明度、可解释性和迁移学习。

事实证明,在交流过程中保持一致的个性和怪癖也是可能的。与表达的个人资料信号保持一致会过滤符合定义特征的行为。个人资料参数会引发进一步的优化维度。

此处的研究仍处于探索阶段,但通过 RLAIF 指导,明确定义的对话流程似乎是可行的。这有效地缩小了上下文范围,同时还允许可定制的体验。应用集成为功能性带来了下一个里程碑。

走向 RLAIF 及其对 AI 未来的意义

RLAIF 所取得的进展代表着朝着开发符合人类价值观并能安全自我改进的 AI 系统迈出了重要一步。随着 RLAIF 技术的成熟,它们有朝一日可能会催生出普遍有用且可靠的 AI 助手。这样的系统将通过提供广泛可访问的知识、自动化和建议,同时尊重人类的偏好,对社会产生深远影响。这里重点介绍的研究方向正在为实现这一未来愿景奠定算法基础。还有很多工作要做,但 RLAIF 是一条非常有希望的前进道路。这些努力的成果可以使 AI 更加有益,同时解决紧迫的大规模安全挑战和意外危害。因此,理解和推进 RLAIF 对于机器学习和人类价值观交汇处未来更光明的可能性至关重要。

14-41 剑和诗人15 - RLAIF 大模型语言强化培训

相关文章:

14-41 剑和诗人15 - RLAIF 大模型语言强化培训

​​​​​​ 介绍 大型语言模型 (LLM) 在自然语言理解和生成方面表现出了巨大的能力。然而,这些模型仍然存在严重的缺陷,例如输出不可靠、推理能力有限以及缺乏一致的个性或价值观一致性。 为了解决这些限制,研究人员采用了一种名为“人工…...

每日一题~oj(贪心)

对于位置 i来说,如果 不选她,那她的贡献是 vali-1 *2,如果选他 ,那么她的贡献是 ai. 每一个数的贡献 是基于前一个数的贡献 来计算的。只要保证这个数的前一个数的贡献是最优的,那么以此类推下去,整体的val…...

成人高考报名条件及收费标准详解

成人高考报名条件及收费标准详解 您想通过成人高考改变自己的命运,但不知道报名条件和收费标准?本文将为您详细介绍成人高考报名条件和收费标准,并为您提供专业的成人教育服务。 深圳成人高考www.shenzhixun.com 成人高考报名条件 成人高考…...

openmetadata1.3.1 自定义连接器 开发教程

openmetadata自定义连接器开发教程 一、开发通用自定义连接器教程 官网教程链接: 1.https://docs.open-metadata.org/v1.3.x/connectors/custom-connectors 2.https://github.com/open-metadata/openmetadata-demo/tree/main/custom-connector (一&…...

PostgreSQL 如何优化存储过程的执行效率?

文章目录 一、查询优化1. 正确使用索引2. 避免不必要的全表扫描3. 使用合适的连接方式4. 优化子查询 二、参数传递1. 避免传递大对象2. 参数类型匹配 三、减少数据量处理1. 限制返回结果集2. 提前筛选数据 四、优化逻辑结构1. 分解复杂的存储过程2. 避免过度使用游标 五、事务处…...

普中51单片机:数码管显示原理与实现详解(四)

文章目录 引言数码管的结构数码管的工作原理静态数码管电路图开发板IO连接图代码演示 动态数码管实现步骤数码管驱动方式电路图开发板IO连接图真值表代码演示1代码演示2代码演示3 引言 数码管(Seven-Segment Display)是一种常见的显示设备,广…...

web缓存代理服务器

一、web缓存代理 web代理的工作机制 代理服务器是一个位于客户端和原始(资源)服务器之间的服务器,为了从原始服务器取得内容,客户端向代理服务器发送一个请求,并指定目标原始服务器,然后代理服务器向原始…...

容器:queue(队列)

以下是关于queue容器的总结 1、构造函数&#xff1a;queue [queueName] 2、添加、删除元素: push() 、pop() 3、获取队头/队尾元素&#xff1a;front()、back() 4、获取栈的大小&#xff1a;size() 5、判断栈是否为空&#xff1a;empty() #include <iostream> #include …...

探索 WebKit 的后台同步新纪元:Web Periodic Background Synchronization 深度解析

探索 WebKit 的后台同步新纪元&#xff1a;Web Periodic Background Synchronization 深度解析 随着 Web 应用逐渐成为我们日常生活中不可或缺的一部分&#xff0c;用户对应用的响应速度和可靠性有了更高的期待。Web Periodic Background Synchronization API&#xff08;周期…...

ctfshow web入门 web338--web344

web338 原型链污染 comman.js module.exports {copy:copy };function copy(object1, object2){for (let key in object2) {if (key in object2 && key in object1) {copy(object1[key], object2[key])} else {object1[key] object2[key]}}}login.js var express …...

mupdf加载PDF显示中文乱码

现象 加载PDF显示乱码,提示非嵌入字体 non-embedded font using identity encoding调式 在pdf-font.c中加载字体 调试源码发现pdf文档的字体名字居然是GBK&#xff0c;估计又是哪个windows下写的pdf生成工具生成pdf 字体方法&#xff1a; static pdf_font_desc * load_cid…...

常用的限流工具Guava RateLimiter 或Redisson RRateLimiter

在分布式系统和高并发场景中&#xff0c;限流是一个非常常见且重要的需求。以下是一些常用的限流工具和库&#xff0c;包括它们的特点和使用场景&#xff1a; 1. Guava RateLimiter Google 的 Guava 库中的 RateLimiter 是一个简单且高效的限流工具&#xff0c;适用于单节点应…...

卷积神经网络(CNN)和循环神经网络(RNN) 的区别与联系

卷积神经网络&#xff08;CNN&#xff09;和循环神经网络&#xff08;RNN&#xff09;是两种广泛应用于深度学习的神经网络架构&#xff0c;它们在设计理念和应用领域上有显著区别&#xff0c;但也存在一些联系。 ### 卷积神经网络&#xff08;CNN&#xff09; #### 主要特点…...

Unity【入门】场景切换和游戏退出及准备

1、必备知识点场景切换和游戏退出 文章目录 1、必备知识点场景切换和游戏退出1、场景切换2、鼠标隐藏锁定相关3、随机数和自带委托4、模型资源的导入1、模型由什么构成2、Unity支持的模型格式3、如何指导美术同学导出模型4、学习阶段在哪里获取模型资源 2、小项目准备工作需求分…...

Python 函数递归

以下是一个使用递归计算阶乘的 Python 函数示例 &#xff1a; 应用场景&#xff1a; 1. 动态规划问题&#xff1a;在一些需要逐步求解子问题并利用其结果的动态规划场景中&#xff0c;递归可以帮助直观地表达问题的分解和求解过程。 2. 遍历具有递归结构的数据&#xff1a;如递…...

MyBatis(27)如何配置 MyBatis 实现打印可执行的 SQL 语句

在开发过程中&#xff0c;打印可执行的SQL语句对于调试和性能优化是非常有帮助的。MyBatis提供了几种方式来实现SQL语句的打印。 1. 使用日志框架 MyBatis可以通过配置其内部使用的日志框架&#xff08;如Log4j、Logback等&#xff09;来打印SQL语句。这是最常用的方法。 Lo…...

3.js - 裁剪平面(clipIntersection:交集、并集)

看图 代码 // ts-nocheck// 引入three.js import * as THREE from three// 导入轨道控制器 import { OrbitControls } from three/examples/jsm/controls/OrbitControls// 导入lil.gui import { GUI } from three/examples/jsm/libs/lil-gui.module.min.js// 导入tween import …...

在5G/6G应用中实现高性能放大器的建模挑战

来源&#xff1a;Modelling Challenges for Enabling High Performance Amplifiers in 5G/6G Applications {第28届“集成电路和系统的混合设计”(Mixed Design of Integrated Circuits and Systems)国际会议论文集&#xff0c;2021年6月24日至26日&#xff0c;波兰洛迪} 本文讨…...

Perl 数据类型

Perl 数据类型 Perl 是一种功能丰富的编程语言&#xff0c;广泛应用于系统管理、网络编程、GUI 开发等领域。在 Perl 中&#xff0c;数据类型是编程的基础&#xff0c;决定了变量存储信息的方式以及可以对这些信息执行的操作。本文将详细介绍 Perl 中的主要数据类型&#xff0…...

网络协议 -- IP、ICMP、TCP、UDP字段解析

网络协议报文解析及工具使用介绍 1. 以太网帧格式及各字段作用 -------------------------------- | Destination MAC Address (48 bits) | -------------------------------- | Source MAC Address (48 bits) …...

【工具】豆瓣自动回贴软件

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 相比于之前粗糙丑陋的黑命令框版本&#xff0c;这个版本新增了UI界面&#xff0c;从此可以不需要再挨个去翻配置文件了。 另外&#xff0c;升级了隐藏浏…...

初学Spring之动态代理模式

动态代理和静态代理角色一样 动态代理的代理类是动态生成的 动态代理分为两大类&#xff1a; 基于接口的动态代理&#xff08;JDK 动态代理&#xff09;、基于类的动态代理&#xff08;cglib&#xff09; 也可以用 Java 字节码实现&#xff08;Javassist&#xff09; Prox…...

Visual studio 2023下使用 installer projects 打包C#程序并创建 CustomAction 类

Visual studio 2023下使用 installer projects 打包C#程序并创建 CustomAction 类 1 安装Visual studio 20203,并安装插件1.1 下载并安装 Visual Studio1.2 步骤二:安装 installer projects 扩展插件2 创建安装项目2.1 创建Windows安装项目2.2 新建应用程序安装文件夹2.3 添加…...

vue学习笔记(购物车小案例)

用一个简单的购物车demo来回顾一下其中需要注意的细节。 先看一下最终效果 功能&#xff1a; &#xff08;1&#xff09;全选按钮和下面的商品项的选中状态同步&#xff0c;当下面的商品全部选中时&#xff0c;全选勾选&#xff0c;反之&#xff0c;则不勾选。 &#xff08…...

昇思25天学习打卡营第19天 | RNN实现情感分类

RNN实现情感分类 概述 情感分类是自然语言处理中的经典任务&#xff0c;是典型的分类问题。本节使用MindSpore实现一个基于RNN网络的情感分类模型&#xff0c;实现如下的效果&#xff1a; 输入: This film is terrible 正确标签: Negative 预测标签: Negative输入: This fil…...

【VUE基础】VUE3第三节—核心语法之ref标签、props

ref标签 作用&#xff1a;用于注册模板引用。 用在普通DOM标签上&#xff0c;获取的是DOM节点。 用在组件标签上&#xff0c;获取的是组件实例对象。 用在普通DOM标签上&#xff1a; <template><div class"person"><h1 ref"title1">…...

生物化学笔记:电阻抗基础+电化学阻抗谱EIS+电化学系统频率响应分析

视频教程地址 引言 方法介绍 稳定&#xff1a;撤去扰动会到原始状态&#xff0c;反之不稳定&#xff0c;还有近似稳定的 阻抗谱图形&#xff08;Nyquist和Bode图&#xff09; 阻抗谱图形是用于分析电化学系统和材料的工具&#xff0c;主要有两种类型&#xff1a;Nyquist图和B…...

SQL使用join查询方式找出没有分类的电影id以及名称

系列文章目录 文章目录 系列文章目录前言 前言 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站&#xff0c;这篇文章男女通用&#xff0c;看懂了就去分享给你的码吧。 描述 现有电影信息…...

对MsgPack与JSON进行序列化的效率比较

序列化是将对象转换为字节流的过程&#xff0c;以便在内存或磁盘上存储。常见的序列化方法包括MsgPack和JSON。以下将详细探讨MsgPack和JSON在序列化效率方面的差异。 1. MsgPack的效率&#xff1a; 优点&#xff1a; 高压缩率&#xff1a; MsgPack采用高效的二进制编码格式&…...

Unix\Linux 执行shell报错:“$‘\r‘: 未找到命令” 解决

linux执行脚本sh xxx.sh报错&#xff1a;$xxx\r: 未找到命令 原因&#xff1a;shell脚本在Windows编写导致的换行问题&#xff1a; Windows 的换行符号为 CRLF&#xff08;\r\n&#xff09;&#xff0c;而 Unix\Linux 为 LF&#xff08;\n&#xff09;。 缩写全称ASCII转义说…...

动态路由--RIP配置(思科cisco)

一、简介 RIP协议&#xff08;Routing Information Protocol&#xff0c;路由信息协议&#xff09;是一种基于距离矢量的动态路由选择协议。 在RIP协议中&#xff0c;如果路由器A和网络B直接相连&#xff0c;那么路由器A到网络B的距离被定义为1跳。若从路由器A出发到达网络B需要…...

python - 函数 / 字典 / 集合

一.函数 形参和实参&#xff1a; >>> def MyFirstFunction(name): 函数定义过程中的name是叫形参 ... print(传递进来的 name 叫做实参&#xff0c;因为Ta是具体的参数值&#xff01;) print前面要加缩进tab&#xff0c;否则会出错。 >>> MyFirstFun…...

connect to github中personal access token生成token方法

一、问题 执行git push时弹出以下提示框 二、解决方法 去github官网生成Token&#xff0c;步骤如下 选择要授予此 令牌token 的 范围 或 权限 要使用 token 从命令行访问仓库&#xff0c;请选择 repo 。 要使用 token 从命令行删除仓库&#xff0c;请选择 delete_repo 其他根…...

Appium启动APP时报错Security exception: Permission Denial

报错内容Security exception: Permission Denial: starting Intent 直接通过am命令尝试也是同样的报错 查阅资料了解到&#xff1a;android:exported | App quality | Android Developers exported属性默认false&#xff0c;所以android:exported"false"修改为t…...

ubuntu22 使用ufw防火墙

专栏总目录 一、安装 sudo apt update sudo apt install ufw 二、启动防火墙 &#xff08;一&#xff09;启动命令 sudo ufw enable &#xff08;二&#xff09;重启命令 sudo ufw reload 三、配置规则 #允许SSH连接 sudo ufw allow ssh #如果sshd服务端口指定到了8888&a…...

初识STM32:开发方式及环境

STM32的编程模型 假如使用C语言的方式写了一段程序&#xff0c;这段程序首先会被烧录到芯片当中&#xff08;Flash存储器中&#xff09;&#xff0c;Flash存储器中的程序会逐条的进入CPU里面去执行。 CPU相当于人的一个大脑&#xff0c;虽然能执行运算和执行指令&#xff0c;…...

详解Amivest 流动性比率

详解Amivest 流动性比率 Claude-3.5-Sonnet Poe Amivest流动性比率是一个衡量证券市场流动性的重要指标。这个比率主要用于评估在不对价格造成重大影响的情况下,市场能够吸收多少交易量。以下是对Amivest流动性比率的详细解释: 定义: Amivest流动性比率是交易额与绝对收益率的…...

pycharm小游戏制作

以下是一个使用 Python 和 PyGame库在 PyCharm中创建一个简单的小游戏&#xff08;贪吃蛇游戏&#xff09;的示例代码&#xff0c;希望对您有所帮助&#xff1a; import pygame import random# 基础设置 # 屏幕高度 SCREEN_HEIGHT 480 # 屏幕宽度 SCREEN_WIDTH 600 # 小方格…...

昇思11天

基于 MindSpore 实现 BERT 对话情绪识别 BERT模型概述 BERT&#xff08;Bidirectional Encoder Representations from Transformers&#xff09;是由Google于2018年开发并发布的一种新型语言模型。BERT在许多自然语言处理&#xff08;NLP&#xff09;任务中发挥着重要作用&am…...

AI绘画Stable Diffusion【图生图教程】:图片高清修复的三种方案详解,你一定能用上!(附资料)

大家好&#xff0c;我是画画的小强 今天给大家分享一下用AI绘画Stable Diffusion 进行 高清修复&#xff08;Hi-Res Fix&#xff09;&#xff0c;这是用于提升图像分辨率和细节的技术。在生成图像时&#xff0c;初始的低分辨率图像会通过放大算法和细节增强技术被转换为高分辨…...

适用于Mac和Windows的最佳iPhone恢复软件

本文将指导您选择一款出色的iPhone数据恢复软件来检索您的宝贵数据。 市场上有许多所谓的iPhone恢复程序。各种程序很难选择并选择其中之一。一旦您做出了错误的选择&#xff0c;您的数据就会有风险。 最好的iPhone数据恢复软件应包含以下功能。 1.安全可靠。 2.恢复成功率高…...

64.ThreadLocal造成的内存泄漏

内存泄漏 程序中已动态分配的堆内存,由于某种原因程序为释放和无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果。内存泄漏的堆积终将导致内存溢出。 内存溢出 没有足够的内存提供申请者使用。 ThreadLocal出现内存泄漏的真实原因 内存泄漏的发…...

深入刨析Redis存储技术设计艺术(二)

三、Redis主存储 3.1、存储相关结构体 redisServer:服务器 server.h struct redisServer { /* General */ pid_t pid; /* Main process pid. */ pthread_t main_thread_id; /* Main thread id */ char *configfile; /* Absolut…...

python读取写入txt文本文件

读取 txt 文件 def read_txt_file(file_path):"""读取文本文件的内容:param file_path: 文本文件的路径:return: 文件内容"""try:with open(file_path, r, encodingutf-8) as file:content file.read()return contentexcept FileNotFoundError…...

日期选取限制日期范围antdesign vue

限制选取的日期范围 效果图 <a-date-pickerv-model"dateTime"format"YYYY-MM-DD":disabled-date"disabledDate"valueFormat"YYYY-MM-DD"placeholder"请选择日期"allowClear />methods:{//回放日期选取范围限制&…...

【大模型】衡量巨兽:解读评估LLM性能的关键技术指标

衡量巨兽&#xff1a;解读评估LLM性能的关键技术指标 引言一、困惑度&#xff1a;语言模型的试金石1.1 定义与原理1.2 计算公式1.3 应用与意义 二、BLEU 分数&#xff1a;翻译质量的标尺2.1 定义与原理2.2 计算方法2.3 应用与意义 三、其他评估指标&#xff1a;综合考量下的多元…...

《优化接口设计的思路》系列:第2篇—小程序性能优化

优化Uniapp应用程序的性能可以从以下几个方面进行优化&#xff1a; 1.减少页面加载时间&#xff1a;避免页面过多和过大的组件&#xff0c;减少不必要的资源加载。可以使用懒加载的方式&#xff0c;根据用户的实际需求来加载页面和组件。 2.节流和防抖&#xff1a;对于频繁触发…...

prototype 和 __proto__的区别

prototype 和 __proto__ 在 JavaScript 中都与对象的原型链有关&#xff0c;但它们各自有不同的用途和含义。 prototype prototype 是函数对象的一个属性&#xff0c;它指向一个对象&#xff0c;这个对象包含了可以由特定类型的所有实例共享的属性和方法。当我们创建一个新的…...

网络中未授权访问漏洞(Rsync,PhpInfo)

Rsync未授权访问漏洞 Rsync未授权访问漏洞是指Rsync服务配置不当或存在漏洞&#xff0c;导致攻击者可以未经授权访问和操作Rsync服务。Rsync是一个用于文件同步和传输的开源工具&#xff0c;通常在Unix/Linux系统上使用。当Rsync服务未经正确配置时&#xff0c;攻击者可以利用…...

DataWhaleAI分子预测夏令营 学习笔记

AI分子预测夏令营学习笔记 一、直播概览 主持人介绍 姓名&#xff1a;徐翼萌角色&#xff1a;DataWhale助教活动目的&#xff1a;分享机器学习赛事经验&#xff0c;提升参赛者在分子预测领域的能力 嘉宾介绍 姓名&#xff1a;余老师背景&#xff1a;Data成员&#xff0c;腾…...