当前位置：首页 > news >正文

KG+LLM(一)KnowGPT: Black-Box Knowledge Injection for Large Language Models

news 文章来源：https://blog.csdn.net/wavehaha/article/details/135305725 2025/5/12 11:36:36

在这里插入图片描述
论文链接：2023.12-https://arxiv.org/pdf/2312.06185.pdf

1.Background & Motivation

目前生成式的语言模型，如ChatGPT等在通用领域获得了巨大的成功，但在专业领域，由于缺乏相关事实性知识，LLM往往会产生不准确的回复（即幻觉）。许多研究人员企图通过外部知识注入提高LLM在专业领域的表现，但许多最先进的llm都不是开源的，这使得仅向模型api注入知识具有挑战性。

研究发现KGs中存储的大量事实知识有可能显著提高LLM反应的准确性，所以解决上述问题的一个可行方法是将知识图（KGs）集成到LLM中。在此基础上本文提出了一个向LLM的进行黑盒知识注入框架KnowGPT。KnowGPT包括两部分：①利用深度强化学习（RL）从知识图（KGs）中提取相关知识；②并使用多臂赌博机（MAB）为每个问题选择最合适的路径抽取策略和提示。
在这里插入图片描述
现有的KG+LMs的方法有很多：
KG+LMs部分方法
但许多最先进的LLM只能通过黑盒调用，即只能通过提交文本输入来检索模型响应，而无法访问模型细节。因而无法使用上述的白盒知识注入技术。（尽管白盒方法可以应用于开源LLMs，如BLOOM和LLaMA，但由于更新模型权重，往往会产生显著的计算成本。）因此，本文关注：能否开发一个黑盒知识注入框架，能够有效地将KG集成到仅使用API的LLM中？

在解决该问题时需要关注两个挑战：①如何检索KG；②如何编码、利用检索到的信息。

2.问题定义

给定一个问题上下文 $Q=\{Q_s,Q_t\}$ （ $Q_s=\{e_1,...,e_m\}$ 为问题实体集合， $Q_t=\{e_1,...,e_n\}$ 为答案实体集合），一个LLM $f$ ，和一个知识图谱 $G$ , $G$ 包含三元组（头实体，关系，尾实体），表示为 $(h, r, t)$ ，目标是学习一个提示函数 $f_{prompt}(Q,G)$ ，生成一个提示 $x$ ，将 $Q$ 的上下文和 $G$ 中的事实知识结合起来，使得LLM的预测能够输出 $Q$ 的正确答案。

3.KnowGPT Framework

KnowGPT Framework
KnowGPT根据问题背景和答案选项，从现实世界的知识图谱中检索出一个问题特定的子图。首先，路径提取模块寻找最具信息量和简洁推理背景来适应上下文。然后，优化提示转换模块，考虑给定问题的知识和格式的最佳组合。

3.1 如何检索KG：强化学习(Reinforcement Learning, RL)

利用奖励函数激励RL提取KG子图中有关问题中提到的源实中到潜在答案中的目标实体的路径 $P=\{P_1,...,P_m\}$ 。且 $P_i=\{(e_1,r_1,t_1),(t_1,r_2,t_2),...,(t_{|P_i|-1},r_{|P_i|},t_{|P_i|})\}$ 。RL使用策略梯度。其马尔可夫过程定义如下：

状态： 表示知识图谱中当前的位置，表示从实体ℎ到t的空间变化。状态向量 $s$ 定义为 $s_t=(e_t,e_target−e_t)$ 。为了获得从背景知识图谱中提取的实体的初始节点嵌入，将知识图谱中的三元组转换为句子，并将其输入预训练语言模型中以获取节点嵌入。
动作： 包含当前实体的所有邻近实体。通过采取行动，模型将从当前实体移动到选择的邻近实体。
动作转移概率P： 转移模型的形式为 $P (s ’∣ s, a) = 1$ ，如果通过动作 $a$ 将 $s$ 到达 $s ’$ ；否则 $P (s ’∣ s, a) = 0$ 。
奖励函数包括： 提取路径的可达性、上下文相关性和简洁性。
- 路径的可达性： 如果在K个行动内达到目标，将获得奖励+1。否则，将获得奖励−1。
- 上下文相关性： 路径与上下文越相关，越应该被奖励
- 简洁性： 基于黑盒LLMs对输入长度的限制和调用成本考虑，引导的提示需在最短的路径长度内找到尽可能多有价值的信息。
最终奖励函数：

3.2 如何利用检索到的KG： Prompt Construction with Multi-armed Bandit

MAB： 多臂赌博机MAB有许多“臂”，每次选择一个“臂”进行尝试，都会得到一个结果或奖励。一方面，希望“利用”那些之前表现良好的“臂”，可以在短时间内获得最大的奖励。另一方面，也想“探索”那些之前没有尝试过的“臂”，可能发现更好的策略或选择，从而在未来获得更大的奖励。

基于该原理，提示构建就是要想办法选择最有前途的提示。（多种方法组合，有点类似集成学习，但不一样）

假设有几种路径提取策略 $P_1,...,P_m$ 和几种候选提示格式 $F_1,...,F_n$ 。每个路径提取策略 $P_i$ 是一种在给定问题环境下选择子图的方法，每个提示模板 $F_j$ 代表一种将子图中的三元组转化为LLM预测的提示机制。

提示构建问题是要确定给定问题的最佳 $P$ 和 $F$ 的组合。本文将选择的整体过程定义为一个奖励最大化问题 $max\sum{r_{PF}}$ ，其计算如下：
在这里插入图片描述
为了捕捉问题与不同知识和提示格式组合间的上下文感知相关性，文章使用期望函数 $E (\cdot)$ 来确定多臂赌博机的选择机制。它能自适应地衡量不同问题对某个组合的潜在期望。

$J$ 表示最小二乘训练LOSS， $β^(i)$ 通过最大置信上界(UCB)计算。通过最大化期望函数 $E (\cdot)$ ，LLM学会了平衡开发和探索，以优先选择最有前途的提示来回答特定的问题背景。

4. Implementation

路径抽取策略（两种）：
- $P_{RL}$ ：基于强化学习的路径提取策略。
- $P_{sub}$ ：由于强化学习不够稳健，引入 $P_{sub}$ 作为MAB选择的备选策略。这是一种启发式的子图提取策略，在源实体和目标实体周围提取2跳子图。
Prompt（三种）:
- 三元组 $F_t$ ：例如(Sergey_Brin, founder_of,Google)。
- 句子描述 $F_s$ ：将知识转化为口语化句子。
- 图表描述 $F_g$ ：将知识视为结构化图表来激活LLM。通过使用黑盒LLM预处理提取的知识，突出中心实体生成描述。
  MAB通过来自语言模型的反馈进行训练，以优先选择在不同实际问题背景下最合适的两种提取方法和三种预定义提示格式的组合。

5. Experiments

5.1 实验设置

关注问题：
RQ1: How does KnowGPT perform when compared with the state-of-the-art LLMs and KG_x0002_enhanced QA baselines?
RQ2: Does the proposed MAB-based prompt construction strategy contribute to the performance?
RQ3: Can KnowGPT solve complex reasoning tasks, and is KG helpful in this reasoning process?

数据集: 选用CommonsenseQA（多项选择题问答数据集），OpenBookQA（多项选择题），MedQA-USMLE（医学多项选择题）。

Base： ChatGPT

5.2 对比实验

整体表现：

与其他KG+LMs方法对比
在这里插入图片描述

5.3 消融实验

在这里插入图片描述

5.4 case study-多提示融合的有效性

在这里插入图片描述

可参考：https://mp.weixin.qq.com/s/k7tzvAXlCPQLHy1l8Wtx1Q

KG+LLM(一)KnowGPT: Black-Box Knowledge Injection for Large Language Models

论文链接：2023.12-https://arxiv.org/pdf/2312.06185.pdf 1.Background & Motivation 目前生成式的语言模型，如ChatGPT等在通用领域获得了巨大的成功，但在专业领域，由于缺乏相关事实性知识，LLM往往会产生不准确的…...

编程日记 2024/1/3 17:19:56

使用anaconda创建爬虫spyder工程

1.由于每个工程使用的环境都可能不一样，因此一个好的习惯就是不同的工程都创建属于自己的环境，在anaconda中默认的环境是base，我们现在来创建一个名为spyder的环境，专门用于爬虫工程： //括号中名字，代表当…...

编程日记 2024/1/3 17:18:55

网络通信(7)-TCP协议解析

目录一、定义二、主要特点三、报文格式四、工作方式...

编程日记 2024/1/3 17:16:54

win32 WM_MENUSELECT消息学习

之前写了一些win32的程序，处理菜单单击都是处理WM_COMMAND消息，通过 LOWORD(wParam) 获取菜单ID，判断单击的是哪个菜单项； 还有一些其他菜单消息； 当在菜单项中移动光标或鼠标，程序会收到许多WM_MENUSELEC…...

编程日记 2024/1/3 17:14:52

Java学习苦旅（十六）——List

本篇博客将详细讲解Java中的List。文章目录预备知识——初识泛型泛型的引入泛型小结预备知识——包装类基本数据类型和包装类直接对应关系装包与拆包 ArrayList简介ArrayList使用ArrayList的构造ArrayList常见操作ArrayList遍历结尾预备知识——初识泛型泛型的引入我…...

编程日记 2024/1/3 17:13:51

python爬虫实现获取招聘信息

使用的python版本： 3.12.1 selenium版本：4.8.0 urllib版本：1.26.18 from selenium import webdriver from selenium.webdriver import ActionChains import timeimport re import xlwt import urllib.parsedef get_html(url):chrome_drive…...

编程日记 2024/1/3 17:12:50

模块电源（七）：LDO 应用

1、Typical application circuit LDO 典型应用电路如下图所示： 2、High Output Current Positive Voltage Regulator 通过 PNP 型三极管 Tr1 ，可以提高 LDO 的输出电流能力，电路如下图所示： 设流过 R1 的电流为 ，当 …...

编程日记 2024/1/3 17:10:47

Redis命令---Hash（哈希)篇（超全）

目录 1.Redis Hmset 命令 - 同时将多个 field-value (域-值)对设置到哈希表 key 中。简介语法可用版本: > 2.0.0返回值: 如果命令执行成功，返回 OK 。示例 2.Redis Hmget 命令 - 获取所有给定字段的值简介语法可用版本: > 2.0.0返回值: 一个包含多个给定字段…...

编程日记 2024/1/3 17:09:46

Objects are not valid as a React child (found: object with keys {name}).

在jsx中可以嵌套表达式，将表达式作为内容的一部分，但是要注意，普通对象不能作为子元素；但是数组，react元素对象是可以的如下：不能将stu这个对象作为子元素放 function App() {const myCal imgStyleconst…...

编程日记 2024/1/3 17:08:45

nodejs业务分层如何写后端接口

这里展示的是在node express 项目中的操作 ，数据库使用的是MongoDB，前期关于express和MongoDB的文章可访问： Nodejs后端express框架 server后端接口操作：通过路由匹配——>调用对应的 Controller——>进行 Service调用——&…...

编程日记 2024/1/3 17:07:44

Windows 7 虚拟机的安装以及解决安装VMVMware tools问题

1.Windows 7 虚拟机的安装以及解决安装VMVMware tools问题参考：Windows 7 虚拟机的安装以及解决安装VMVMware tools问题注意：下载官方补丁：Microsoft Update Catalog在智慧联想浏览器中打不开，要在火狐中才能打开下载。 2.win7如…...

编程日记 2024/1/3 17:06:43

[足式机器人]Part2 Dr. CAN学习笔记-自动控制原理Ch1-9PID控制器

本文仅供学习使用本文参考： B站：DR_CAN Dr. CAN学习笔记-自动控制原理Ch1-9PID控制器） P —— Proportional I —— Integral D —— Derivative 当前误差/过去误差/误差的变化趋势 K p ⋅ e K_{\mathrm{p}}\cdot e Kp⋅e：比…...

编程日记 2024/1/3 17:04:41

SSM养老院综合服务系统----计算机毕业设计

项目介绍该项目为后台管理项目，分为管理员与护工两种角色； 管理员角色包含以下功能： 管理员登录,个人资料密码管理,用户管理,床位类型管理,床位管理,护工管理,老人管理,咨询登记管理,预约登记管理,老人健康信息管理,费用管理等功能。护…...

编程日记 2024/1/3 17:03:39

广州求职招聘（找工作）去哪里找比较好

在广州找工作，可以选择“吉鹿力招聘网”这个平台。它是一个号称直接和boss聊的互联网招聘神器，同时，“吉鹿力招聘网”作岗位比较齐全，企业用户也多，比较全面。在“吉鹿力招聘网”历即可投递岗位。广州找工作上吉鹿力…...

编程日记 2024/1/3 17:00:36

ARM NEON 指令

NEON指令按照操作数类型可以分为正常指令、宽指令、窄指令、饱和指令、长指令。正常指令：生成大小相同且类型通常与操作数向量相同到结果向量。长指令：对双字向量操作数执行运算，生产四字向量到结果。所生成的元素一般是操作数元素宽度到…...

编程日记 2024/1/3 16:58:34

Open3D 最小二乘拟合平面——拉格朗日乘子法

目录一、算法原理二、代码实现三、结果展示本文由CSDN点云侠原创，原文链接Open3D 最小二乘拟合平面——拉格朗日乘子法。爬虫自重。一、算法原理设拟合出的平面方程为： a x + b y +...

编程日记 2024/1/3 16:52:29

Rockchip平台Android应用预安装功能(基于Android13)

Rockchip平台Android应用预安装功能(基于Android13) 1. 预安装应用类型 Android上的应用预安装功能，主要是指配置产品时，根据厂商要求，将事先准备好的第三方应用预置进Android系统。预安装分为以下几种类型： 安装不可卸载应用安…...

编程日记 2024/1/3 16:51:28

vue项目表单使用正则过滤ip、手机号

import useFormValidate from /hooks/useFormValidatesetup(props, { emit }) {const { validateName, validateIPAndPort } useFormValidate()const state reactive({workFaceInfo: props.info?.id ? props.info : {},sysTypeData: props.sysType,formRules: {name: [{req…...

编程日记 2024/1/3 16:50:27