当前位置：首页 > news >正文

可信和可解释的大语言模型推理-RoG

news 2026/2/8 7:08:45

大型语言模型（LLM）在复杂任务中表现出令人印象深刻的推理能力。然而，LLM在推理过程中缺乏最新的知识和经验，这可能导致不正确的推理过程，降低他们的表现和可信度。知识图谱(Knowledge graphs, KGs)以结构化的形式存储了大量的事实，为推理提供了可靠的知识来源。然而，现有的基于KG的LLM推理方法只将KG作为事实知识库，忽略了其结构信息对推理的重要性。本文提出了一种称为图谱推理(RoG)的新方法，该方法将LLM与KGs协同使用，以实现可信和可解释的推理。
在这里插入图片描述

1 三个步骤

推理图（Reasoning on Graphs, RoG）提出了一个计划-检索-推理框架，该框架的核心流程包括以下几个步骤：

规划生成（Planning Generation）：给定一个问题，首先使用大型语言模型（LLM）生成若干个基于知识图谱（KG）的关系路径作为推理规划。这些关系路径捕捉了实体间的语义关系，并被用作推理答案的规划。

路径检索（Path Retrieval）：利用生成的推理规划，从知识图谱中检索有效的推理路径。这一步确保LLM能够获取最新的知识，并基于这些路径进行推理。

推理（Reasoning）：基于检索到的推理路径，LLM进行推理并生成答案，同时解释推理过程。

RoG不仅可以从KGs中提取知识，通过训练提高llm的推理能力，这个过程不仅提高了答案的可信度，还增强了解释性。还可以在推理过程中与任意llm无缝集成。

2 两个模块

RoG包含两个组成部分:1)一个规划模块，该模块生成以KGs为基础的关系路径作为可信规划;2)检索推理模块，首先根据计划从KGs中检索有效的推理路径，然后根据检索到的推理路径进行忠实推理，生成具有可解释解释的答案。

尽管LLM具有将关系路径生成为规划的优势，但LLM对KGs中包含的关系一无所知，因此LLM不能直接生成以KGs为基础的关系路径作为可信规划。此外，LLM可能无法正确理解推理路径，并基于它们进行推理。为了解决这些问题，RoG设计了两个指令调优任务:

规划模块优化，将KGs中的知识提取到LLM中以生成忠实关系路径作为规划;

检索-推理模块优化，使LLM能够基于检索到的推理路径进行推理。

3 结语

RoG通过将LLMs与KGs相结合，提出了一种新颖的规划-检索-推理框架，显著提高了LLMs的推理能力和可解释性，并在实验中展示了其在处理高风险场景（如法律判决和医疗诊断）中的潜力，通过提供最新的知识和避免推理过程中的幻觉，RoG提高了LLMs在这些场景中的性能和可信度。

论文题目：Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasonin
论文链接：https://arxiv.org/pdf/2310.01061（发表于ICLR2024）

PS: 欢迎大家扫码关注公众号^_，我们一起在AI的世界中探索前行，期待共同进步！
在这里插入图片描述

可信和可解释的大语言模型推理-RoG

1 三个步骤

2 两个模块

3 结语

相关文章：

可信和可解释的大语言模型推理-RoG

秋招季的策略与行动指南：提前布局，高效备战，精准出击

Java并发编程-wait与notify详解及案例实战

204.贪心算法：分发饼干（力扣）

AI奥林匹克竞赛：Claude-3.5-Sonnet对决GPT-4o，谁是最聪明的AI？

【C++】const修饰成员函数

基于模糊神经网络的时间序列预测（以hopkinsirandeath数据集为例，MATLAB）

Java web应用性能分析之【prometheus监控K8s指标说明】

Spring Boot中的应用配置文件管理

SCCB协议介绍，以及与IIC协议对比

K8S基础简介

Studying-代码随想录训练营day24| 93.复原IP地址、78.子集、90.子集II

2024《汽车出海全产业数据安全合规发展白皮书》下载

nvm安装以及idea下vue启动项目过程和注意事项

Java SPI服务发现与扩展的利器

Ansible的Playbook

多平台自动养号【开心版】偷偷使用就行了!

Android与JavaScript的交互，以实现从WebView中打开原生页面并传递参数

信息（文字、图像、音频、视频等）在计算机中是如何存储及显示的

【考研408计算机组成原理】微程序设计重要考点指令流水线考研真题＋考点分析

React 第五十五节 Router 中 useAsyncError的使用详解

FastAPI 教程：从入门到实践

cf2117E

python爬虫：Newspaper3k 的详细使用（好用的新闻网站文章抓取和解析的Python库）

Unit 1 深度强化学习简介

MySQL中【正则表达式】用法

Unsafe Fileupload篇补充-木马的详细教程与木马分享（中国蚁剑方式）

C#中的CLR属性、依赖属性与附加属性

力扣热题100 k个一组反转链表题解

LRU 缓存机制详解与实现（Java版） + 力扣解决