当前位置：首页 > news >正文

llamaindex实战-ChatEngine-ReAct Agent模式

news 2026/2/7 23:08:37

概述

ReAct 是一种基于Agent的聊天模式，构建在数据查询引擎之上。对于每次聊天交互，代理都会进入一个 ReAct 循环：

首先决定是否使用查询引擎工具并提出适当的输入
（可选）使用查询引擎工具并观察其输出
决定是否重复或给出最终答复

这种方法很灵活，因为它可以灵活地选择是否查询知识库，它是基于Agent来实现的。然而，表现也更依赖于LLM的质量。您可能需要进行更多强制，以确保它选择在正确的时间查询知识库，而不是产生幻觉答案。

实现逻辑

构建和使用本地大模型。这里使用的是gemma2这个模型，也可以配置其他的大模型。
从文档中构建索引
把索引转换成查询引擎：index.as_chat_engine，并设置chat_mode为react。

注意：我这里使用的是本地大模型gemm2，效果可能没有openai的好。

实现代码

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.ollama import Ollamalocal_model = "/opt/models/BAAI/bge-base-en-v1.5"# bge-base embedding model
Settings.embed_model = HuggingFaceEmbedding(model_name=local_model)
# ollama
Settings.llm = Ollama(model="gemma2", request_timeout=360.0)from llama_index.core import VectorStoreIndex, SimpleDirectoryReaderdata = SimpleDirectoryReader(input_dir="./data/paul_graham/").load_data()
index = VectorStoreIndex.from_documents(data)# 设置使用react模式
chat_engine = index.as_chat_engine(chat_mode="react", llm=Settings.llm, verbose=True)response = chat_engine.chat( "Use the tool to answer what did Paul Graham do in the summer of 1995?")

输出

从以下输出可以看到，不同大模型的输出不太相同。Agent通过查询引擎获取到了对应的索引和文本信息。

$ python chat_react.py 
> Running step 3e748b23-a1bb-4807-89f6-7bda3b418b86. Step input: Use the tool to answer what did Paul Graham do in the summer of 1995?
Thought: The current language of the user is: English. I need to use a tool to help me answer the question.
Action: query_engine_tool
Action Input: {'input': 'What did Paul Graham do in the summer of 1995?'}
Observation: He worked on his Lisp-based web server.  

> Running step 5f4592b6-f1d0-4fcf-8b03-a50d46641ef2. Step input: None
Thought: I can answer without using any more tools. I'll use the user's language to answer
Answer: In the summer of 1995, Paul Graham worked on his Lisp-based web server.

实现分析

从以下实现代码中可以看到，当聊天模式是REACT模式时，会创建一个AgentRunner，并把查询引擎作为工具放入Agent工具列表中。

  def as_chat_engine(self,chat_mode: ChatMode = ChatMode.BEST,llm: Optional[LLMType] = None,**kwargs: Any,) -> BaseChatEngine:    if chat_mode in [ChatMode.REACT, ChatMode.OPENAI, ChatMode.BEST]:# use an agent with query engine tool in these chat modes# NOTE: lazy importfrom llama_index.core.agent import AgentRunnerfrom llama_index.core.tools.query_engine import QueryEngineTool
# convert query engine to toolquery_engine_tool = QueryEngineTool.from_defaults(query_engine=query_engine)
return AgentRunner.from_llm(tools=[query_engine_tool],llm=llm,**kwargs,)

小结

通过REACT模式，会创建一个Agent，并把查询引擎作为工具放到该Agent中。然后，通过查询引擎的能力来查询想要的内容。

llamaindex实战-ChatEngine-ReAct Agent模式

概述 ReAct 是一种基于Agent的聊天模式，构建在数据查询引擎之上。对于每次聊天交互，代理都会进入一个 ReAct 循环： 首先决定是否使用查询引擎工具并提出适当的输入 （可选）使用查询引擎工具并观察其输出决定是否重复…...

编程日记 2024/12/2 2:03:36

redis快速进门

、数据库类型认识关系型数据库关系型数据库是一个结构化的数据库，创建在关系模型（二维表格模型）基础上，一般面向于记录。 SQL 语句（标准数据查询语言）就是一种基于关系型数据库的语言，用于执行…...

编程日记 2024/12/2 2:02:35

从0开始linux（39）——线程（2）线程控制

欢迎来到博主的专栏：从0开始linux 博主ID：代码小豪文章目录线程创建线程标识符线程参数多线程竞争资源回收线程detach 线程退出pthread_cancel 线程创建线程创建的函数为pthread_create。该函数是包含在posix线程库当中，posix线程是C语言…...

编程日记 2024/12/2 2:01:34

International Journal of Medical Informatics投稿经历时间节点

20240423，完成投稿 20240612，按编辑要求修改后再投, with editor 20240613，under review，completed 0, accepted 0, invitation 2. 20240620, under review，completed 0, accepted 1, invitation 2. 20240626, unde…...

编程日记 2024/12/2 1:59:31

BUUCTF—Reverse—Java逆向解密（10）

程序员小张不小心弄丢了加密文件用的秘钥，已知还好小张曾经编写了一个秘钥验证算法，聪明的你能帮小张找到秘钥吗？ 注意：得到的 flag 请包上 flag{} 提交需要用专门的Java反编译软件:jd-gui 下载文件，发现是个class文…...

编程日记 2024/12/2 1:56:28

CLIP-MMA: Multi-Modal Adapter for Vision-Language Models

当前的问题 CLIP-Adapter仅单独调整图像和文本嵌入，忽略了不同模态之间的交互作用。此外，适应性参数容易过拟合训练数据，导致新任务泛化能力的损失。动机图1所示。多模态适配器说明。通过一种基于注意力的 Adapter ，作者称之…...

编程日记 2024/12/2 1:55:28

三维扫描仪-3d扫描建模设备自动检测尺寸

在现代工业制造领域，三维扫描仪已成为实现高精度尺寸检测的关键设备。CASAIM自动化智能检测系统以其自动化三维立体扫描技术，为产品尺寸的自动检测提供了高效、可靠的解决方案。 CASAIM自动化智能检测系统通过非接触式测量方式，通过激光扫描…...

编程日记 2024/12/2 1:51:24

vue3+ant design vue实现日期选择器默认显示当前年，并限制用户只能选择当前年及之前~

1、思路：之前想拿当前年直接做赋值操作，实际上是行不通的，因为组件本身有数据格式限制，会出现报错，然后索性直接获取当前日期（YYYY-MM-DD）赋值给日期组件，这样不管你用的是年&#x…...

编程日记 2024/12/2 1:50:23

【electron-vite】搭建electron+vue3框架基础

一、拉取项目 electron-vite 中文文档地址： https://cn-evite.netlify.app/guide/ 官网网址：https://evite.netlify.app/ 版本 vue版本：vue3 构建工具：vite 框架类型：Electron JS语法：TypeScript &…...

编程日记 2024/12/2 1:48:22

05《存储器层次结构与接口》计算机组成与体系结构系列课

目录存储器层次结构概述层次结构的定义存储器的排名存储器接口处理器与存储器的速度匹配存储器接口的定义存储器访问命中率两种接口第1种方式：并行命中率的计算存储器访问时间第2种方式：逐级结语大家好，欢迎回来。…...

编程日记 2024/12/2 1:43:15

elasticsearch报错fully-formed single-node cluster with cluster UUID

1.问题描述 k8s集群内部署的es中间件起不来，查看日志发现如下警告，节点发现功能开启，但是目前我是单节点服务，所以尝试编辑sts将节点发现功能去掉或者在部署时将你的sts的yaml文件和chart文件修改重新部署以去掉该功能 {"t…...

编程日记 2024/12/2 1:42:14

Milvus×Florence：一文读懂如何构建多任务视觉模型

近两年来多任务学习（Multi-task learning）正取代传统的单任务学习（single-task learning），逐渐成为人工智能领域的主流研究方向。其原因在于，多任务学习可以让我们以最少的人力投入，获得尽可能多…...

编程日记 2024/12/2 1:38:11

DAPP

02-DAPP 1 啥是 DApp？ DApp，部署在链上的去中心化的应用。 DApp 是开放源代码，能运行在分布式网络上，通过网络中不同对等节点相互通信进行去中心化操作的应用。 DAPP 开放源代码，才能获得人的信任。如比特币&#xff…...

编程日记 2024/12/2 1:34:07

生产环境中，nginx 最多可以代理多少台服务器，这个应该考虑哪些参数？怎么计算呢

生产环境中，nginx 最多可以代理多少台服务器，这个应该考虑哪些参数 ？怎么计算呢关键参数计算方法评估步骤总结在生产环境中，Nginx最多可以代理的服务器数量并没有一个固定的限制，它取决于多个因素，包括Ng…...

编程日记 2024/12/2 1:32:05

【深度学习|目标跟踪】StrongSORT 详解(以及StrongSORT++)

StrongSort详解 1、论文及源码2、DeepSORT回顾3、StrongSORT的EMA4、StrongSORT的NSA Kalman5、StrongSORT的MC6、StrongSORT的BOT特征提取器7、StrongSORT的AFLink8、StrongSORT的GSI模块 1、论文及源码论文地址：https://arxiv.org/pdf/2202.13514 源码地址&#…...

编程日记 2024/12/2 1:28:00

23种设计模式-原型(Prototype)设计模式

文章目录一.什么是原型设计模式？二.原型模式的特点三.原型模式的结构四.原型模式的优缺点五.原型模式的 C 实现六.原型模式的 Java 实现七. 代码解析八.总结类图： 原型设计模式类图一.什么是原型设计模式？ 原型模式（Prototype…...

编程日记 2024/12/2 1:25:56

Qt—QLineEdit 使用总结

文章参考：Qt—QLineEdit 使用总结一、简述 QLineEdit是一个单行文本编辑控件。使用者可以通过很多函数，输入和编辑单行文本，比如撤销、恢复、剪切、粘贴以及拖放等。通过改变 QLineEdit 的 echoMode() ，可以设置其属性，比如以密码的形式输入。文本的长度可以由 m…...

编程日记 2024/12/2 1:19:50

go-zero使用自定义模板实现统一格式的 body 响应

前提 go环境的配置、goctl的安装、go-zero的基本使用默认都会需求 go-zero框架中，默认使用goctl命令生成的代码并没有统一响应格式，现在使用自定义模板实现统一响应格式： {"code": 0,"msg": "OK","d…...

编程日记 2024/12/2 1:16:47

BUGKU printf

整体思路实现循环-->获取libc版本和system函数地址->将strcpy的got表项修改为system并获得shell 第一步：实现循环从汇编语句可以看出，在每次循环结束时若0x201700处的值是否大于1则会继续循环。 encode1会将编码后的结果保存至0x2015c0处&am…...

编程日记 2024/12/2 1:15:46

深度学习：梯度下降法

损失函数 L：衡量单一训练样例的效果。成本函数 J：用于衡量 w 和 b 的效果。如何使用梯度下降法来训练或学习训练集上的参数w和b ？ 成本函数J是参数w和b的函数，它被定义为平均值； 损失函数L可以衡量你的算法效果&a…...

编程日记 2024/12/2 1:14:46

基于算法竞赛的c++编程（28）结构体的进阶应用

结构体的嵌套与复杂数据组织在C中，结构体可以嵌套使用，形成更复杂的数据结构。例如，可以通过嵌套结构体描述多层级数据关系： struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...

编程新知 2025/11/16 19:06:23

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

编程新知 2026/1/26 21:57:45

Springcloud：Eureka 高可用集群搭建实战（服务注册与发现的底层原理与避坑指南）

引言：为什么 Eureka 依然是存量系统的核心？ 尽管 Nacos 等新注册中心崛起，但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制，是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...

编程新知 2026/1/31 7:23:48

Python爬虫（一）：爬虫伪装

一、网站防爬机制概述在当今互联网环境中，具有一定规模或盈利性质的网站几乎都实施了各种防爬措施。这些措施主要分为两大类： 身份验证机制：直接将未经授权的爬虫阻挡在外反爬技术体系：通过各种技术手段增加爬虫获取数据的难度…...

编程新知 2026/1/30 20:42:46

Spring Boot+Neo4j知识图谱实战：3步搭建智能关系网络！

一、引言在数据驱动的背景下，知识图谱凭借其高效的信息组织能力，正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合，探讨知识图谱开发的实现细节，帮助读者掌握该技术栈在实际项目中的落地方法。 …...

编程新知 2025/9/17 21:39:04

NFT模式：数字资产确权与链游经济系统构建

NFT模式：数字资产确权与链游经济系统构建 ——从技术架构到可持续生态的范式革命一、确权技术革新：构建可信数字资产基石 1. 区块链底层架构的进化跨链互操作协议：基于LayerZero协议实现以太坊、Solana等公链资产互通，通过零知…...

编程新知 2026/1/31 23:23:23

DeepSeek 技术赋能无人农场协同作业：用 AI 重构农田管理 “神经网”

目录一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度五、实际案例大…...

编程新知 2025/9/24 13:35:36