当前位置：首页 > news >正文

【RAG 项目实战 07】替换 ConversationalRetrievalChain（单轮问答）

news 2026/4/8 13:46:52

【RAG 项目实战 07】替换 ConversationalRetrievalChain（单轮问答）

NLP Github 项目：

NLP 项目实践：fasterai/nlp-project-practice

介绍：该仓库围绕着 NLP 任务模型的设计、训练、优化、部署和应用，分享大模型算法工程师的日常工作和实战经验
AI 藏经阁：https://gitee.com/fasterai/ai-e-book

介绍：该仓库主要分享了数百本 AI 领域电子书
AI 算法面经：fasterai/nlp-interview-handbook#面经

介绍：该仓库一网打尽互联网大厂NLP算法面经，算法求职必备神器
NLP 剑指Offer：https://gitee.com/fasterai/nlp-interview-handbook

介绍：该仓库汇总了 NLP 算法工程师高频面题

一、RAG 整体流程

检索式问答的系统流程图：

二、RAG 核心模块

2.1 环境配置

# @Author：青松  
# 公众号：FasterAI  
# Python, version 3.10.14  
# Pytorch, version 2.3.0  
# Chainlit, version 1.1.301

2.2 分割文本块并对每一个块建索引

# 配置文件分割器，每个块1000个token，重复100个
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)# 将文件分割成文本块
texts = text_splitter.split_text(text)# 为每个文本块添加元数据
metadatas = [{"source": f"{i}-pl"} for i in range(len(texts))]# 使用异步方式创建 Chroma 向量数据库
vectorstore = await cl.make_async(Chroma.from_texts)(texts, embeddings_model, metadatas=metadatas
)# 将 Chroma 向量数据库转化为检索器
retriever = vectorstore.as_retriever()

2.3 构建 RAG 链

# RAG_Prompt：根据参考内容回答用户问题
rag_template = "你是一个专门处理问答任务的智能助理。请使用给定的参考内容来回答用户的问题，如果你不知道答案，就说你不知道，不要试图编造答案。" \"\n\n用户问题: {question} \n参考内容: {context} \n答案:"rag_prompt = PromptTemplate.from_template(rag_template)# RAG链：根据问题和参考内容生成答案
rag_chain = ({"context": retriever | format_docs, "question": RunnablePassthrough()}| rag_prompt| llm| StrOutputParser()
)

2.4 检索生成

rag_chain = cl.user_session.get("rag_chain")# 使用RAG链处理用户问题
response = rag_chain.invoke(message.content,config=RunnableConfig(callbacks=[cl.LangchainCallbackHandler()]),
)# 大模型的回答
await cl.Message(content=response).send()

三、RAG 效果展示

启动程序：

chainlit run rag_app.py -w

系统截图：

在这里插入图片描述

问题一：对第一个问题大模型可以根据文档内容生成答案。
问题二：对第一个问题大模型未能结合聊天历史进行RAG。

四、RAG 完整代码

# @Author：青松
# 公众号：FasterAI
# Python, version 3.10.14
# Pytorch, version 2.3.0
# Chainlit, version 1.1.301import chainlit as cl
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain_community.embeddings import HuggingFaceBgeEmbeddings
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnableConfig, RunnablePassthroughimport llm_util
from common import Constants# 获取大模型实例
llm = llm_util.get_llm(Constants.MODEL_NAME['QianFan'])# 获取文本嵌入模型
model_name = "BAAI/bge-small-zh"
# 对模型生成的嵌入进行归一化处理，将它们缩放到具有单位范数（长度为1）的尺度
encode_kwargs = {"normalize_embeddings": True}
embeddings_model = HuggingFaceBgeEmbeddings(model_name=model_name, encode_kwargs=encode_kwargs
)@cl.on_chat_start
async def on_chat_start():""" 监听会话开始事件 """await send_welcome_msg()files = None# 等待用户上传文件while files is None:files = await cl.AskFileMessage(content="Please upload a text file to begin!",accept=["text/plain"],max_size_mb=20,timeout=180,).send()file = files[0]# 发送处理文件的消息msg = cl.Message(content=f"Processing `{file.name}`...", disable_feedback=True)await msg.send()with open(file.path, "r", encoding="utf-8") as f:text = f.read()# 配置文件分割器，每个块1000个token，重复100个text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)# 将文件分割成文本块texts = text_splitter.split_text(text)# 为每个文本块添加元数据metadatas = [{"source": f"{i}-pl"} for i in range(len(texts))]# 使用异步方式创建 Chroma 向量数据库vectorstore = await cl.make_async(Chroma.from_texts)(texts, embeddings_model, metadatas=metadatas)# 将 Chroma 向量数据库转化为检索器retriever = vectorstore.as_retriever()cl.user_session.set("retriever", retriever)# RAG_Prompt：根据参考内容回答用户问题rag_template = "你是一个专门处理问答任务的智能助理。请使用给定的参考内容来回答用户的问题，如果你不知道答案，就说你不知道，不要试图编造答案。" \"\n\n用户问题: {question} \n参考内容: {context} \n答案:"rag_prompt = PromptTemplate.from_template(rag_template)# RAG链：根据问题和参考内容生成答案rag_chain = ({"context": retriever | format_docs, "question": RunnablePassthrough()}| rag_prompt| llm| StrOutputParser())cl.user_session.set("rag_chain", rag_chain)# 通知用户文件已处理完成，更新当前窗口的内容msg.content = f"Processing `{file.name}` done. You can now ask questions!"await msg.update()@cl.on_message
async def on_message(message: cl.Message):""" 监听用户消息事件 """rag_chain = cl.user_session.get("rag_chain")# 使用RAG链处理用户问题response = rag_chain.invoke(message.content,config=RunnableConfig(callbacks=[cl.LangchainCallbackHandler()]),)# 大模型的回答await cl.Message(content=response).send()async def send_welcome_msg():image = cl.Image(url="https://qingsong-1257401904.cos.ap-nanjing.myqcloud.com/wecaht.png")# 发送一个图片await cl.Message(content="**青松** 邀你关注 **FasterAI**， 让每个人的 AI 学习之路走的更容易些！立刻扫码开启 AI 学习、面试快车道 **(^_^)** ",elements=[image],).send()def format_docs(docs):""" 拼接检索到的文本块 """return "\n\n".join(doc.page_content for doc in docs)

【动手学 RAG】系列文章：

【RAG 项目实战 01】在 LangChain 中集成 Chainlit
【RAG 项目实战 02】Chainlit 持久化对话历史
【RAG 项目实战 03】优雅的管理环境变量
【RAG 项目实战 04】添加多轮对话能力
【RAG 项目实战 05】重构：封装代码
【RAG 项目实战 06】使用 LangChain 结合 Chainlit 实现文档问答
【RAG 项目实战 07】替换 ConversationalRetrievalChain（单轮问答）
【RAG 项目实战 08】为 RAG 添加历史对话能力
More…

【动手部署大模型】系列文章：

【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装
【模型部署】vLLM 部署 Qwen2-VL 踩坑记 02 - 推理加速
【模型部署】vLLM 部署 Qwen2-VL 踩坑记 03 - 多图支持和输入格式问题
More…

【RAG 项目实战 07】替换 ConversationalRetrievalChain（单轮问答）

【RAG 项目实战 07】替换 ConversationalRetrievalChain（单轮问答） NLP Github 项目： NLP 项目实践：fasterai/nlp-project-practice 介绍：该仓库围绕着 NLP 任务模型的设计、训练、优化、部署和应用，分享大…...

编程日记 2024/11/27 8:35:05

godot游戏引擎_瓦片集和瓦片地图介绍

在 Godot 中，TileSet 和 TileMap 是用于处理瓦片地图的两个关键概念，它们的作用和用途有明显的区别。以下是两者的详细对比： 1. TileSet（瓦片集） TileSet 是资源，定义瓦片的内容和属性。特点&#xff1a…...

编程日记 2024/11/27 8:28:58

7、深入剖析PyTorch nn.Module源码

文章目录 1. 重要类2. add_modules3. Apply(fn)4. register_buffer5. nn.Parametersister_parameters6. 后续测试 1. 重要类 nn.module --> 所有神经网络的父类，自定义神经网络需要继承此类，并且自定义__init__,forward函数即可： #!/usr…...

编程日记 2024/11/27 8:27:57

如何提升编程能力第二篇

如何提升编程能力2 1. 引言2. 掌握理论基础2.1 理解编程语言的核心2.2 数据结构与算法2.3 计算机基础与系统设计3.1 多写代码3.2 参与开源项目3.3 开发自己的项目 4. 提高代码质量4.1 代码风格与可读性4.2 测试驱动开发 1. 引言编程是推动现代科技发展的核心技能，…...

编程日记 2024/11/27 8:24:55

问：SpringBoot核心配置文件都有啥，怎么配？

在SpringBoot的开发过程中，核心配置文件扮演着至关重要的角色。这些文件用于配置应用程序的各种属性和环境设置，使得开发者能够灵活地定制和管理应用程序的行为。本文将探讨SpringBoot的核心配置文件，包括它们的作用、区别，并通过…...

编程日记 2024/11/27 8:23:54

RHCSA作业

课后练习将整个 /etc 目录下的文件全部打包并用 gzip 压缩成/back/etcback.tar.gz [rootlocalhost ~]# tar -czvf /back/etcback.tar.gz -C / etc 使当前用户永久生效的命令别名：写一个命令命为hello,实现的功能为每输入一次hello命令，就有hello&#…...

编程日记 2024/11/27 8:21:52

ESP32学习笔记_FreeRTOS(3)——SoftwareTimer

摘要(From AI): 这篇笔记全面介绍了 FreeRTOS 软件定时器的核心概念和使用方法，包括定时器的创建、管理、常用 API 和辅助函数，并通过示例代码演示了如何启动、重置和更改定时器的周期。它强调了软件定时器的灵活性、平台无关性以及与硬件定时器的对比 …...

编程日记 2024/11/27 8:19:49

文心一言与千帆大模型平台的区别：探索百度AI生态的双子星

随着人工智能技术的迅猛发展，越来越多的公司开始投入资源开发自己的AI解决方案。在中国，百度作为互联网巨头之一，不仅在搜索引擎领域占据重要位置，还在AI领域取得了显著成就。其中，“文心一言”和“千帆大模型平台”便…...

编程日记 2024/11/27 8:16:47

【c语言】文件操作详解 - 从打开到关闭

文章目录 1. 为什么使用文件？2. 什么是文件？3. 如何标识文件？4. 二进制文件和文本文件？5. 文件的打开和关闭5.1 流和标准流5.1.1 流5.1.2 标准流 5.2 文件指针5.3 文件的打开和关闭 6. 文件的读写顺序6.1 顺序读写函数6.2 对比一组…...

编程日记 2024/11/27 8:13:43

Flink Sink的使用

经过一系列Transformation转换操作后，最后一定要调用Sink操作，才会形成一个完整的DataFlow拓扑。只有调用了Sink操作，才会产生最终的计算结果，这些数据可以写入到的文件、输出到指定的网络端口、消息中间件、外部的文件系统或者是…...

编程日记 2024/11/27 8:10:39

pcl::PointCloud＜PointType＞::Ptr extractedCloud；尖括号里的值表示什么含义？

在C中，pcl::PointCloud<PointType>::Ptr是一种智能指针，它是Point Cloud Library (PCL)中用于管理pcl::PointCloud对象的智能指针类型。这里的<pcl::PointCloud<PointType>::Ptr>尖括号里的值表示智能指针所指向的对象类型。让我们分…...

编程日记 2024/11/27 8:08:35

《基于FPGA的便携式PWM方波信号发生器》论文分析（三）——数码管稳定显示与系统调试

一、论文概述基于FPGA的便携式PWM方波信号发生器是一篇由任青颖、庹忠曜、黄洵桢、李智禺和张贤宇等人发表的一篇期刊论文。该论文主要研究了一种新型的信号发生器，旨在解决传统PWM信号发生器在移动设备信号调控中存在的精准度低和便携性差的问题。其基于现场可编…...

编程日记 2024/11/27 8:06:32

VsCode 插件推荐（个人常用）

VsCode 插件推荐（个人常用）...

编程日记 2024/11/27 8:05:32

路由策略与路由控制实验

AR1、AR2、AR3在互联接口、Loopback0接口上激活OSPF。AR3、AR4属于IS-IS Area 49.0001，这两者都是Level-1路由器，AR3、AR4的系统ID采用0000.0000.000x格式，其中x为设备编号 AR1上存在三个业务网段A、B、C（分别用Loopback1、2、3接…...

编程日记 2024/11/27 8:02:29

训练的decoder模型文本长度不一致，一般设置为多大合适，需要覆盖最长的文本长度么

在训练解码器模型时，文本长度不一致是常见的情况，需要根据任务的特性和数据集的长度分布来设置合理的最大长度 (max_length)。以下是一些指导原则，帮助你设置合适的最大长度： 1. 是否需要覆盖最长文本长度覆盖最长文本长度：如果任务对完整性要求很高（例如生成数学公式、…...

编程日记 2024/11/27 7:59:26

过滤条件包含 OR 谓词，如何进行查询优化——OceanBase SQL 优化实践

这篇博客涉及两个点，一个是 “OR Expansion 改写”，另一个是 “基于代价的改写”。背景在写SQL查询时，难以避免在过滤条件中使用 OR 谓词，但其往往会导致索引利用效率下降的问题。本文将分享如何通过查询改写的2种方式进行优化…...

编程日记 2024/11/27 7:57:23

通过异步使用消息队列优化秒杀

通过异步使用消息队列优化秒杀同步秒杀流程异步优化秒杀异步秒杀流程基于lua脚本保证Redis操作原子性代码实现阻塞队列的缺点同步秒杀流程 public Result seckillVoucher(Long voucherId) throws InterruptedException {SeckillVoucher seckillVoucher iSeckillVoucherServi…...

编程日记 2024/11/27 7:56:21

AI产业告别“独奏”时代，“天翼云息壤杯”高校AI大赛奏响产学研“交响乐”

文 | 智能相对论作者 | 陈泊丞人工智能产业正在从“独奏”时代进入“大合奏”时代。在早期的AI发展阶段，AI应用主要集中在少数几个领域，如语音识别、图像处理等。这些领域的研究和开发工作往往由少数几家公司或研究机构即可独立完成，犹…...

编程日记 2024/11/27 7:53:18

Hot100 - 字母异位词分组

Hot100 - 字母异位词分组最佳思路：排序时间复杂度： O(nmlogm)，其中 n 为 strs 数组的长度，m 为每个字符串的长度。代码： class Solution {public List<List<String>> groupAnagrams(String[] strs) …...

编程日记 2024/11/27 7:49:15

力扣hot100--＞排序

排序 1. 56. 合并区间中等以数组 intervals 表示若干个区间的集合，其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间，并返回一个不重叠的区间数组，该数组需恰好覆盖输入中的所有区间。示例 1： 输…...

编程日记 2024/11/27 7:47:13

cv_resnet18_ocr-detection进阶玩法：导出ONNX模型跨平台使用

cv_resnet18_ocr-detection进阶玩法：导出ONNX模型跨平台使用 1. 为什么需要导出ONNX模型当你已经熟悉了cv_resnet18_ocr-detection的基本使用后，可能会遇到这样的需求：想把模型部署到手机APP上，或者集成到C项目中，又…...

编程新知 2026/4/8 13:27:34

moectf2025 rush

如此例题:利用随波逐流进行解题,将图片拖进去,在图片隐写中,找到GIF分离,将rush.gif分解为一张张独立的静态图片,并保存在新的文件夹中利用QR research进行扫描即可得出flag为moectf{QR_C0d3s_feATUR3_eRror_c0RRECt10N}...

编程新知 2026/4/8 12:44:51

WebP图片处理全攻略：如何让Java的Thumbnails支持最新图片格式（含SPI机制解析）

WebP图片处理全攻略：Java生态下的高效解决方案与SPI机制深度解析 WebP作为Google推出的新一代图片格式，凭借其卓越的压缩效率和动画支持能力，正在逐步改变互联网图像存储与传输的格局。根据最新行业统计，采用WebP格式的网站平均可…...

编程新知 2026/4/8 12:20:24

赋能软件测试：三大主流数据标注平台（Label Studio, Prodigy, Scale）的深度技术解析与选型指南

当软件测试遇见AI数据工程在人工智能驱动的软件测试新时代，数据已不仅仅是应用运行的输入，更是构建智能测试模型、实现自动化测试演进的核心“燃料”。数据标注，作为将原始数据转化为机器可理解、可学习结构化信息的关键工序，其质…...

编程新知 2026/4/8 12:10:08

蔚蓝档案自动化脚本实战指南：5个技巧提升游戏效率

蔚蓝档案自动化脚本实战指南：5个技巧提升游戏效率【免费下载链接】blue_archive_auto_script 支持按轴凹总力战, 无缝制造三解, 用于实现蔚蓝档案自动化的程序( Steam已适配 ) 项目地址: https://gitcode.com/gh_mirrors/bl/blue_archive_auto_script 蔚蓝档…...

编程新知 2026/4/8 12:06:04

别再傻傻轮询了！用STM32外部中断做按键检测，CPU占用率直降90%

STM32外部中断实战：按键检测的CPU占用率优化指南在嵌入式系统开发中，按键检测是最基础却又最容易影响系统性能的功能之一。许多开发者习惯使用轮询方式检测按键状态，这种方式虽然实现简单，但在资源受限的单片机（如ST…...

编程新知 2026/4/8 12:06:04

Multisim电路仿真与Qwen3.5-2B结合：自动化生成电路分析报告

Multisim电路仿真与Qwen3.5-2B结合：自动化生成电路分析报告 1. 电子工程师的设计痛点每个电子工程师都经历过这样的场景：在Multisim中反复调整电路参数，盯着示波器波形来回对比，手动记录各项性能指标，最后还要花大量…...

编程新知 2026/4/8 11:15:04

SDXL-Turbo快速上手指南：无需插件、纯Diffusers架构的极简部署方案

SDXL-Turbo快速上手指南：无需插件、纯Diffusers架构的极简部署方案你有没有想过，AI绘画能快到什么程度？是等上几十秒，还是几分钟？如果我告诉你，现在有一种方案，能让AI在你敲下键盘的瞬间就给出…...

编程新知 2026/4/8 9:54:38

抖音无水印视频下载工具：5分钟快速上手完整指南【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

编程新知 2026/4/8 9:00:10

资管规模突破千万！传统理财师转型AI量化理财专家，如何用数据说服大用户

从“人脑经验”到“数据驱动”，一位理财师的真实进阶之路2025年，我的资管规模正式突破1000万。这不是一个简单的数字，而是对我从传统理财师转型AI量化理财专家最有力的证明。很多人问我：你是靠什么说服那些高净值客户的&#xff1…...

编程新知 2026/4/8 8:18:33

【RAG 项目实战 07】替换 ConversationalRetrievalChain（单轮问答）

一、RAG 整体流程

二、RAG 核心模块

2.1 环境配置

2.2 分割文本块并对每一个块建索引

2.3 构建 RAG 链

2.4 检索生成

三、RAG 效果展示

四、RAG 完整代码

【动手学 RAG】系列文章：

相关文章：