用于与多个数据库聊天的智能 SQL 代理问答和 RAG 系统(3) —— 基于 LangChain 框架的文档检索与问答功能以及RAG Tool的使用
介绍基于 LangChain 框架的文档检索与问答功能,目标是通过查询存储的向量数据库(VectorDB),为用户的问题检索相关内容,并生成自然语言的答案。以下是代码逻辑的详细解析:
代码结构与功能
- 初始化环境与加载配置
from dotenv import load_dotenv load_dotenv()os.environ['OPENAI_API_KEY'] = os.getenv("OPENAI_API_KEY")
- 使用
dotenv
加载.env
文件中的环境变量(如OPENAI_API_KEY
和OPENAI_API_BASE
)。 - 将 OpenAI API 密钥设置为环境变量,供后续使用。
- 使用
- 加载向量数据库
VECTORDB_DIR = "data/airline_policy_vectordb" K = 2vectordb = Chroma(collection_name="rag-chroma",persist_directory=str(here(VECTORDB_DIR)),embedding_function=OpenAIEmbeddings() ) print("Number of vectors in vectordb:", vectordb._collection.count(), "\n\n")
VECTORDB_DIR
:向量数据库的存储目录。K=2
:设置检索时返回的文档数。- 使用
Chroma
加载向量数据库:collection_name
指定集合名称。persist_directory
指向存储数据库的目录。embedding_function
使用OpenAIEmbeddings
生成向量嵌入。
- 打印向量数据库中存储的向量数量。
- 检索文档并生成提示
message = "What is the cancelation rule for a flight ticket at swiss airline policy?"docs = vectordb.similarity_search(message, k=K)question = "# User new question:\n" + message retrieved_content = "" for doc in docs:retrieved_content += f"{doc.page_content}\n\n" prompt = f"# Content:\n{retrieved_content}\n\n{question}"pprint(prompt)
- 定义用户问题
message
,这是需要检索和回答的问题。 - 检索文档:
- 使用
vectordb.similarity_search
在向量数据库中查找与问题最相似的文档,返回K
个相关文档。
- 使用
- 生成提示:
- 将用户问题和检索到的文档内容整合为一个提示(
prompt
),格式如下:# Content: (检索到的文档内容)# User new question: (用户问题)
- 将用户问题和检索到的文档内容整合为一个提示(
- 定义用户问题
部分代码执行结果如下:
- 调用聊天模型生成答案
from langchain_openai import ChatOpenAIchat = ChatOpenAI(openai_api_base=os.getenv("OPENAI_API_BASE"),openai_api_key=os.getenv("OPENAI_API_KEY"),temperature=0 )messages = [{"role": "system", "content": "You will receive a user's query and possible content where the answer might be. If the answer is found, provide it, if not, state that the answer does not exist."},{"role": "user", "content": prompt} ]response = chat.invoke(messages) print(response)
- 使用
ChatOpenAI
调用 OpenAI 的聊天模型。 - 定义对话上下文:
- 系统消息:告诉模型用户会提供问题和可能的内容,要求模型判断答案是否存在。
- 用户消息:将生成的提示作为输入。
- 调用
chat.invoke
生成回答并打印。
- 使用
- 定义工具函数
from langchain_core.tools import tool@tool def lookup_swiss_airline_policy(query: str) -> str:"""Search within the Swiss Airline's company policies to check whether certain options are permitted. Input should be a search query."""vectordb = Chroma(collection_name="rag-chroma",persist_directory=str(here(VECTORDB_DIR)),embedding_function=OpenAIEmbeddings())docs = vectordb.similarity_search(query, k=K)return "\n\n".join([doc.page_content for doc in docs])
- 使用
@tool
装饰器创建一个可复用工具函数。 - 功能:
- 接受查询
query
。 - 从向量数据库中检索相关文档。
- 返回检索到的文档内容。
- 接受查询
- 说明信息:提供关于工具功能的描述,供其他程序或用户调用时参考。
- 使用
- 工具函数的调用
print(lookup_swiss_airline_policy.name) print(lookup_swiss_airline_policy.args) print(lookup_swiss_airline_policy.description)pprint(lookup_swiss_airline_policy.invoke("can I cancel my ticket?"))
- 打印工具的元信息(名称、参数、描述)。
- 调用
lookup_swiss_airline_policy.invoke
,检索 “can I cancel my ticket?” 的相关内容并打印结果。
工具函数的执行结果:
运行流程总结
- 加载向量数据库,并初始化嵌入模型。
- 用户输入问题。
- 从数据库中检索与问题相关的文档。
- 将问题和文档内容发送至聊天模型,生成答案。
- 定义工具函数供后续复用。
用途与适用场景
- 用途:实现基于文档的问答系统,用于快速查询特定文档的内容。
- 适用场景:
- 公司政策文档检索(如航空政策)。
- 产品说明文档或技术支持文档查询。
- 法律条款、合同内容等信息的检索与问答。
相关文章:
![](https://i-blog.csdnimg.cn/direct/a704b070dfad4f3fad0eaf504af4130a.png)
用于与多个数据库聊天的智能 SQL 代理问答和 RAG 系统(3) —— 基于 LangChain 框架的文档检索与问答功能以及RAG Tool的使用
介绍基于 LangChain 框架的文档检索与问答功能,目标是通过查询存储的向量数据库(VectorDB),为用户的问题检索相关内容,并生成自然语言的答案。以下是代码逻辑的详细解析: 代码结构与功能 初始化环境与加载…...
![](https://csdnimg.cn/release/blog_editor_html/release2.3.7/ckeditor/plugins/CsdnLink/icons/icon-default.png?t=O83A)
20250110doker学习记录
1.本机创建tts环境。用conda. 0.1安装。我都用的默认,你也可以。我安装过一次,如果修复,后面加 -u bash Anaconda3-2024.10-1-Linux-x86_64.sh等待一会。 (base) ktkt4028:~/Downloads$ conda -V conda 24.9.2学习资源 Conda 常用命令大…...
![](https://www.ngui.cc/images/no-images.jpg)
MPU6050: 卡尔曼滤波, 低通滤波
对于MPU6050(一种集成了三轴加速度计和三轴陀螺仪的惯性测量单元),对加速度值进行卡尔曼滤波,而对角速度进行低通滤波的选择是基于这两种传感器数据的不同特性和应用需求。以下是详细解释: 加速度值与卡尔曼滤波 为什么使用卡尔曼滤波? 噪声抑制: 加速度计信号通常包含…...
![](https://www.ngui.cc/images/no-images.jpg)
C++的标准和C++的编译版本
C的标准和C的编译版本:原理和概念 理解 C标准 和 C编译版本 的关系是学习 C 的一个重要部分。这两者虽然看似相关,但实际上分别涉及了不同的概念和技术。下面将通过层次清晰的解释,帮助新手理解这两个概念的差异、特点及其相互关系。 一、C标…...
![](https://i-blog.csdnimg.cn/direct/3d493da621ab458998514e061468daca.png)
python学习笔记—17—数据容器之字符串
1. 字符串 (1) 字符串能通过下标索引来获取其中的元素 (2) 旧字符串无法修改特定下标的元素 (3) index——查找字符串中任意元素在整个字符串中的起始位置(单个字符或字符串都可以) tmp_str "supercarrydoinb" tmp_position1 tmp_str.index("s") tmp_p…...
![](https://i-blog.csdnimg.cn/direct/65b16edc63464552a6c7e36ec1f7586f.png#pic_center)
UE5 使用内置组件进行网格切割
UE引擎非常强大,直接内置了网格切割功能并封装为蓝图节点,这项功能在UE4中就存在,并且无需使用Chaos等模块。那么就来学习下如何使用内置组件实现网格切割。 1.配置测试用StaticMesh 对于被切割的模型,需要配置一些参数。以UE5…...
![](https://i-blog.csdnimg.cn/direct/47b8739c21a64a5693c12a3a2452334c.png)
51单片机——串口通信(重点)
1、通信 通信的方式可以分为多种,按照数据传送方式可分为串行通信和并行通信; 按照通信的数据同步方式,可分为异步通信和同步通信; 按照数据的传输方向又可分为单工、半双工和全双工通信 1.1 通信速率 衡量通信性能的一个非常…...
![](https://i-blog.csdnimg.cn/direct/2225de68cae34e8b9c57f62fd67cf8d3.gif#pic_center)
Taro+Vue实现图片裁剪组件
cropper-image-taro-vue3 组件库 介绍 cropper-image-taro-vue3 是一个基于 Vue 3 和 Taro 开发的裁剪工具组件,支持图片裁剪、裁剪框拖动、缩放和输出裁剪后的图片。该组件适用于 Vue 3 和 Taro 环境,可以在网页、小程序等平台中使用。 源码 https:…...
![](https://i-blog.csdnimg.cn/direct/7ce845f9d1094f2891ba4d6181ba5005.png)
PHP民宿酒店预订系统小程序源码
🏡民宿酒店预订系统 基于ThinkPHPuniappuView框架精心构建的多门店民宿酒店预订管理系统,能够迅速为您搭建起专属的、功能全面且操作便捷的民宿酒店预订小程序。 该系统不仅涵盖了预订、退房、WIFI连接、用户反馈、周边信息展示等核心功能,更…...
![](https://i-blog.csdnimg.cn/direct/1bdd02513a4c46edafeed1056e3eb2b3.png)
Hadoop3.x 万字解析,从入门到剖析源码
💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长…...
![](https://www.ngui.cc/images/no-images.jpg)
VUE3 常用的组件介绍
Vue 组件简介 Vue 组件是构建 Vue 应用程序的核心部分,组件帮助我们将 UI 分解为独立的、可复用的块,每个组件都有自己的状态和行为。Vue 组件通常由模板、脚本和样式组成。组件的脚本部分包含了各种配置选项,用于定义组件的逻辑和功能。 组…...
![](https://www.ngui.cc/images/no-images.jpg)
deepin-Wine 运行器合并打包器和添加从镜像提取 DLL 的功能
Wine 运行器是一个图形化工具,旨在简化 Wine 环境的管理和使用。它不仅提供了运行和管理 Wine 容器的功能,还增加了打包器和从镜像提取 DLL 的功能。以下是该工具的详细介绍和使用方法。 一、工具概述 Wine 运行器是一个使用 Python3 的 tkinter 构建的图…...
![](https://www.ngui.cc/images/no-images.jpg)
[大模型]本地离线运行openwebui+ollama容器化部署
本地离线运行Openweb-ui ollama容器化部署 说明安装internet操作内网操作问题线程启动错误最终命令总结说明 最近公司有一个在内网部署一个离线大模型的需求,网络是离线状态,服务器有A100GPU,一开始是想折腾开源chatGML4大模型,因为使用过gml3,所以想着部署gml4应该不难。…...
![](https://i-blog.csdnimg.cn/direct/48db69ec3d6b4ed3a421d4b9384151c5.png)
再次梳理ISP的大致流程
前言: 随着智能手机的普及,相机与我们的生活越来越紧密相关。在日常生活中,我们只需要轻轻按下手机上的拍照按钮,就能记录下美好时刻。那么问题来了:从我们指尖按下拍照按钮到一张色彩丰富的照片呈现在我们面前&#x…...
![](https://i-blog.csdnimg.cn/direct/4b361f886d6847ff9ec173bd76c64917.png)
HBuilderX打包ios保姆式教程
1、登录苹果开发者后台并登录已认证开发者账号ID Sign In - Apple 2、创建标识符(App ID)、证书,描述文件 3、首先创建标识符,用于新建App应用 3-1、App的话直接选择第一个App IDs,点击右上角继续 3-2、选择App&#x…...
![](https://www.ngui.cc/images/no-images.jpg)
《解锁鸿蒙系统AI能力,开启智能应用开发新时代》
在当今科技飞速发展的时代,鸿蒙系统以其独特的分布式架构和强大的AI能力,为开发者们带来了前所未有的机遇。本文将深入探讨开发者如何利用鸿蒙系统的AI能力开发更智能的应用,开启智能应用开发的新时代。 鸿蒙系统构筑了15系统级的AI能力&…...
![](https://i-blog.csdnimg.cn/direct/604370216fb04cff8f76e070b89aebf9.jpeg)
rhcsa练习(3)
1 、创建文件命令练习: ( 1 ) 在 / 目录下创建一个临时目录 test ; mkdir /test ( 2 )在临时目录 test 下创建五个文件,文件名分别为 passwd , group , bashrc &#x…...
![](https://i-blog.csdnimg.cn/direct/3c19f50684d440f0bca76d073fcf2fd3.png)
科研绘图系列:R语言绘制Y轴截断分组柱状图(y-axis break bar plot)
禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍特点意义加载R包数据下载导入数据数据预处理画图输出总结系统信息介绍 Y轴截断分组柱状图是一种特殊的柱状图,其特点是Y轴的刻度被截断,即在某个范围内省略了部分刻度。这种图表…...
![](https://www.ngui.cc/images/no-images.jpg)
跳出技术陷阱,探索财富自由的多元路径
自古以来,我们常听到这样一句话:“一技在手,吃穿不愁”。这种理念在以往的时代背景下,确实为许多人提供了稳定的生计保障。然而,在信息爆炸、产能过剩的今天,这种固守一技之长的观念正逐渐显露出其不足&…...
![](https://i-blog.csdnimg.cn/blog_migrate/45f5aa2e88f147453c0764b3e7543f63.jpeg)
qml SpringAnimation详解
1. 概述 SpringAnimation 是 Qt Quick 中用于模拟弹簧效果的动画类。它通过模拟物体在弹簧力作用下的反应,产生一种振荡的动画效果,常用于模拟具有自然回弹、弹性和振动的动态行为。这种动画效果在 UI 中广泛应用,特别是在拖动、拉伸、回弹等…...
![](https://i-blog.csdnimg.cn/direct/b5fea6b0fd9c470381685bfa7e1fa1ec.png)
中学综合素质笔记3
第一章职业理念 第三节 教师观 考情提示: 单选题材料分析题 学习要求: 理解、 识记、 运用 (一)教师职业角色的转变(单选材料分析) 从教师与学生的关系看——对学生 新课程要求教师应该是学生学习的引…...
![](https://i-blog.csdnimg.cn/direct/df2999cc3b88489596df5ca33f4f3d84.png)
uniapp vue2版本如何设置i18n
如何设置i18n在该软件设置过语言的情况下优先选择所设置语言,在没有设置的情况下,获取本系统默认语言就,将系统默认语言设置为当前选择语言。 1、下载依赖: npm install vue-i18n --save 2、创建相关文件(在最外层&…...
![](https://i-blog.csdnimg.cn/direct/4e264024682c48c9a6d0f42585d50ccb.png)
【踩坑记录❌】ubuntu 安装 NVIDIA 显卡驱动不要 autoinstall
背景 在 ubuntu 22.04 安装 NVIDIA 显卡驱动参考了 博客 的步骤进行,发现有很多评论也出现了无法联网的情况 后续解决 尝试了网卡驱动下载的各类方法,安装驱动的过程中又缺失内核头、 gcc 编译器等文件。由于没有网络,每次缺失的文件只能从…...
![](https://i-blog.csdnimg.cn/direct/ff9de181b3df46179b1d7e02291e32af.png)
vue3 + ts + element-plus(el-upload + vuedraggable实现上传OSS并排序)
这里创建项目就不多说了 安装element-plus npm install element-plus 安装vuedraggable npm install vuedraggable 安装ali-oss npm install ali-oss 这里是封装一下:在components创建文件夹jc-upload>jc-upload.vue 在封装的过程中遇到了一个问题就是dr…...
![](https://www.ngui.cc/images/no-images.jpg)
SQL开窗函数相关的面试题和答案
基本排序与分组问题 题目:有学生成绩表tb_score,包含字段SNO(学号)、SCLASS(班级)、CHINESE(语文成绩)、ENGLISH(英语成绩)、ARITH(数学成绩&…...
![](https://www.ngui.cc/images/no-images.jpg)
【数据分析(一)】初探 Numpy
目录 前言1. 一维 array 的生成2. 一维 array 的基本操作2.1. 查看属性2.2. 花式索引2.3. 条件筛查2.4. 数据统计 3. n 维 array 的生成4. n 维 array 的基本操作4.1. 查看属性4.2. 查询和切片4.3. 花式索引4.4. 矩阵 前言 Numpy是Python的常用开源数值计算扩展库,用…...
![](https://i-blog.csdnimg.cn/direct/08b7f8dcc48a4cdcba66f8df4055f22e.png)
国产化ARM平台-飞腾派开发板硬件与系统
国产化ARM平台-飞腾派开发板硬件与系统 一、飞腾E2000处理器 飞腾腾珑E2000系列包括E2000Q、E2000D、E2000S三个系列,芯片集成飞腾自主研发的高能效和低功耗处理器核,E2000Q集成2个FTC664和2个FTC310处理器核,E2000D集成2个FTC310处理器核&…...
![](https://www.ngui.cc/images/no-images.jpg)
[ LeetCode 75 ] 283 移动零(JavaScript)
283 移动零 题目描述解题思路步骤解析时间和空间复杂度代码实现 题目描述 LeetCode 283 移动零 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行操…...
![](https://www.ngui.cc/images/no-images.jpg)
前端学习汇总
一、打包工具 1.1、vite vite:vite -- 开发环境 热更新_vite 热更新-CSDN博客 1.2、webpack 常用loader:webpack基础---常用loader_webpack 常用loader-CSDN博客 loader:webpack4和webpack5区别1---loader_webpack4与webpack5处理图片的…...
![](https://i-blog.csdnimg.cn/img_convert/42a3026ae0368fdbba0043fda4973d4a.jpeg)
蓝笔科技 | 超凡妈妈赋能计划-【北大生涯规划师特别企划】
12月27日,“超凡妈妈赋能计划-北大生涯规划师特别企划”在广州正式启动,据了解,本次超凡妈妈赋能计划是由广州蓝笔科技信息有限公司牵头发起并主办,中国关心下一代健康体育基金会作为公益支持单位,北京大学作为项目技术…...
![](https://img-blog.csdnimg.cn/img_convert/9ead19a502f826db44aa0b62f2e33a42.png)
丹阳网站建设效果/买链接
一缕风华晚间充电人人都是架构师生活本来沉闷无味 但跑起来就有风~2020.08.20 | 星期四 星河晴朗 先来听首歌吧过去二十年来,编程语言得到飞速发展,作为软件的重中之重架构,它也在发生巨大的改变,本篇讲解了架构是如何演化而来、高…...
![](/images/no-images.jpg)
如何做自己公司网站/wix网站制作
Java正则表达式应用总结一、概述正则表达式是Java处理字符串、文本的重要工具。Java对正则表达式的处理集中在以下两个两个类:java.util.regex.Matcher 模式类:用来表示一个编译过的正则表达式。java.util.regex.Pattern 匹配类:用模式匹…...
![](/images/no-images.jpg)
中国建设银行网站首页企业网银/查淘宝关键词排名软件有哪些
刚刚研究了Kmeans。Kmeans是一种十分简单的聚类算法。可是他十分依赖于用户最初给定的k值。它无法发现随意形状和大小的簇。最适合于发现球状簇。他的时间复杂度为O(tkn)。kmeans算法有两个核心点:计算距离的公式&推断迭代停止的条件。一般距採用欧式距离等能够…...
![](/images/no-images.jpg)
动态网站和响应式网站/yandex搜索引擎
# 软件架构风格 软件架构设计的一个核心问题是能否使用重复的架构模式,即能否达到架构级的软件重用。 也就是说,能否在不同的软件系统中,使用同一架构。 软件架构风格是描述某一特定应用领域中系统组织方式的惯用模式。 架构风格反映了领域中…...
![](/images/no-images.jpg)
wordpress怎样给目录增加/电脑培训网上课程
Worklog: WL#6204 这是MySQL8.0修复的上古bug之一,在2003年由Percona的CEO(当时应该还没Percona吧)提出的bug#199,光看这bug号就扑面而来一股上古时代的沧桑气息。 问题的本质在于InnoDB初始化AUTO_INCREMENT的方式,在…...
![](https://img-blog.csdnimg.cn/20191222141219580.png)
wordpress 繁体转简/怎么做网站宣传
1、什么是Nginx Nginx是一个高性能的反向代理服务器,他是一个非常高效的反向代理、负载平衡,他可以处理2-3万并发连接数,官方监测能支持5万并发 2、为什么要用Nginx 跨平台、配置简单、方向代理、高并发连接:处理2-3万并发连接…...