当前位置：首页 > news >正文

数据库管理-第150期 Oracle Vector DB AI-02（20240212）

news 2026/2/8 6:51:25

数据库管理150期 2024-02-12

数据库管理-第150期 Oracle Vector DB & AI-02（20240212）
- 1 LLM
- 2 LLM面临的挑战
- 3 RAG
- 4 向量数据库+LLM
- 总结

数据库管理-第150期 Oracle Vector DB & AI-02（20240212）

作者：胖头鱼的鱼缸（尹海文）
Oracle ACE Associate: Database（Oracle与MySQL）
网思科技 DBA总监
10年数据库行业经验，现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家，ITPUB认证专家，OCM讲师
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号，非著名社恐（社交恐怖分子）
公众号：胖头鱼的鱼缸；CSDN：胖头鱼的鱼缸（尹海文）；墨天轮：胖头鱼的鱼缸；ITPUB：yhw1809。
除授权转载并标明出处外，均为“非法”抄袭。

本来这一期是昨天要写的，但是昨天睡了很久，加上薛首席携老婆孩子来成都旅游，出去接待了一下，因此没有写。

首席还是那么帅气，今天继续，讲讲LLM。

1 LLM

Large Language Model，大语言模型，是生成式AI的一个类型，是一种人工智能模型，旨在理解和生成人类语言。它们在大量的文本数据上进行训练，单一模型可以执行广泛的任务，包括词法分析、文本分类、命名实体识别、关键词提取、翻译、情感分析、摘要、对话、写作文、写代码等。

2 LLM面临的挑战

大预言模型面临的最大挑战即是幻觉（hallucinations）和过时信息，LLM训练集来自互联网的通用数据，基于某个时间点的数据快照。因此会出现以下一些问题：

结果正确性不可控：提示不精准或不完善（即互联网通用数据中存在大量不精准甚是是错的的内容）
结果是过时的信息：模型更新成本高（即LLM训练出结果即过时，因为互联网通用数据是实时变化的）
结果是通用信息：难以与企业或某领域特定专业数据相关（一些特殊专用场景无法使用通用信息里匹配，需要专业信息加持）

3 RAG

Retrieval-Augmented Generation，检索式增强生成方法，从企业专业知识库中检索与请求最相关的信息，并与用户请求捆绑一起作为提示，发送给LLM以获得响应。

同时，包括AI聊天等功能，也可以创建专用的知识库，来增加聊天的能力，比如更强的上下文理解能力，或者更平稳柔和倾向于人类的语言沟通。

4 向量数据库+LLM

RAG让LLM不用重新训练就能够获取最新的信息，基于RAG产生更可靠更专业的输出。实施RAG需要向量数据库等技术，这些技术可以快速嵌入新数据，快速搜索数据并输入给LLM。

幻觉问题：向量数据库可以为LLM创建一个长期记忆的数据库，为LLM提供可靠的信息源。LLM以此信息作为基础，从而减少模型产生幻觉的可能性。
专业领域：通过将权威、可信的信息转换为向量，并将它们加载到向量数据库中。用企业相关特定内容增强提示，以使LLM产生更专业的答案。
令牌（Token）限制：通过使用最相关的内容避免超出 LLM 令牌限制。（访问安全）
数据安全：避免使用敏感的私域客户数据进行LLM训练和微调。
知识更新：向量数据库作为LLM的实时更新的知识库。
成本：比微调LLM便宜，微调LLM更新模型费用可能很高。
缓存：缓存以前的 LLM 提示/回答以提高性能并降低成本。

总结

本期简单讲解了一下LLM的相关信息，下一期将正式进入Oracle Vector DB的相关内容。
老规矩，知道写了些啥。

数据库管理-第150期 Oracle Vector DB AI-02（20240212）

数据库管理150期 2024-02-12

数据库管理-第150期 Oracle Vector DB & AI-02（20240212）

1 LLM

2 LLM面临的挑战

3 RAG

4 向量数据库+LLM

总结

相关文章：

数据库管理-第150期 Oracle Vector DB AI-02（20240212）

MySQL双写机制

uniapp的配置和使用

【ES】--Elasticsearch的分词器深度研究

【Langchain Agent研究】SalesGPT项目介绍（三）

Java安全 URLDNS链分析

【网站项目】026校园美食交流系统

使用raw.gitmirror.com替换raw.githubusercontent.com以解决brew upgrade python@3.12慢的问题

深度学习的进展

[高性能] - 缓存架构

django实现外键

飞天使-k8s知识点14-kubernetes散装知识点3-Service与Ingress服务发现控制器

任务调度

深刻反思现代化进程：20世纪与21世纪的比较分析及东西方思想家的贡献

【FTP讲解】

java面试题整理

探索NLP中的N-grams：理解，应用与优化

JAVA-数组乱序

Stable Diffusion 模型下载：majicMIX reverie 麦橘梦幻

Java开发四则运算-使用递归和解释器模式

Docker 离线安装指南

Flask RESTful 示例

VB.net复制Ntag213卡写入UID

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

[10-3]软件I2C读写MPU6050 江协科技学习笔记（16个知识点）

在Ubuntu中设置开机自动运行（sudo）指令的指南

IoT/HCIP实验-3/LiteOS操作系统内核实验(任务、内存、信号量、CMSIS..)

用docker来安装部署freeswitch记录

网络编程（UDP编程）

Element Plus 表单(el-form)中关于正整数输入的校验规则