网站域名隐藏咋么做/策划营销
最近几个月
随着大语言模型的持续火爆
利用大模型来构建AI智能体的研究呢
也陆续进入了人们的视野
AI智能体这个概念呢
也逐渐的流行开来
先是斯坦福大学谷歌的研究者们
成功的构建了一个虚拟小镇
小镇上的居民呢不再是人
而是25个AI的智能体
他们的行为呢
比人类角色扮演更加真实
甚至还举办了一场情人节的派对
随后
商汤清华等机构提出了能够自主学习
解决任务的通才AI智能体GITM
在我的世界中比以往所有的智能体
都更有优秀的表现
同一时间
英伟达开元的Voyager
也给AI圈带来了不小的震撼
作为一个大模型驱动
可以终身学习的游戏智能体
Voyager在我的世界中玩出了很高的水平
这些AI智能体的先后涌现
甚至让人认为
是未来通用人工智能AGI的雏形
很多AI领域的大佬和科技巨头
对AI智能体的发展
都产生了极大的兴趣
并寄予了厚望
今年年初回归OpenAI的安德烈卡帕西
在OpenAI的黑客马拉松活动上就透露
每当有新的AI智能体论文出现的时候
OpenAI内部呢就会感到非常的有兴趣
并且认真的进行讨论
那么我们不禁要问
到底什么是AI智能体
它由哪些部分组成
它的神奇之处又具体表现在哪些方面呢
近日OpenAI安全系统的负责人Lilian Weng
就写了一篇关于AI智能体的博客
首先简单介绍一下作者啊
Lilian Weng是2018年加入的OpenAI
在GPT4项目中
主要参与一训练强化学习和对齐
模型安全等方面的工作
那在她的这篇博客文章中呢
她就认为AI智能体的核心驱动力是大语言模型
而规划planning
记忆memory和工具使用Tool use
是实现它的三个关键组件
Lilian Weng对每个组件都展开了详细的剖析
并且提供了一些案例的研究
比如说科学发现智能体
生成式智能体模拟和概念验证的示例
对于AI智能体未来将面临哪些挑战呢
他也给出了自己的观点
我对文章的内容呢做了一些提炼
在这里跟大家分享一下
有兴趣的同学
可以去详细阅读一下原文
首先Lilian介绍了一下智能体系统的概念
在大语言模型赋能的自主智能体系统中
大语言模型充当了智能体的大脑
它有三个关键的组件
首先是规划
规划呢又分为两个部分
一个是子目标和分解
智能体呢可以将大型的任务
分解为更小可管理的子目标
从而高效的处理复杂的任务
第二个是反思和完善
智能体可以对过去的行为
展开自我批评和自我反思
从错误中吸取教训
并针对未来的步骤进行完善
提高最终结果的质量
其次的组件是记忆
分为短期记忆和长期记忆
所有的上下文学习
都是利用了模型的短期记忆来学习
而通常利用外部向量存储和快速检索的能力
为智能体提供长时间保留和回忆记忆的能力
最后呢是工具的使用
智能体呢可以学会调用外部的API
来获取模型权重中缺失的额外信息
这些信息呢
通常在预训练之后很难改变
包括当前的信息代码执行能力
以及对专有信息源的访问等等
随后呢作者分别详细讲解了这三个关键的组件
首先是规划
我们知道一项复杂的任务
通常会涉及到许多的步骤
智能体必须了解任务是什么并提前进行规划
那么呢这就会涉及到任务的分解
以及相关的技术
首先呢是思维链COT
它已经成为了增强复杂任务上模型性能的标准提示技术
在实现过程中
模型被指示一步一步的思考
从而利用更多的测试时间计算
将困难任务分解为更小更简单的步骤
COT呢可以将大型的任务
转化为多个可管理的小任务
并解释清楚模型的思维过程
其次呢是思维树TOT
他通过在每一步探索多种推理可能性来扩展了COT
首先它会将问题分解为多个思考步骤
并且在每个步骤中生成多个思考
创建一种树形的结构
搜索过程可以是广度优先搜索BFS
或者是深度优先搜索DFS
其中呢每个状态由分类器
或者是多数的投票
来进行评估
具体来说
就是任务分解过程中
可以通过以下三种方式来完成
第一种方式
是基于大语言模型的简单提示
比如XYZ的步骤是什么
实现XYZ的指目标是什么
第二种是使用特定于任务的指示
比如说写一个故事的大纲
或者是第三种人工输入
另一种截然不同的方法是使用LLM+p
它靠外部的经典规划器
来进行长期的规划
这个方法呢会利用规划领域定义语言PDDL
作为描述规划问题的中间接口
在这个过程中
大语言模型会首先将问题转化为problem PDDL
然后请求经典的规划器
基于现有的Domain PDDL
生成PDDL规划
最后再将PDDL规划
转换回自然的语言
本质上规划步骤被外包
给了外部的工具
并且假设可以使用特定领域的PDDL
和合适的规划器
这在某些机器人的设置中很常见
但是在许多其他领域并不常见
在规划过程中自我反思self reflection
它允许自主智能体通过完善以往的行动决策
和纠正以往的错误来迭代改进
因而呢会在出现试错的这个现实世界任务
中
发挥至关重要的作用
ReAct方法
能够通过将动作空间
扩展为
一个任务特定的离散动作
和语言空间的组合
从而将推理和动作集成在大语言模型中
离散动作
使得大语言模型能够与环境交互
例如使用维基百科的搜索API
而语言空间促使大语言模型
以自然语言的方式来生成推理轨迹
reflection框架
则为智能体
配备了动态记忆和自我反思的能力
提高了推理的技能
它有一个标准的强化学习设置
其中奖励模型
提供了简单的二元奖励
而动作空间
则遵循了react中的设置
Chain of Hindsight(CoH)
这种方式鼓励模型通过显式地呈现
一系列过去的输出
来改进它自己的输出
其中每个输出呢都带有了反馈的注释
为了避免过拟合
CoH添加了正则化项
来最大化的预训练数据集的对数似然
同时呢为了避免捷径和复制
研究者们在训练过程中
随机屏蔽了0%到5%的过去的token
COH的思路
是呈现上下文中连续改进输出的历史
并且训练模型产生更好的输出
算法蒸馏AD
它是将相同的思路
应用到了强化学习任务中的跨情节轨迹
尽管AD算法仅仅使用了离线的强化学习
但是它的性能接近于RL^2
的在线强化学习算法
并且呢学习速度比专家蒸馏
和源策略算法要快得多
其次呢是记忆组件
(人类)记忆分为三种类型
第一种呢是感知记忆
第二种呢是短期记忆STM
或者称为工作记忆
第三种呢就是长期记忆LTM
其中感知记忆是记忆的早期阶段
它能够在原始刺激
结束后
保持对感官信息
比如说视觉听觉等的印象
感知记忆呢通常只能持续几秒钟
它的子类包括图像记忆
回声记忆
和触摸记忆
而短期记忆STM或者称为工作记忆
存储着我们目前所知道的信息
以及执行复杂认知任务
比如学习和推理所需要的信息
一般来讲呢短期记忆可以持续20-30秒
而长期计可以将信息储存很长的时间
从几天到几十年不等
它的存储容量呢基本上是无限的
长期记忆呢有两种子类别
分别是显式的陈述性记忆
和隐式的程序性记忆
前者是对事实和事件的记忆
指的是那些可以有意识的回忆起来的记忆
包括记忆事件和经过的情景记忆
以及记忆事实和概念的语义记忆
后者的记忆是无意识
的
涉及到自主执行的技能和习惯
比如说骑自行车或者在键盘上打字
参考人类记忆的分类
呢
我们可以得到几种映射关系
感知记忆
可以作为原始输入的学习嵌入表示
短期记忆作为上下文学习
由于受到Transformer有限上下文窗口长度
的限制
短期记忆是短暂而且有限的
长期记忆作为外部的向量存储
智能体可以查询快速检索从而进行访问
外部记忆可以缓解注意力的一些限制
为了更好的处理外部记忆
一个常见的做法是
将信息的嵌入表示
保存到一个向量存储数据库
中
这个数据库呢可以支持快速的最大内积搜索MIPS
为了优化检索的速度
研究者经常使用的方法是近似最近邻ANN算法
在加速MIPS中
经常会用到的ANN算法包括
局部敏感哈希LSH
近似最近邻ANNOY
分层可导小世界HNSW
Facebook AI团队开源的库FAISS
以及可扩展最近邻ScaNN算法
更多的MIPS算法
和性能的比较呢
可以在ann-benchmarks.com
中查看
第三个关键组件呢是使用工具
使用工具是人类的一个显著特点
我们创造修改和利用外部的物体
来探知和认知现实世界
类似的
给大语言模型配备外部的工具
可以大幅的扩展模型的能力
MRKL
是一种用于自主智能体的神经符号架构
命名来源于模块化推理modular reasoning
知识knowledge和语言language
这三者的简称
每个MRKL系统呢都包含一些专家模块
通用的大语言模型作为一个路由器
负责将查询
路由到最合适的专家模块
这些模块呢可以是神经网络
的
例如深度学习模型
也可以是符号的
例如数学计算器货币转换器天气的API
MRKL的研究团队使用数学计算
进行实验
实验结果证实
当外部符号工具
能够可靠的工作时
知道何时和如何使用这些工具是至关重要的
而这个是由大语言模型的能力决定的
ChatGPT的插件
和OpenAI的API函数调用
就是大语言模型使用工具
在增强能力的最好实例
工具API的集合
可以是由其他开发者提供的插件
或者是自定义的函数调用
HuggingGPT
则是一个利用ChatGPT
作为任务规划器的框架
根据模型的描述
来选择HuggingFace平台
中可以使用的模型
并且根据执行的结果归纳总结出响应
HuggingGPT系统由四个阶段组成
第一个任务规划阶段
大语言模型作为大脑
将用户请求
解析为多个任务
每个任务呢有四个关联的属性
分别是任务类型
任务ID
依赖项
和参数
研究团队使用了少量的例子
来指导大语言模型进行任务解析和规划
第二个模型选择阶段
大语言模型会从一个模型列表
中选择模型
将任务分配给专家模型
由于上下文长度有限
就需要进行基于任务类型的过滤
第三个就是任务的执行阶段
专家模型执行具体的任务
并且记录任务结果
第四个呢是响应的生成阶段
大语言模型接收执行的结果
并向用户提供总体的结果
HuggingGPT在实际使用中呢
还需要解决几个挑战
第一个呢就是需要提高效率
因为大语言模型的推理以及与其他模型的交互
都会减慢进程
第二 它依赖一个长的上下文窗口
来沟通复杂的任务内容
第三 提高大语言模型输出
和外部模型服务的稳定性
接下来Lilian还介绍了一个评估工具
增强型大语言模型性能的基准API Bank
它包含了53个常用的API工具
一个完整的工具增强型大语言模型工作流
以及涉及568个API调用
的264个已注释的对话
API Bank基准
中可以选择的API相当的多样化
包括搜索引擎计算器
日历查询
智能家具控制
日程管理
等等
大语言模型首先可以通过API搜索引擎
找到合适的API进行调用
然后使用相关的文档
来调用API
在API bank的工作流中
大语言模型需要做出一些决定
包括是否需要调用API
确定要调用的正确的API
以及基于API结果的响应
这个基准在三个层次上
评估了智能体的工具使用能力
包括调用API的能力
检索API能力
以及检索和调用之外规划API的能力
考虑到不明确的用户需求
模型可能会需要进行多次的API调用
来解决实际的问题
随后Lilian介绍了一个案例
一个用来进行科学发现的智能体ChemCrow
它是一个由大语言模型设计的化学智能体
能够完成有机合成
药物发现
和材料设计
方面的任务
通过整合17种专家设计的工具
ChemCrow提高了大语言模型在化学方面的性能
并衍生出了新的能力
有趣的是呢
尽管基于大语言模型的评估结果得出的结论是
GPT-4
和ChemCrow
的性能几乎相当
但是经过专家人工的评估表明
ChemCrow
在很大程度上优于GPT4
Lilian还提到了生成式智能体
的概念
它能够将大语言模型
与记忆、规划和反射机制
相结合
使得智能体能够根据过去的经验做出反应
并且与其他的智能体进行交互
有关智能体大家应该最熟悉的例子就是AutoGPT
了
有了它人类无需插手
AutoGPT就能够自主完成任务
具体来说呢
AutoGPT就相当于给基于GPT的模型
有了一个内存
和身体
有了它你就可以把一项任务交给AI的智能体
让它自主的提出一个计划
然后去执行这个计划
此外呢它还具有互联网访问
长期和短期的内存管理
用于文本生成的GPT4实例
以及使用GPT3.5进行文件存储
和生成摘要等等功能
此外
作者还列举了GPT-Engineer
(口误)这个项目
和代码生成类的工具差不多
能够根据提示生成一整个代码库
最后呢作者也提出了
基于大语言模型构建智能体的一些限制
包括有限的上下文长度
长期规划
和任务分解
还要面临的挑战
以及自然语言接口
的可靠性
好了以上就是Lilian Weng对AI智能体的介绍和分析
完整的内容大家可以去自己阅读一下原文
里边还有一些数学公式和伪代码
可以供大家参考
相关文章:

AI智能体的介绍
最近几个月 随着大语言模型的持续火爆 利用大模型来构建AI智能体的研究呢 也陆续进入了人们的视野 AI智能体这个概念呢 也逐渐的流行开来 先是斯坦福大学谷歌的研究者们 成功的构建了一个虚拟小镇 小镇上的居民呢不再是人 而是25个AI的智能体 他们的行为呢 比人类角…...

Java设计模式-单例模式(Singleton)
Java中实现单例模式有几种不同的方式,每种方式都有其特点和适用场景。下面是两种常用的实现方式:懒汉式和饿汉式。 懒汉式(线程安全) 懒汉式单例是指在第一次被引用时才会创建实例。为了确保线程安全,可以使用同步方法或同步块。 public class SingletonLazy {private sta…...

若依vue如何展示一个HTML页面(或者展示Markdown文档)
一. 前言 ⚠ 本文是展示Markdown的方法,不能直接前端编辑Markdown文档. 二. 准备部分 用Typora编辑器打开需要导出html页面,我这里使用Typora来导出 1. 先将md文件导出成html 2. 将导出好的文件放在若依vue的pubilc下(文件可以是中文) 三. 代码部分 1.使用v-html来展示HT…...

优化for循环(js的问题)
性能优化 var array [];for (let index 0; index < array.length; index) {// do something }// 优化后 for (let index 0, len array.length; index < len; index) {// do something } 算法优化 // 求和:1 2 3 4 ... 100 var sum 0; for (let i …...

如何更好的去理解源码
前言 这篇文章我准备来聊一聊如何去阅读开源项目的源码。 在聊如何去阅读源码之前,先来简单说一下为什么要去阅读源码,大致可分为以下几点原因: 最直接的原因,就是面试需要,面试喜欢问源码,读完源码才可以…...

c# opencv 获取多边形中心点
在C#中使用OpenCV获取多边形的中心点,可以按照以下步骤进行: 首先,你需要找到图像中的轮廓。这可以通过FindContours方法实现: using OpenCvSharp;Mat src new Mat("your_image_path", ImreadModes.Grayscale); Mat …...

Redis数据一致解决方案
文章目录 前言技术积累查询缓存业务流程更新缓存业务流程 更新缓存问题解决方案写在最后 前言 当前的应用服务很多都有着高并发的业务场景,对于高并发的解决方案一般会用到缓存来降低数据库压力,并且还能够提高系统性能减少请求耗时,比如我们…...

安捷伦DSOX2024A示波器
参考波形 示波器的非易失参考波形存储器可以存储两个波形。比较这些参考波形与实时波形,并对已存储数据进行后分析和测量。您也可将波形数据存储到移动USB 存储器设备。这些数据还能调用到示波器的两个参考存储器的其中一个,进行全面的波形测量和分析。为…...

Leetcode算法系列| 4. 寻找两个正序数组的中位数
目录 1.题目2.题解C# 解法一:合并List根据长度找中位数C# 解法二:归并排序后根据长度找中位数C# 解法三:方法二的优化,不真实添加到listC# 解法四:第k小数C# 解法五:从中位数的概念定义入手 1.题目 给定两个…...

Java整合APNS推送消息-IOS-APP(基于.p12推送证书)
推送整体流程 1.在开发者中心申请对应的证书(我用的是.p12文件) 2.苹果手机用户注册到APNS,APNS将注册的token返回给APP(服务端接收使用)。 3.后台服务连接APNS,获取连接对象 4.后台服务构建消息载体 5.后台…...

C语言strcpy函数用法
C语言strcpy函数用法 大家好,我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天,让我们一起深入了解C语言中的strcpy函数,这是一个在字符串处理中非…...

汽车服务品牌网站建设的作用是什么
汽车服务涵盖多个层面,在保修维护这一块更是精准到了车内车外,无论是品牌商还是市场中各维修部,都能给到车辆很好的维修养护服务。如今车辆的人均拥有量已经非常高,也因此市场中围绕汽车相关的从业者也比较多。 首先就是拓客引流…...

【iOS】UICollectionView
文章目录 前言一、实现简单九宫格布局二、UICollectionView中的常用方法和属性1.UICollectionViewFlowLayout相关属性2.UICollectionView相关属性 三、协议和代理方法:四、九宫格式的布局进行升级五、实现瀑布流布局实现思路实现原理代码调用顺序实现步骤实现效果 总…...

Linux poll 和 select 机制
poll select 介绍 使用非阻塞 I/O 的应用程序常常使用 poll, select, 和 epoll 系统调用. poll, select 和 epoll 本质上有相同的功能: 每个允许一个进程来决定它是否可读或者写一个 或多个文件而不阻塞. 这些调用也可阻塞进程直到任何一个给定集合的文件描述符可用来 读或写.…...

【JVM基础】 JVM 如何加载一个类以及类加载机制
文章目录 1、什么时候一个类会被加载?1、包含 main 方法的主类2、非 包含 main 方法的主类,什么时候去加载? 3、类加载器如何加载一个类?1、验证阶段:2、准备阶段:3、解析阶段:4、初始化&#x…...

Android Studio使用Genymotion
1. Genymotion介绍 GenyMotion速度之快令人发指,模拟效果堪比真机调试,支持绝大部分的模拟器功能,甚至包括语音,Google Now,支持eclipse, android studio。非常适合用来开发和演示效果。 2. Genymotion下载 Genymotio…...

Mysql sql_mode参数配置
今天在使用数据库查询时使用了Group语句,遇到问题: SELECT t1.UnderlyingInstrumentID, t2.* FROM t_OptionInstrument t1 LEFT JOIN t_Instrument t2 ON t2.InstrumentID t1.UnderlyingInstrumentID GROUP BY t1.UnderlyingInstrumentID > 1055 - …...

SpringIOC之AbstractMessageSource
博主介绍:✌全网粉丝5W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验…...

详解Vue3中的基础路由和动态路由
本文主要介绍Vue3中的基础路由和动态路由。 目录 一、基础路由二、动态路由 Vue3中的路由使用的是Vue Router库,它是一个官方提供的用于实现应用程序导航的工具。Vue Router在Vue.js的核心库上提供了路由的功能,使得我们可以在单页应用中实现页面的切换、…...

Mysql四种事务隔离级别(简易理解)
读未提交:简单理解就是读到没有提交事务的执行结果;读已提交:简单理解就是只能读到已经提交的事务执行结果;可重复读:简单理解就是确保并发读取数据库时,读到的数据一致,这是mysql默认隔离级别&…...

react中使用redux最简单最方便的方式,配合rematch简化操作,5分钟学会
react中使用状态管理的方式也很多,比如redux和mobx等,今天这一片就讲一下redux的入门到熟练使用,主要是要理解它redux的组成有哪些,到怎么创建,和组建中怎么使用三个问题。这里先放上官网文档,不理解的地方…...

vmware安装中标麒麟高级服务器操作系统软件 V7.0操作系统
vmware安装中标麒麟高级服务器操作系统软件 V7.0操作系统 1、下载中标麒麟高级服务器操作系统软件 V7.0镜像2、安装中标麒麟高级服务器操作系统软件 V7.0操作系统 1、下载中标麒麟高级服务器操作系统软件 V7.0镜像 官方提供使用通道 访问官网 链接: https://www.kylinos.cn/ 下…...

OpenCV | 霍夫变换:以车道线检测为例
霍夫变换 霍夫变换只能灰度图,彩色图会报错 lines cv2.HoughLinesP(edge_img,1,np.pi/180,15,minLineLength40,maxLineGap20) 参数1:要检测的图片矩阵参数2:距离r的精度,值越大,考虑越多的线参数3:距离…...

【C#与Redis】--目录
1. 介绍 2. Redis 数据结构 3. Redis 命令 3.1 基本命令 3.2 字符串命令 3.3 哈希命令 3.4 列表命令 3.5 集合命令 3.6 有序集合命令 4. C# 操作 Redis 4.1 使用 Redis 库 4.2 连接 Redis 服务器 4.3 操作 Redis 数据结构 4.5 执行 Redis 命令 5. 高级主题 5.1 Redis 事…...

html旋转相册
一、实验题目 做一个旋转的3d相册,当鼠标停留在相册时,相册向四面散开 二、实验代码 <!DOCTYPE html> <html lang"zh"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" con…...

Plantuml之对象图语法介绍(十九)
简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…...

深度学习(八):bert理解之transformer
1.主要结构 transformer 是一种深度学习模型,主要用于处理序列数据,如自然语言处理任务。它在 2017 年由 Vaswani 等人在论文 “Attention is All You Need” 中提出。 Transformer 的主要特点是它完全放弃了传统的循环神经网络(RNN&#x…...

R语言中的函数28:Reduce(), Filter(), Find(), Map(), Negate(), Position()
文章目录 介绍Reduce()实例 Filter()实例 Find()实例 Map()实例 Negate()实例 Position()实例 介绍 R语言中的Reduce(), Filter(), Find(), Map(), Negate(), Position()是base包中的一些高级函数。随后,很多包也给这些函数提供了更多的扩展。 Reduce() 该函数根…...

RTP/RTCP/RTSP/SIP/SDP/RTMP对比
RTP(Real-time Transport Protocol)是一种用于实时传输音频和视频数据的协议。它位于传输层和应用层之间,主要负责对媒体数据进行分包、传输和定时。 RTCP(Real-Time Control Protocol)是 RTP 的控制协议,…...

Centos安装vsftpd:centos配置vsftpd,ftp报200和227错误
一、centos下载安装vsftpd(root权限) 1、下载安装 yum -y install vsftpd 2、vsftpd的配置文件 /etc/vsftpd.conf 3、备份原来的配置文件 sudo cp /etc/vsftpd.conf /etc/vsftpd.conf.backup 4、修改配置文件如下:vi /etc/vsftpd.conf …...