生成式 AI 的发展方向,是 Chat 还是 Agent?
据《福布斯》报道,商业的未来是自动化。他们报告说,自动化的应用是不可避免的,“工人们即将被一个圈子和一套规则包围,要严格遵守,不能偏离。得益于聊天机器人ChatGPT于2022年11月推出所带来的强劲加持,2023年成为了AI(人工智能)发展史上的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,技术不断进步,关于其未来发展方向的讨论也愈发激烈。究竟生成式AI的未来是在对话系统(Chat)中展现智慧,还是在自主代理(Agent)中体现能力?这一问题引发了广泛的讨论和探索。这里谈谈我的看法。
1 从预测式AI到生成式AI
1.1 预测式AI
在生成式AI受到瞩目之前,大多数AI应用都使用了预测式AI(Predictive AI)。顾名思义,所谓预测式AI,就是根据现有数据进行预测趋势或提供见解,但它不会生成全新的内容。

比较典型的例子是德国马克斯·普朗克光科学研究所的马里奥·克莱恩及其同事们训练了一个人工智能模型,对1994年至2021年期间在arXiv预印本服务器上发表的143000篇涵盖了与人工智能有关领域的论文进行分析,并预测哪些未经研究的概念会在五年内出现在至少三篇论文中,准确率超过99.5%。
以下是一些预测式AI的典型代表:
-
人工神经网络(Artificial Neural Networks,ANNs):一种模仿人类大脑结构和功能的计算模型,常用于图像识别、语音识别、自然语言处理等领域的预测任务。
-
支持向量机(Support Vector Machines,SVM):一种监督学习算法,用于分类和回归分析,可以根据已知样本的特征进行预测。
-
隐马尔可夫模型(Hidden Markov Models,HMMs):一种概率模型,用于建模序列数据,例如语音识别、自然语言处理等任务。
-
决策树(Decision Trees):一种基于树状结构的预测模型,可以根据特征属性进行分类或回归分析。
-
随机森林(Random Forests):一种基于决策树的集成学习方法,通过多个决策树的组合进行预测,提高了准确性和稳定性。
-
K近邻算法(K-Nearest Neighbors,KNN):一种基于相似性度量的分类和回归算法,通过计算样本与最近邻的距离来预测样本的标签或数值。
-
集成学习(Ensemble Learning):一种通过组合多个预测模型来提高准确性的方法,例如Bagging、Boosting等。
注意,以上只是一些典型的预测式AI代表,实际上还有很多其他的算法和模型可以用于预测任务。
1.2 生成式AI
生成式AI(Generative AI)是通过大数据集训练的深度学习模型来创建新内容的技术。

与预测式AI不同,生成式AI会利用机器学习,从训练数据中学到“思考”的模式,以此创造具有原创性的输出。
近年来业界涌现了许多知名的生成式 AI 应用,其中包括 OpenAI 的 ChatGPT 和 DALL-E、GitHub CoPilot、微软的 Bing Chat、谷歌的 Bard、Midjourney,以及 Stable Diffusion 和 Adobe Firefly。
以下是一些具有代表性的生成式AI模型:
-
OpenAI的GPT(Generative Pretrained Transformer):GPT是一种基于Transformer架构的语言模型,通过预训练大规模语料库,可以生成连贯的自然语言文本。GPT-3是目前最大的版本,具有1,750亿个参数。
-
DeepMind的AlphaGo:AlphaGo是一个生成式AI模型,通过自我对弈和强化学习,成功地在围棋中击败了世界冠军。它能够生成高质量的围棋着法,并具有强大的模式识别和决策能力。
-
OpenAI的DALL-E:DALL-E是一个生成式AI模型,可以根据描述生成任意形状的图片。它通过训练大规模的自监督数据集,学会了生成与描述相符的图像。
-
NVIDIA的StyleGAN:StyleGAN是一种生成对抗网络(GAN)模型,可以生成逼真的人脸图像。它通过学习大规模的人脸图像数据集,可以生成具有不同风格和特征的逼真人脸图像。
这只是一小部分具有代表性的生成式AI模型,AI领域的发展非常快速,未来还会涌现出更多令人惊叹的生成式AI模型。
生成式 AI 的常见用例包括聊天机器人、图像创建和编辑、软件代码辅助和科学研究等。如今,人们常使用生成式 AI 应用来生成文字、图片和代码等。
2 生成式AI:Chatbot vs. Virtual Agent
2.1 生成式AI Chatbot
生成式AI Chatbot是帮助你与智能终端(比如电脑或智能手机)与计算机进行对话的技术,它主要通过对话模式来解答疑问,生成和提供信息,它可以运用自然语言像人类一样与客户交谈,并回答他们的问题或执行其他一些任务,比如提出建议和提供预订服务。

2.1.1 Chatbot的特性
Chatbot具有4个特性:
2.1.1.1 定制功能
Chatbot提供的功能可以根据实际需要来制定。
在制定功能是,需要牢记几个要素:
- 语言:为了与用户进行有效的沟通,确保Chatbot使用的语言简单易懂。这样可以进行更好的交互,并有助于使用户更容易理解对话。
- 语气:Chatbot与用户使用的词语应该是友好的、有趣的,并给用户留下深刻的印象。
- 集成:Chatbot与短信或电子邮件等其他平台交互的功能应该得到很好的开发。
2.1.1.2 将流量转化为高质量的潜在客户
例如,丝芙兰(Sephora)是零售业的一个很好的例子,它通过Chatbot和网站将流量转化为潜在客户。Chatbot可以保持整个对话并理解上下文,可以从客户那里收集关键信息,并以自然的方式做出回应。它甚至可以为潜在客户提供他们甚至不知道自己已经知道的问题的答案。毫无疑问,Chatbot可以帮助企业将网站流量转化为高质量的潜在客户。
从技术上来说涉及以下方面:
- 识别潜在客户:了解潜在客户对于使服务或产品具有吸引力至关重要。Chatbot有助于了解您的客户。它收集客户的人口统计数据,然后关注他们的角色并观察竞争,这有助于更好地产生潜在客户。
- 了解客户需求:了解客户的需求对于发展沟通很重要。Chatbot有助于了解潜在客户的好恶和兴趣。
- 创建有意义的内容:在潜在客户生成活动时,Chatbot提供有意义的内容可以改善整个营销策略。
2.1.1.3 建议、常见问题解答和提示
Chatbot可以回答客户问题、提供提示并充当个人顾问。Chatbot可以回答有关公司产品的问题,甚至可以为普通消费者提供实用建议。Chatbot还可以提供有关事件和公司销售的信息。
2.1.1.4 实时聊天
实时聊天、共同浏览和视频聊天是目前营销中最热门的趋势。大约 73% 的客户认为实时聊天是最令人满意的通信形式。Chatbot提供实时通信,以实时方式吸引观众。例如,广受欢迎的自行车品牌 Canyon 在世界各地拥有多元化的客户。他们为来自不同国家、使用不同语言的各种客户提供支持。他们使用最好的人工智能聊天机器人,使用客户喜欢的语言更快地将客户连接到合适的销售或支持团队。
如果使用得当,Chatbot可以大大减少客户服务代理的工作量,使他们能够专注于复杂的客户服务问题,而聊天机器人则处理基本查询。
2.1.2 Chatbot涉及的技术要点
Chatbot在技术实现上主要是将用户提供的内容与适当的预定义内容进行匹配,并将内容处理反馈给用户。其中涉及到:
- 模式匹配(Pattern matches) :为了回答任何消息或语音,机器人会使用模式匹配到组,然后提供适当的响应。
- 自然语言理解 (Natural language understanding,NLU): 这种聊天机器人算法会检查句子,并且它没有任何用户对话的历史背景。这意味着如果它得到一个问题的响应,它是最近被询问的,它不会回忆起任何查询。
- 自然语言处理 (Natural language processing,NLP): 聊天机器人使用自然语言处理 (NLP) 方法将语音或文本转换为结构化数据。为了完成整个过程,它经历了一系列步骤,例如标记化、分析情感、规范化、名称识别和依赖项解析。
2.1.3 Chatbot的优势和局限性
生成式AI Chatbot 具有简单、易于实现和部署的优势,适用于提供快速响应和标准化服务的场景,如客户支持和常见问题解答。比如:
- 全勤服务客户:Chatbot 可以为客户提供24×7的服务,立即回答他们的常见问题,而不仅仅是执行管理任务。
- 增加潜在客户:Chatbot 可以更好地理解用户意图和分析对话背景,并会更自然地做出反应。
- 积极回应客户——即使遇到意想不到的问题,Chatbot 也能进行对话。
有调查显示有68% 的客户喜欢Chatbot,因为它可以更快地回答客户查询。
生成式AIChatbot的局限性在于,目前的生成式AI chatbot模型大多是基于短期记忆设计的,并没有接触到需要长期记忆和复杂上下文管理的数据集,它们主要依赖于最近的对话片段来生成回应,因此在处理跨越长时间跨度的对话时,它们往往无法像人类那样保持连贯性和一致性,这限制了它在建立深度用户关系方面的潜力。

2.2 生成式AI Virtual Agent
生成式AI Virtual Agent使用大型语言模型(LLM)作为核心计算引擎,进而实现交互对话、执行任务、推理,并展现一定程度的自主性。
Agent可以帮助个人或企业完成各种管理任务,例如安排约会、回复电子邮件等,也可以回应那些不想直接联系某人但仍希望快速解决问题的人的请求。Siri 和 Alexa 是语音助手的例子,它们只需几句口语即可立即访问信息和服务。
2.2.1 Virtual Agent的特性
与Chatbot一样,Virtual Agent也具有四个特性。
2.2.1.1 优秀的沟通者
每个企业都需要与客户进行适当的沟通。 Virtual Agent能够为企业提供预期的结果,因为它们精通最佳沟通策略。
始终清晰简洁:要在任何业务中取得成功,清晰简洁的沟通至关重要。 Virtual Agent提供清晰简洁的指导,从而增加与客户的互动。
自动化电子邮件:Virtual Agent可以发送个性化的自动跟进电子邮件,这对于让客户参与业务特别有用。
除了沟通技巧外, Virtual Agent还了解法律和科学等不同领域。
2.2.1.2 多任务
Virtual Agent可以为您处理本来需要花钱的任务,从而为你省钱,例如代你预订下一个假期。仅通过Virtual Agent,您就可以节省高达 78% 的业务运营成本。
Virtual Agent可以完成以下任务:
- 发送电子邮件
- 调度
- 预订旅行
- 管理您的社交媒体帐户
2.2.1.3 非常适合跟进工作
组织日程安排是拥有Virtual Agent的最佳部分之一。它不仅可以提醒业务的重要截止日期,还可以记录和跟进未完成的任务。
2.2.1.4 有助于发展业务
你可能需要考虑许多任务。当你不在办公室时,Virtual Agent帮助可以从帮助处理所有传入的消息。
- 减少工作量并提高了生产力 - Virtual Agent在减少与各种企业应用程序协调的压力方面发挥着关键作用。
- 提高客户参与度 – 人工智能驱动的语音助手在通过商业网站更好地吸引客户方面发挥着关键作用。观察客户行为和用户体验对于品牌增加销售额至关重要。例如,作为领先品牌,沃尔沃开发了一种对话助手来指导驾驶员。
- 有助于建立个性化的营销策略 – 数据管理对于任何企业都是必不可少的,但是,其中具有挑战性的部分是跟踪海量数据源的过程。Virtual Agent在这里充当开创性的数据处理业务工具。它可以处理大量的实时和历史数据,并观察用户的意图。
2.2.2 Virtual Agent涉及的技术要点
在技术层面上涉及:
- 它结合了机器学习(ML)和人工智能(AI)——Virtual Agent使用人工智能和机器学习来理解语音和文本。它经过数百万次对话的训练,以提高其回答复杂问题以及理解俚语和独特发音的能力。
- 收集数据、分析和回答 – Virtual Agent可以识别语音和文本消息。此外,它还可以使用来自互联网的信息和可以从您的办公室计算机访问的文件来回答任何问题。
与Chatbot相比,Virtual Agents的优势是可以提供更为丰富和复杂的交互体验。它可以模拟真实人物的行为和情感,为用户提供更为沉浸式的体验。

我们人类可以设定目标和提供必要的资源(例如计算能力),然后由生成式AI Virtual Agent独立地承担大部分工作,最后人类监督进程以及评估最终结果。简而言之,Virtual Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。
- 处理各种客户请求:Siri、Alexa 和 Cortana 等Virutal Agent越来越多地被消费者用来协助他们完成日常生活中的各种任务。
- 让日常生活更轻松: Virutal Agent可以简化任务、决策和娱乐,让我们的生活更轻松。
- 提高客户服务标准: Virutal Agent具有提高效率并为员工和客户提供支持的强大能力。
生成式AI Virtual Agent充分体现了智能体的互动性、自主性和适应性特征,接近于独立的行动者,而人类则更多地扮演监督者和评估者的角色。
Virtual Agent的需要面对的挑战是开发和维护的复杂性,以及对大量数据和计算资源的需求。
2.3 Chatbot vs. Virtual Agent
从理论上讲,Chatrot和Virtual Agent都可以进行编程以处理最常见的客户查询。

作为一个半自动化系统,Chatrot可以比人类更快、更有效地处理简单的问题。但是,如果问题很复杂或需要紧急响应(例如,欺诈等),那么Virtual Agent将会胜出。
2.3.1 应用Chatbot的理由
- Chatbot的运营成本远低于虚拟助手的运营成本。
- Chatbot专注于像人类一样理解自然语言。
- 与拥有真正的物理助手相比,Chatbot更方便、更高效、更快速。
- 这是一种与消费者互动的新方式。您无需访问网站或通过应用程序,只需直接在 Facebook Messenger、Telegram、Slack 以及即将推出的 WhatsApp 中与品牌或企业聊天。
- Chatbot可以在各种 API 中连接。
- Chatbot可以自动执行繁琐和重复的任务。
2.3.2 应用Virtual Agent的理由
- Virtual Agent可以接管繁琐和重复的任务,让你有时间来做更重要的事情。
- Virtual Agent可以每周 7 天、每天 24 小时不间断工作。而且,它们不会感到疲倦或生病——Virtual Agent们也不会要求休假。
- Virtual Agent可以最大限度地减少您的工作量并最大化利润。
- Virtual Agent通过自动化客户入职流程来提供更好的客户参与和服务。
不管是Chatbot,还是Virtual Agent,都需要有专门的团队和投资,相较而言,Chatbot可以用更少的投资和团队来操作。
相关文章:
生成式 AI 的发展方向,是 Chat 还是 Agent?
据《福布斯》报道,商业的未来是自动化。他们报告说,自动化的应用是不可避免的,“工人们即将被一个圈子和一套规则包围,要严格遵守,不能偏离。得益于聊天机器人ChatGPT于2022年11月推出所带来的强劲加持,202…...
金字塔监督在人脸反欺骗中的应用
介绍 论文地址:https://arxiv.org/pdf/2011.12032.pdf 近年来,人脸识别技术越来越普及。在智能手机解锁和进出机场时,理所当然地会用到它。人脸识别也有望被用于管理今年奥运会的相关人员。但与此同时,人们对人脸欺骗的关注度也…...
vue3——两种利用自定义指令实现防止按钮重复点击的方法
方法一:利用定时器设置时间,下方代码设置时间为1秒 但是有个缺点:请求如果很慢,1秒钟还没有好,那么该方法就没用了 // 利用定时器:1秒之后才能再次点击app.directive(preventReClick, {mounted: (el, bind…...
Chrome谷歌浏览器Console(控制台)显示文件名及行数
有没有这样的困扰?Chrome谷歌浏览器console(控制台)不显示编译文件名及行数? 设置(Settings)- > 忽略列表(lgnore List)-> 自定义排除规则(Custom exclusion rules) 将自定义排除规则…...
Vue3+Element Plus 实现table表格中input的验证
实现效果 html部分 <template><div class"table"><el-form ref"tableFormRef" :model"form"><el-table :data"form.detailList"><el-table-column type"selection" width"55" align&…...
安宝特方案|解放双手,解决死角,AR带来质量监督新体验
AR质量监督 解放双手,解决死角 在当今制造业快速发展的背景下,质量监督成为确保产品高质量和完善的管理制度的关键环节。然而,传统的质量监督方式存在诸多挑战,如人工操作带来的效率低下、查岗不及时、摄像头死角等问题。 为了解…...
Django教程(005):基于ORM操作数据库的部门管理系统
文章目录 1、功能介绍2、新建项目3、创建app4、 表结构创建6、生成表7、静态文件管理8、部门管理8.1、部门列表8.2、添加部门8.3、删除部门8.4、编辑部门9、员工管理9.1、员工列表9.2、使用ModelForm添加员工9.3、编辑员工9.4、删除员工10、完整代码下载地址1、功能介绍 部门添…...
git等常用工具以及cmake
一、将git中的代码克隆进电脑以及常用工具介绍 1.安装git 首先需要安装git sudo apt install git 注意一定要加--recursive,因为文件中有很多“引用文件“,即第三方文件(库),加入该选项会将文件中包含的子模…...
Mybatis(四)特殊SQL的查询:模糊查询、批量删除、动态设置表明、添加功能获取自增的主键
实体类: 数据库: 1、模糊查询 方案一: 不适用#{ },’%?%‘ 问号是属于字符串的一部分 不会被解析成占位符,会被当作是我们字符串的一部分来解析,所以我们执行的语句中找不到占位符,但是我们却…...
JS原型与原型链
JS原型与原型链 JavaScript中一切引用类型都是对象,对象就是属性的集合。 Array类型、Function类型、Object类型、Date类型、RegExp类型等都是引用类型。 原型是什么 总计一句话就是(继承里的父亲,你可以使用你的原型里的函数)…...
Python编程学习第一篇——Python零基础快速入门(六)(4)异常处理
我们已经了解了Python的基本数据类型、变量和基本的逻辑控制语句,基于这些基础知识可以编写一些小程序了,但是在写程序的时候我们会发现,有时候程序并不是按我们预期的方向执行,有的直接报错,有的没有报错,…...
GraphHopper-map-navi_路径规划、导航(web前端页面版)
文章目录 一、项目地址二、踩坑环境三、问题记录3.1、graphhopper中地图问题3.1.1. getOpacity不存在的问题3.1.2. dispatchEvent不存在的问题3.1.3. vectorLayer.set(background-maplibre-layer, true)不存在set方法3.1.4. maplibre-gl.js.map不存在的问题3.1.5. Uncaught Ref…...
2-46 基于matlab的声音信号的短时能量、短时过零率、端点检测
基于matlab的声音信号的短时能量、短时过零率、端点检测。通过计算计算短时能量、调整能量门限,然后开始端点检测。输出可视化结果。程序已调通,可直接运行。 2-46 短时能量 短时过零率 端点检测 - 小红书 (xiaohongshu.com)...
力扣630.课程表 II
力扣630.课程表 II 反悔堆 将课程按照结束时间从大到小排序每次取一个判断当前是否能学完该课程如果能学完就将持续时间加入堆 更新答案如果学不完就判断该课程持续时间是否比之前学过的最大的还大 用时更短的话就将旧的弹出 class Solution {public:int scheduleCourse(ve…...
数字IC后端流程简述
1. 设计输入 目标:接收前端设计(如RTL代码和约束文件)的输出。 工具:前端设计工具(如Synopsys Design Compiler或Cadence Genus)。 步骤: 确保前端设计的RTL代码经过综合并生成了门级网表(Netlist)。 收集约束文件(Constraints),如时序约束(SDC文件)、功率约束等…...
数学建模--整数规划和非线性规划
目录 整数规划 非线性规划 总结 整数规划中分支定界法的具体步骤和实现细节是什么? 初始化: 分支: 定界: 剪枝: 终止条件: 非线性规划中的梯度法、牛顿法和拟牛顿法的比较分析有哪些?…...
Linux-查看dd命令进度
查看dd命令进度 一、概述1. 在一个终端执行拷贝任务2. 在另一终端执行进度命令 一、概述 系统:Ubuntu 22.04 在使用 dd 命令做拷贝大量数据的时候,因为并没有输出,所以比较难判断当前进度,因此可以使用下面的命令作为进度查看 …...
高效微调 100 多种大语言模型:先计算法,急速推理!
hiyouga/LLaMA-Factoryhttps://github.com/hiyouga/LLaMA-Factory Stars: 26.9k License: Apache-2.0 LLaMA-Factory 是一个用于高效微调 100 多个大型语言模型(ACL 2024)的 WebUI。 多种模型:LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Y…...
opencv grabCut前景后景分割去除背景
参考: https://zhuanlan.zhihu.com/p/523954762 https://docs.opencv.org/3.4/d8/d83/tutorial_py_grabcut.html 环境本次: python 3.10 提取前景: 1、需要先把前景物体框出来 需要坐标信息,可以用windows自带的画图简单提取像素…...
qt--电子相册
一、项目要求 设计一个电子相册,点击上一张,切换到上一张图片,点击下一张,切换到下一张图片。 要求:图片的展示可以循环(QList<QString>) 要求:界面美观 二、项目代码 本质是通…...
java_网络服务相关_gateway_nacos_feign区别联系
1. spring-cloud-starter-gateway 作用:作为微服务架构的网关,统一入口,处理所有外部请求。 核心能力: 路由转发(基于路径、服务名等)过滤器(鉴权、限流、日志、Header 处理)支持负…...
mongodb源码分析session执行handleRequest命令find过程
mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程,并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令,把数据流转换成Message,状态转变流程是:State::Created 》 St…...
关于nvm与node.js
1 安装nvm 安装过程中手动修改 nvm的安装路径, 以及修改 通过nvm安装node后正在使用的node的存放目录【这句话可能难以理解,但接着往下看你就了然了】 2 修改nvm中settings.txt文件配置 nvm安装成功后,通常在该文件中会出现以下配置&…...
Go 语言接口详解
Go 语言接口详解 核心概念 接口定义 在 Go 语言中,接口是一种抽象类型,它定义了一组方法的集合: // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的: // 矩形结构体…...
工业自动化时代的精准装配革新:迁移科技3D视觉系统如何重塑机器人定位装配
AI3D视觉的工业赋能者 迁移科技成立于2017年,作为行业领先的3D工业相机及视觉系统供应商,累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成,通过稳定、易用、高回报的AI3D视觉系统,为汽车、新能源、金属制造等行…...
Maven 概述、安装、配置、仓库、私服详解
目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...
sipsak:SIP瑞士军刀!全参数详细教程!Kali Linux教程!
简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求,并检查收到的响应。它以以下模式之一…...
R语言速释制剂QBD解决方案之三
本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...
【JVM面试篇】高频八股汇总——类加载和类加载器
目录 1. 讲一下类加载过程? 2. Java创建对象的过程? 3. 对象的生命周期? 4. 类加载器有哪些? 5. 双亲委派模型的作用(好处)? 6. 讲一下类的加载和双亲委派原则? 7. 双亲委派模…...
JS手写代码篇----使用Promise封装AJAX请求
15、使用Promise封装AJAX请求 promise就有reject和resolve了,就不必写成功和失败的回调函数了 const BASEURL ./手写ajax/test.jsonfunction promiseAjax() {return new Promise((resolve, reject) > {const xhr new XMLHttpRequest();xhr.open("get&quo…...
