当前位置：首页 > news >正文

生成式 AI 的发展方向，是 Chat 还是 Agent？

news 文章来源：https://blog.csdn.net/Purpleendurer/article/details/140731562 2025/4/20 3:50:22

据《福布斯》报道，商业的未来是自动化。他们报告说，自动化的应用是不可避免的，“工人们即将被一个圈子和一套规则包围，要严格遵守，不能偏离。得益于聊天机器人ChatGPT于2022年11月推出所带来的强劲加持，2023年成为了AI（人工智能）发展史上的一个转折点，活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实，技术不断进步，关于其未来发展方向的讨论也愈发激烈。究竟生成式AI的未来是在对话系统（Chat）中展现智慧，还是在自主代理（Agent）中体现能力？这一问题引发了广泛的讨论和探索。这里谈谈我的看法。

1 从预测式AI到生成式AI

1.1 预测式AI

在生成式AI受到瞩目之前，大多数AI应用都使用了预测式AI（Predictive AI）。顾名思义，所谓预测式AI，就是根据现有数据进行预测趋势或提供见解，但它不会生成全新的内容。

比较典型的例子是德国马克斯·普朗克光科学研究所的马里奥·克莱恩及其同事们训练了一个人工智能模型，对1994年至2021年期间在arXiv预印本服务器上发表的143000篇涵盖了与人工智能有关领域的论文进行分析，并预测哪些未经研究的概念会在五年内出现在至少三篇论文中，准确率超过99.5%。

以下是一些预测式AI的典型代表：

人工神经网络（Artificial Neural Networks，ANNs）：一种模仿人类大脑结构和功能的计算模型，常用于图像识别、语音识别、自然语言处理等领域的预测任务。
支持向量机（Support Vector Machines，SVM）：一种监督学习算法，用于分类和回归分析，可以根据已知样本的特征进行预测。
隐马尔可夫模型（Hidden Markov Models，HMMs）：一种概率模型，用于建模序列数据，例如语音识别、自然语言处理等任务。
决策树（Decision Trees）：一种基于树状结构的预测模型，可以根据特征属性进行分类或回归分析。
随机森林（Random Forests）：一种基于决策树的集成学习方法，通过多个决策树的组合进行预测，提高了准确性和稳定性。
K近邻算法（K-Nearest Neighbors，KNN）：一种基于相似性度量的分类和回归算法，通过计算样本与最近邻的距离来预测样本的标签或数值。
集成学习（Ensemble Learning）：一种通过组合多个预测模型来提高准确性的方法，例如Bagging、Boosting等。

注意，以上只是一些典型的预测式AI代表，实际上还有很多其他的算法和模型可以用于预测任务。

1.2 生成式AI

生成式AI（Generative AI）是通过大数据集训练的深度学习模型来创建新内容的技术。

与预测式AI不同，生成式AI会利用机器学习，从训练数据中学到“思考”的模式，以此创造具有原创性的输出。

近年来业界涌现了许多知名的生成式 AI 应用，其中包括 OpenAI 的 ChatGPT 和 DALL-E、GitHub CoPilot、微软的 Bing Chat、谷歌的 Bard、Midjourney，以及 Stable Diffusion 和 Adobe Firefly。

以下是一些具有代表性的生成式AI模型：

OpenAI的GPT（Generative Pretrained Transformer）：GPT是一种基于Transformer架构的语言模型，通过预训练大规模语料库，可以生成连贯的自然语言文本。GPT-3是目前最大的版本，具有1,750亿个参数。
DeepMind的AlphaGo：AlphaGo是一个生成式AI模型，通过自我对弈和强化学习，成功地在围棋中击败了世界冠军。它能够生成高质量的围棋着法，并具有强大的模式识别和决策能力。
OpenAI的DALL-E：DALL-E是一个生成式AI模型，可以根据描述生成任意形状的图片。它通过训练大规模的自监督数据集，学会了生成与描述相符的图像。
NVIDIA的StyleGAN：StyleGAN是一种生成对抗网络（GAN）模型，可以生成逼真的人脸图像。它通过学习大规模的人脸图像数据集，可以生成具有不同风格和特征的逼真人脸图像。

这只是一小部分具有代表性的生成式AI模型，AI领域的发展非常快速，未来还会涌现出更多令人惊叹的生成式AI模型。

生成式 AI 的常见用例包括聊天机器人、图像创建和编辑、软件代码辅助和科学研究等。如今，人们常使用生成式 AI 应用来生成文字、图片和代码等。

2 生成式AI：Chatbot vs. Virtual Agent

2.1 生成式AI Chatbot

生成式AI Chatbot是帮助你与智能终端（比如电脑或智能手机）与计算机进行对话的技术，它主要通过对话模式来解答疑问，生成和提供信息，它可以运用自然语言像人类一样与客户交谈，并回答他们的问题或执行其他一些任务，比如提出建议和提供预订服务。

2.1.1 Chatbot的特性

Chatbot具有4个特性：

2.1.1.1 定制功能

Chatbot提供的功能可以根据实际需要来制定。

在制定功能是，需要牢记几个要素：

语言：为了与用户进行有效的沟通，确保Chatbot使用的语言简单易懂。这样可以进行更好的交互，并有助于使用户更容易理解对话。
语气：Chatbot与用户使用的词语应该是友好的、有趣的，并给用户留下深刻的印象。
集成：Chatbot与短信或电子邮件等其他平台交互的功能应该得到很好的开发。

2.1.1.2 将流量转化为高质量的潜在客户

例如，丝芙兰（Sephora）是零售业的一个很好的例子，它通过Chatbot和网站将流量转化为潜在客户。Chatbot可以保持整个对话并理解上下文，可以从客户那里收集关键信息，并以自然的方式做出回应。它甚至可以为潜在客户提供他们甚至不知道自己已经知道的问题的答案。毫无疑问，Chatbot可以帮助企业将网站流量转化为高质量的潜在客户。

从技术上来说涉及以下方面：

识别潜在客户：了解潜在客户对于使服务或产品具有吸引力至关重要。Chatbot有助于了解您的客户。它收集客户的人口统计数据，然后关注他们的角色并观察竞争，这有助于更好地产生潜在客户。
了解客户需求：了解客户的需求对于发展沟通很重要。Chatbot有助于了解潜在客户的好恶和兴趣。
创建有意义的内容：在潜在客户生成活动时，Chatbot提供有意义的内容可以改善整个营销策略。

2.1.1.3 建议、常见问题解答和提示

Chatbot可以回答客户问题、提供提示并充当个人顾问。Chatbot可以回答有关公司产品的问题，甚至可以为普通消费者提供实用建议。Chatbot还可以提供有关事件和公司销售的信息。

2.1.1.4 实时聊天

实时聊天、共同浏览和视频聊天是目前营销中最热门的趋势。大约 73% 的客户认为实时聊天是最令人满意的通信形式。Chatbot提供实时通信，以实时方式吸引观众。例如，广受欢迎的自行车品牌 Canyon 在世界各地拥有多元化的客户。他们为来自不同国家、使用不同语言的各种客户提供支持。他们使用最好的人工智能聊天机器人，使用客户喜欢的语言更快地将客户连接到合适的销售或支持团队。

如果使用得当，Chatbot可以大大减少客户服务代理的工作量，使他们能够专注于复杂的客户服务问题，而聊天机器人则处理基本查询。

2.1.2 Chatbot涉及的技术要点

Chatbot在技术实现上主要是将用户提供的内容与适当的预定义内容进行匹配，并将内容处理反馈给用户。其中涉及到：

模式匹配（Pattern matches）：为了回答任何消息或语音，机器人会使用模式匹配到组，然后提供适当的响应。
自然语言理解（Natural language understanding，NLU）：这种聊天机器人算法会检查句子，并且它没有任何用户对话的历史背景。这意味着如果它得到一个问题的响应，它是最近被询问的，它不会回忆起任何查询。
自然语言处理（Natural language processing，NLP）：聊天机器人使用自然语言处理（NLP）方法将语音或文本转换为结构化数据。为了完成整个过程，它经历了一系列步骤，例如标记化、分析情感、规范化、名称识别和依赖项解析。

2.1.3 Chatbot的优势和局限性

生成式AI Chatbot 具有简单、易于实现和部署的优势，适用于提供快速响应和标准化服务的场景，如客户支持和常见问题解答。比如：

全勤服务客户：Chatbot 可以为客户提供24×7的服务，立即回答他们的常见问题，而不仅仅是执行管理任务。
增加潜在客户：Chatbot 可以更好地理解用户意图和分析对话背景，并会更自然地做出反应。
积极回应客户——即使遇到意想不到的问题，Chatbot 也能进行对话。

有调查显示有68% 的客户喜欢Chatbot，因为它可以更快地回答客户查询。

生成式AIChatbot的局限性在于，目前的生成式AI chatbot模型大多是基于短期记忆设计的，并没有接触到需要长期记忆和复杂上下文管理的数据集，它们主要依赖于最近的对话片段来生成回应，因此在处理跨越长时间跨度的对话时，它们往往无法像人类那样保持连贯性和一致性，这限制了它在建立深度用户关系方面的潜力。

2.2 生成式AI Virtual Agent

生成式AI Virtual Agent使用大型语言模型（LLM）作为核心计算引擎，进而实现交互对话、执行任务、推理，并展现一定程度的自主性。

Agent可以帮助个人或企业完成各种管理任务，例如安排约会、回复电子邮件等，也可以回应那些不想直接联系某人但仍希望快速解决问题的人的请求。Siri 和 Alexa 是语音助手的例子，它们只需几句口语即可立即访问信息和服务。

2.2.1 Virtual Agent的特性

与Chatbot一样，Virtual Agent也具有四个特性。

2.2.1.1 优秀的沟通者

每个企业都需要与客户进行适当的沟通。 Virtual Agent能够为企业提供预期的结果，因为它们精通最佳沟通策略。

始终清晰简洁：要在任何业务中取得成功，清晰简洁的沟通至关重要。 Virtual Agent提供清晰简洁的指导，从而增加与客户的互动。
自动化电子邮件：Virtual Agent可以发送个性化的自动跟进电子邮件，这对于让客户参与业务特别有用。

除了沟通技巧外， Virtual Agent还了解法律和科学等不同领域。

2.2.1.2 多任务

Virtual Agent可以为您处理本来需要花钱的任务，从而为你省钱，例如代你预订下一个假期。仅通过Virtual Agent，您就可以节省高达 78% 的业务运营成本。

Virtual Agent可以完成以下任务：

发送电子邮件
调度
预订旅行
管理您的社交媒体帐户

2.2.1.3 非常适合跟进工作

组织日程安排是拥有Virtual Agent的最佳部分之一。它不仅可以提醒业务的重要截止日期，还可以记录和跟进未完成的任务。

2.2.1.4 有助于发展业务

你可能需要考虑许多任务。当你不在办公室时，Virtual Agent帮助可以从帮助处理所有传入的消息。

减少工作量并提高了生产力 - Virtual Agent在减少与各种企业应用程序协调的压力方面发挥着关键作用。
提高客户参与度 – 人工智能驱动的语音助手在通过商业网站更好地吸引客户方面发挥着关键作用。观察客户行为和用户体验对于品牌增加销售额至关重要。例如，作为领先品牌，沃尔沃开发了一种对话助手来指导驾驶员。
有助于建立个性化的营销策略 – 数据管理对于任何企业都是必不可少的，但是，其中具有挑战性的部分是跟踪海量数据源的过程。Virtual Agent在这里充当开创性的数据处理业务工具。它可以处理大量的实时和历史数据，并观察用户的意图。

2.2.2 Virtual Agent涉及的技术要点

在技术层面上涉及：

它结合了机器学习（ML）和人工智能（AI）——Virtual Agent使用人工智能和机器学习来理解语音和文本。它经过数百万次对话的训练，以提高其回答复杂问题以及理解俚语和独特发音的能力。
收集数据、分析和回答 – Virtual Agent可以识别语音和文本消息。此外，它还可以使用来自互联网的信息和可以从您的办公室计算机访问的文件来回答任何问题。

与Chatbot相比，Virtual Agents的优势是可以提供更为丰富和复杂的交互体验。它可以模拟真实人物的行为和情感，为用户提供更为沉浸式的体验。

我们人类可以设定目标和提供必要的资源（例如计算能力），然后由生成式AI Virtual Agent独立地承担大部分工作，最后人类监督进程以及评估最终结果。简而言之，Virtual Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。

处理各种客户请求：Siri、Alexa 和 Cortana 等Virutal Agent越来越多地被消费者用来协助他们完成日常生活中的各种任务。
让日常生活更轻松： Virutal Agent可以简化任务、决策和娱乐，让我们的生活更轻松。
提高客户服务标准： Virutal Agent具有提高效率并为员工和客户提供支持的强大能力。

生成式AI Virtual Agent充分体现了智能体的互动性、自主性和适应性特征，接近于独立的行动者，而人类则更多地扮演监督者和评估者的角色。

Virtual Agent的需要面对的挑战是开发和维护的复杂性，以及对大量数据和计算资源的需求。

2.3 Chatbot vs. Virtual Agent

从理论上讲，Chatrot和Virtual Agent都可以进行编程以处理最常见的客户查询。

作为一个半自动化系统，Chatrot可以比人类更快、更有效地处理简单的问题。但是，如果问题很复杂或需要紧急响应（例如，欺诈等），那么Virtual Agent将会胜出。

2.3.1 应用Chatbot的理由

Chatbot的运营成本远低于虚拟助手的运营成本。
Chatbot专注于像人类一样理解自然语言。
与拥有真正的物理助手相比，Chatbot更方便、更高效、更快速。
这是一种与消费者互动的新方式。您无需访问网站或通过应用程序，只需直接在 Facebook Messenger、Telegram、Slack 以及即将推出的 WhatsApp 中与品牌或企业聊天。
Chatbot可以在各种 API 中连接。
Chatbot可以自动执行繁琐和重复的任务。

2.3.2 应用Virtual Agent的理由

Virtual Agent可以接管繁琐和重复的任务，让你有时间来做更重要的事情。
Virtual Agent可以每周 7 天、每天 24 小时不间断工作。而且，它们不会感到疲倦或生病——Virtual Agent们也不会要求休假。
Virtual Agent可以最大限度地减少您的工作量并最大化利润。
Virtual Agent通过自动化客户入职流程来提供更好的客户参与和服务。

不管是Chatbot，还是Virtual Agent，都需要有专门的团队和投资，相较而言，Chatbot可以用更少的投资和团队来操作。