永结无间Ⅸ--你不需要LLM Agent
人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。
但您是否考虑过您是否真的需要它?
实际情况是,您不需要 Agentic Architecture,并且最好不要在您的业务中使用 Agentic Architecture。
1 分钟了解 LLM 代理和代理架构
在我深入探讨原因之前,让我们先快速了解一下 LLM 代理的含义。
从语义内核编排的角度来看,人工智能代理是一个模块化抽象,它可以拥有角色,可以响应用户输入执行操作,并且可以轻松地与其他代理通信。来源:微软开发者博客
本质上,Agent可以看作是一个使用LLM设计的自动机,可以执行以下操作:
- 扮演角色
- 弄清楚如何完成一项任务
- 执行任务
- 做决定
- 与其他代理商沟通
在代理架构中,您将拥有一大群这样的 LLM 代理,每个代理之间都有直接的沟通渠道,以完成一项复杂的任务。您通常需要植入一个经理角色的代理来确定任务是否已完成,或者您的代理是否会开始无休止地讨论周末计划或生活的意义。
示例:用于生成博客文章的 Agentic 架构
乍一看这听起来非常合乎逻辑。
事实上,大多数团队都是这样运作的。
所以有什么问题?
问题1:为什么你还没有它?
百万美元的创意通常始于解决我们自己的日常痛点。如果我们从未进一步实施它,通常意味着以下一项或多项是正确的:
- 我们不知道该怎么做。如果你不知道该怎么做,你很可能也不知道它是否已经正确实施。
- 我们没有时间/资源去做这件事。
- 我们实际上并不需要它。就像我不需要商用油炸锅来制作一批鸡翅一样。
底线:不要为了使用而使用技术。
如果您的团队已经考虑过一段时间是否需要 Agentic 架构,那么您可能还没有开始开发/采购它。在这种情况下,我建议您坚持下去,不要害怕错过。会有更好的架构/实现。
如果你不相信的话,那我们就继续下一个问题吧。
问题 2:依赖互联网讨论来解决业务问题
LLM 之所以令人惊叹,是因为他们所输入的数据量非常大。
OpenAI 使用以下信息来训练模型:(1) 互联网上公开的信息、(2) 从第三方获得许可的信息,以及 (3) 用户或人类训练师提供的信息。
虽然您可能在网上找到关于银行通常如何进行反洗钱 (AML) 检查的讨论,但您可能无法找到您的竞争对手或客户的竞争对手实际如何经营业务的实际审计线索。
换句话说,如果您想使用 LLM 代理来自动化您的业务流程,那么您将陷入这两个选项之间:
- 利用 Reddit 上的网络传闻来经营你的企业
- 使用精心策划的数据集来微调你自己的 LLM
LLM 微调值得在单独的博客文章中介绍。您和您的企业可能需要针对不同的业务流程微调多个模型。在服用红色药丸之前,请确保您已为这一旅程做好准备。
您可能会说,对于业务关键性较低且价值较低的任务,LLM 代理仍然是有效的选择。但在那时,当您可以直接将 LLM 与云提供商一起使用时,是否仍然值得投资设置和采用该框架?
问题 3:以创造力的名义将业务流程转变为掷骰子
大多数大模型语言项目都无法解决突破性的问题
是的,LLM 已被用于帮助探索核聚变的可能性。
但让我们现实一点,如果您正在考虑使用 LLM 代理来自动化部分业务流程,那么这些流程可能是您和您的团队以前执行过的。这意味着有一个协议/程序需要遵循,或者有完成这些任务的方法。
我们需要问自己的问题是:在执行任务时,我们真的需要 LLM 的创造力吗?或者我们真的希望 LLM 遵循以前的任务完成方式,并在此过程中的每个步骤中自动生成文本/图像?
如果我们真的想让 LLM 代理弄清楚如何执行任务,我们可能会看到每次执行的审计跟踪都富有创意。执行顺序会有所不同,中间输出格式可能不一致,有时,代理甚至可能需要很多轮才能获得不令人满意的结果。曾经清晰的协议将变得富有创意或统计上不可预测。
如果计划开始将 GenAI 更大规模地整合到业务中,那么让 LLM 按照规则行事通常会产生更可审计、调试和稳定的结果。如果是这样的话,LLM 代理会带来什么好处呢?我们不妨剪掉翅膀,选择 LLM 管道。
潜在解决方案:大模型语言(LLM) 管道
如果说数据科学的炒作教会了我们什么,那就是操作化的重要性。如果没有办法将尖端分析/技术集成到现有系统/流程中,那么一旦热潮消退,你就会发现自己陷入巨大的技术债务和孤岛之中。
尽管各种周期性炒作仍在继续,但数据工程、DevOps 和 MLOps 始终保持相关性,原因如下:它们都与透明度、稳健性和可靠性有关。我们也应该以这种方式考虑 LLM 的采用。
将你的 LLM 代理计划转换为经过充分记录和测试的 LLM 管道,每个管道包含原子步骤,每个步骤都具有定义的输入和输出数据结构。这让你能够真正思考在 GenAI 成为现实之前你是如何执行任务的。这还允许你调试 LLM 管道出错的地方。这最终将把原本庞大的 LLM 代理黑匣子缩小为概率口袋,因为你已经定义了高级工作流程和执行顺序。
欢迎前往我们的公众号,时事资讯
创作不易,觉得不错的话,点个赞吧!!!
相关文章:
永结无间Ⅸ--你不需要LLM Agent
人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。 但您是否考虑过您是否真的需要它? 实际情况是,您不需要 A…...
Simulink|基于粒子群算法的永磁同步电机多参数辨识
目录 主要内容 模型研究 结果一览 下载链接 主要内容 仿真程序参考文献《改进粒子群算法的永磁同步电机多参数辨识》,采用粒子群算法与simulink模型结合的方式,对永磁同步电机进行多参数辨识。程序以定子绕组电阻、d轴电感、q轴电感和永磁…...
程序如何自动点击亚马逊商户后台的“邀请评论”按钮
要在亚马逊上自动点击“邀请评论”按钮,可以使用自动化脚本来实现。由于你希望自动化操作,我提供一个示例代码,使用 Selenium WebDriver 来执行这个任务。Selenium 是一个流行的浏览器自动化工具,能够模拟用户操作,例如…...
大模型算法面试题(十八)
本系列收纳各种大模型面试题及答案。 1、P-tuning v2 思路、优缺点是什么 P-tuning v2是清华大学自然语言处理实验室(THUDM)等研究机构提出的一种新的预训练模型优化方法,主要关注如何通过动态构建任务相关的提示序列来引导预训练模型进行更…...
手机在网状态接口如何对接?(二)
一、什么是手机在网状态? 传入手机号码,查询该手机号的在网状态,返回内容有正常使用、停机、在网但不可用、不在网(销号/未启用/异常)、预销户等多种状态。 二、手机在网状态使用场景? 1.用户验证与联系…...
力扣-3232. 判断是否可以赢得数字游戏
给你一个 正整数 数组 nums。 Alice 和 Bob 正在玩游戏。在游戏中,Alice 可以从 nums 中选择所有个位数 或 所有两位数,剩余的数字归 Bob 所有。如果 Alice 所选数字之和 严格大于 Bob 的数字之和,则 Alice 获胜。 如果 Alice 能赢得这场游…...
Table SQL connectors以及FileSystem、JDBC connector
目录 Flink支持的连接器 如何使用连接器 FileSystem SQL Connector 文件格式 分区文件 Source 目录监控 元数据 Streaming Sink 滚动策略 文件合并 JDBC SQL Connector 依赖 如何创建JDBC表 连接器配置 案例 pom依赖 代码 测试 Flink的Table API和SQL…...
Animate软件基础:“分散到图层”创建的新图层
FlashASer:AdobeAnimate2021软件零基础入门教程https://zhuanlan.zhihu.com/p/633230084 FlashASer:实用的各种Adobe Animate软件教程https://zhuanlan.zhihu.com/p/675680471 FlashASer:Animate教程及作品源文件https://zhuanlan.zhihu.co…...
ffmpeg命令-Windows下常用最全
查询命令 参数 说明 -version 显示版本。 -formats 显示可用的格式(包括设备)。 -demuxers 显示可用的demuxers。 -muxers 显示可用的muxers。 -devices 显示可用的设备。 -codecs 显示libavcodec已知的所有编解码器。 -decoders 显示可用…...
反序列化漏洞靶机实战-serial
一.安装靶机 下载地址为https://download.vulnhub.com/serial/serial.zip,安装好后开启靶机,这里并不需要我们去登录,直接扫描虚拟机nat模式下c网段的ip,看看哪个的80端口开放,然后直接去访问 二.查找cookie 访问靶…...
医疗器械产品没有互联网连接,就不适用于网络安全要求吗?
医疗器械产品是否不适用于网络安全要求,需要考虑产品是否具有网络连接功能以进行电子数据交换或远程控制,以及是否采用储存媒介进行电子数据交换。详细解析如下: 一、医疗器械的网络安全要求不仅限于互联网连接 数据交换接口:医疗…...
可视掏耳勺安全吗?独家揭示六大风险弊病!
很多人习惯在洗漱完顺手拿一根棉签掏耳朵,但是棉签的表面直径大且粗糙,不易将耳朵深处的耳垢挖出,耳垢堆积在耳道深处长时间不清理会导致堵塞耳道,引起耳鸣甚至感染。而可视掏耳勺作为一种新型的挖耳工具,它的安全性也…...
JavaScript 变量声明var、let、const
在 JavaScript 中,var、let和const是用于声明变量的关键字。 let和const是JavaScript里相对较新的变量声明方式。 let用法类似于var,但是所声明的变量,只在let命令所在的代码块内有效。 const声明一个只读的常量。一旦声明,常量的…...
ipvlan: operation not supported 导致的POD不断重启
情况描述 接到反馈有一台虚拟机HA迁移了,需要检查一下上面业务是否正常,由于是K8S node节点,正常情况下重启会自动恢复的,不过抱着严谨的态度,上去看了一眼。 问题:发现docker运行正常,但是业…...
组蛋白乳酸化和RNA甲基化如何联动?请大数据把这个思路推给科研人
在细胞生物学中,基因表达调控是决定细胞功能与命运的核心过程之一。组蛋白作为修饰性蛋白,在调控基因转录中起着至关重要的作用。近年来,科学家们发现,组蛋白的多种化学修饰(如甲基化、乙酰化、磷酸化等)影…...
操作文件-Path
Java操作文件-Path Paths 参数说明 first:必选参数,表示路径的第一个组件。more:可选参数,表示路径的其他组件,可以传入多个。 创建路径对象 // 创建一个表示当前工作目录的Path对象 Path currentPath Paths.get…...
RAC(Teamcenter )开发,Bom行解包和打包的方法
1、打包 UnpackAllAction allAction new UnpackAllAction((AbstractBOMLineViewerApplication) currentApplication, "packAllAction"); new Thread(allAction).start();2、解包 UnpackCommand command new UnpackCommand(bomLine); command.executeModal();3、注…...
log4j2漏洞练习
log4j2 是Apache的一个java日志框架,我们借助它进行日志相关操作管理,然而在2021年末log4j2爆出了远程代码执行漏洞,属于严重等级的漏洞。apache log4j通过定义每一条日志信息的级别能够更加细致地控制日志生成地过程,受影响的版本…...
OpenEuler安装部署教程
目录 OpenEuler安装部署教程 MobaXterm一款全能的远程工具 yum安装软件 vim编辑器(了解) 防火墙 常用命令 网络工具netstat & telnet 进程管理工具top ps 磁盘free、fdisk 用户、组(了解) 权限(了解&am…...
Canto - hackmyvm
简介 靶机名称:Canto 难度:简单 靶场地址:https://hackmyvm.eu/machines/machine.php?vmCanto 本地环境 虚拟机:vitual box 靶场IP(Canto):192.168.130.53 windows_IP:192.1…...
【数据结构进阶】手撕红黑树
🔥个人主页: Forcible Bug Maker 🔥专栏: C || 数据结构 目录 🌈前言🔥红黑树的概念🔥手撕红黑树红黑树结点的定义红黑树主体需要实现的成员函数红黑树的插入findEmpty和Size拷贝构造析构函数和…...
【C++从小白到大牛】类和对象
目录 一、面向过程和面向对象初步认识 二、类的引入 三、类的定义 类的成员函数两种定义方式: 1. 声明和定义全部放在类体中 2. 类声明放在.h文件中,成员函数定义放在.cpp文件中 成员变量命名规则的建议: 四、类的访问限定符 【访问限…...
Kafka 为什么这么快的七大秘诀,涨知识了
我们都知道 Kafka 是基于磁盘进行存储的,但 Kafka 官方又称其具有高性能、高吞吐、低延时的特点,其吞吐量动辄几十上百万。 在座的靓仔和靓女们是不是有点困惑了,一般认为在磁盘上读写数据是会降低性能的,因为寻址会比较消耗时间。…...
一文解决3D车道线检测:最新单目3D车道线检测综述
前言 场景理解是自动驾驶中极具挑战的任务,尤其是车道检测。车道是道路分割的关键,对车辆安全高效行驶至关重要。车道检测技术能自动识别道路标记,对自动驾驶车辆至关重要,缺乏这项技术可能导致交通问题和事故。车道检测面临多种…...
稳中向好,今年新招6000人
团子校招 近日,美团宣布开启面向 2025 届的校园招聘,招聘规模达 6000 人。 虽然相比京东(宣布招聘 16000 人)稍有逊色,但 6000 这个校招规模可一点不少。 要知道,京东是重自营的传统电商,16000 …...
使用kettle开源工具进行跨库数据同步
数据库同步可以用: 1、Navicat 2、Kettle 3、自己写代码 调用码神工具跨库数据同步 -连接 4、其它 实现 这里使用Kettle来同步,主要是开源的,通过配置就可以实现了 Kettle的图形化界面(Spoon)安装参考方法 ht…...
Golang | Leetcode Golang题解之第307题区域和检索-数组可修改
题目: 题解: type NumArray struct {nums, tree []int }func Constructor(nums []int) NumArray {tree : make([]int, len(nums)1)na : NumArray{nums, tree}for i, num : range nums {na.add(i1, num)}return na }func (na *NumArray) add(index, val …...
Golang | Leetcode Golang题解之第301题删除无效的括号
题目: 题解: func checkValid(str string, lmask, rmask int, left, right []int) bool {cnt : 0pos1, pos2 : 0, 0for i : range str {if pos1 < len(left) && i left[pos1] {if lmask>>pos1&1 0 {cnt}pos1} else if pos2 <…...
【Story】《程序员面试的“八股文”辩论:技术基础与实际能力的博弈》
目录 程序员面试中的“八股文”:助力还是阻力?1. “八股文”的背景与定义1.1 “八股文”的起源1.2 “八股文”的常见类型 2. “八股文”的作用分析2.1 理论基础的评价2.1.1 助力2.1.2 阻力 3. 实际工作能力的考察3.1 助力3.2 阻力 4. 面试中的背题能力4.…...
初步了解泛型
目录 泛型的引入 泛型 泛型 泛型类 泛型的上界 泛型的引入 之前学习的数组里面是存放着整型或者自字符串中一种的数组,如果想要在一个数组里面放多种类型数据,我们该怎么去做呢?Object类或许是一个好的解决方法,因为Object类…...
软件下载网站制作/seo教程seo入门讲解
面对严苛的环境(突发疫情等),制造企业必须打造适应能力和重塑能力即生存与发展的平衡。一个柔性的生产计划与控制系统即可以加速库存的流动又可以灵活的适应需求的变化。.一、生产计划与控制系统必须灵活的符合其生产类型生产原理中存在六种类型,从总体上可以分为两…...
新兴县城乡建设局网站登录/推广普通话的宣传内容
平时用Python做web开发,上传图片是难免的,但直接拿PIL的函数来处理,总感觉有点繁琐,能不能封装些功能函数,让web上传处理图片更简便些。看了壑塥峈的《使用PIL调整图片分辨率》,得到了启发,他写…...
乐清做网站公司/常州百度推广公司
本节书摘来异步社区《R数据可视化手册》一书中的第2章,第2.2节,作者:【美】Winston Chang,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 绘制折线图 问题如何绘制折线图? 方法使用plot()函数绘制折线图…...
做调查问卷赚钱网站有哪些/网络营销经典案例
Indent Guides 为每个缩进绘制一条虚线; Highlight all occurrences of selected word 高亮相关代码; Productivity Power Tools 微软官方推出的扩展,标记补全、复制引用、增强的滚动条等,详见《免费的精品: Productivity Power T…...
贵州建设网老网站/品牌推广宣传词
目录 一、ThreadLocal是什么 二、ThreadLocal怎么用 三、ThreadLocal源码分析 1、set方法 2、get方法 3、remove方法 四、ThreadLocal其他几个注意的点 下面我们带着这些问题,一点一点揭开ThreadLocal的面纱。若有不正之处请多多谅解,并欢迎批评指…...
做网站怎么样/百度云搜索引擎入口百度网盘
--取平均值 AVG() :求sal平均值 select avg(sal) as avg_sal from emp; --求和 SUM() 对sal求和 select sum(sal) as sum_sal from emp; --求最大值 MAX()、最小值MIN() 对sal进行操作 select max(sal) as max_sal,min(sal) as min_sal from emp; --求行…...