专业做公司logo的网站/网络销售培训学校
大语言模型的最早应用是Chatbot,其实我最早接触语义理解在2014年,2014年做智能音箱的时候,那时也是国内第一批做智能音箱的,在现在看起来当时的智能音箱比较傻,很多问题无法回答,长下文效果也不好,多轮对话效果就更差了,那时对话使用的主要技术是基于规则+知识图谱,所以主要还是停留在命令词识别基础上的交互,比如放音乐类、操控智能家电以及问天气等有限的几个范畴,更多的扮演的事assistent角色,开放式聊天做的并不好。
当时是设计阶段就决定了对话的上限,虽然我们当时模仿的Amazon Alexa如今“进化”出了数以万计的技能,但是相对于LLM,这些技能显得有些过时,如何将LLM接入Alex也是亚马逊不得不面临的事。
时至今日大型预训练的语言模型(如GPT、BERT等)使得对话机器人取得了显著的进展。这些模型通过在大规模文本数据上进行预训练,可以生成具有语法正确性、语义连贯性、具有记忆能力多轮对话的文本回复,除了生成自由对话回复的模型,还有一些任务导向的对话系统,如客服机器人、智能助理等。这时在运行时才会决定对话的上限,聊天机器人再次被认为是客户服务、营销和内部运营的潜在游戏规则改变者。
在训练模型的时候,常常提到模型的泛化能力,泛化能力使得模型可以高质量回复训练集中并不存在的内容,即可以将模型的训练过程看成是记忆+学习的过程,记忆是可以记住训练集中的内容,而学习就是根据训练集中的内容举一反三、触类旁通。在一个训练好的模型,如果触发高质量的记忆+学习能力以获得高质量的回复是信息获取类的核心竞争力之一。
就当前的大语言模型的产品形态而言,基于我所处的行业和工作性质认知,我认为集成大语言模型的工具类应用将是第一波享受大语言模型红利的应用场景。尽管微软基于大语言模型的代码补全github copilot还处在亏损的阶段,但是150万这一庞大的付费用户规模,已经验证了大量用户愿意为此买单,对于copilot生产代码的质量是至关重要的。
大语言模型的用户价值
总结来说,使用大语言模型的目的可以归为一下几类:
1.信息获取:提供及时、准确、可信的信息和答案,用户可以问问题、需求建议获取特定领域的知识,这好处在于可以快速获取信息而不需要再浏览搜索结果或者在工具间切换,突出优势是方便,这在信息爆炸的时代是非常突出的重点的,
2.娱乐和消遣:重点是消遣,这里必须突破的点是如何促进用户的多巴胺分泌,显示生活中黄赌毒都能促进大量的多巴胺分泌,同样一样东西,具有两面性,取决于人怎样使用,好比刷抖音/快手,有些人是获取知识,而有些人就是为了看不费脑子的爽图和短视频,如何在这一个过程中让用户不费脑子的消遣是产品设计的重点,但凡需要一些思考,就可能流失一部分用户,但是如果能够挖掘用户的兴趣点,比如有些小朋友喜欢脑筋急转弯,虽然费脑子,猜不中,但是小朋友却很喜欢玩,并且乐此不疲,虽然猜不中,但是总想征服下一个谜底,这个游戏的设计非常有挑战性。
3.社交互动:这是人的情感需求,需要提供的事情绪价值,高质量的共情是这个点必须突破的核心所在。这是满足人的社交需求,在一些情况下,如孤独感、需要倾诉和陪伴是,对话机器人可以提供一种无压力和包容性的交流环境。
不同用户在不同场景对于时间的看法是不一样的,对于互联网等科技工作者,在工作的时间,需要高质量的信息获取以便提升工作的产出和结果,而在下班之后的时间有些人人用来社交、有些人用来娱乐,有些人用来进修,不同的选择对于时间的价值期许是不一样的。
以高铁候车大厅为例,坐在凳子上等车的人中,约85%都盯着手机,其中以30岁左右的人比例最高,在干的事情,主要为聊天(人面对面聊天),和手机交互,和电脑pad交互(极少),吃喝、带娃以及发呆(盯着大屏或者其他场景看),手机占了90%的时间,主要使用的APP主要为微信、抖音、微博、游戏、电话、购物等这几大类,如果想要占据这些人的时间,那么娱乐类是重点。
如果是办公室的白领场景,那么这些人沟通外界的方式更多的是电脑,且在家也多有个人电脑,办公场景更多的需要高做出高质量选择,高质量的信息获取就至关重要,对于程序员、财务、律师、金融、医疗等不同的类型的白领又需要特定领域的知识。
所以在设计一个ChatBot的时候,需要想清楚服务于什么用户(核心用户),刚性需求是什么(痛点),典型的场景(什么时候用,就是你想吞噬用户什么场景的时间,是高铁候车大厅还是程序员办公室工作场景?)以及竞品优势是什么。
大语言模型现状
像GPT-4这样的LLM的出现彻底改变了聊天机器人的设计格局,这些高级模型利用人工智能来理解上下文并生成类似人类的响应。这种转变对聊天机器人设计具有重大影响。
当前各家的模型还处在初始阶段,基本上是模型即服务的状态,通过测试在模型层面上回复质量就是层次不齐的,而对于相同的模型,采用不同retrieve方法引导生成的回复,质量也是不一样的。这种retrieve方法是交互范式的改变。
很多产品将对话机器人以web主打的形式接入公司的官网或者是浏览器插件的形式提供AI功能,web仍然是构建对话机器人的最简单、最干净的方式,并提供设计对话机器人的最大自由度。围绕着的也会有各类平台的app,以增加对话机器人的触及度。
不同的场景中,用户对对自身时间价值的看法是不一样的,期望产生的价值也是不一样的,当前大一统的对话机器人并不能很好的覆盖通用的日常场景,就目前而言并不认为大语言模型会一统所有场景,比如现在吃饭会打开一个APP,购物会打开一个app,比如饿了么,现在的交互范式是我主动搜索,然后下拉一个个看评分看详细介绍,个性化并不智能,大模型可以做到更了解一个人
商业盈利当前仍不是重点,圈地是重点,但是商业化已经在流量以及会员制付费的模式上尝试,并取得了一些进展。
设计师现在可以更专注于完善聊天机器人的对话能力,在特定领域训练它,并确保它为最终用户提供价值,从而产生更具吸引力和更有效的用户体验。
信息获取类都是如此,信息的质量将是大语言模型之间竞争的核心,为了提升大语言模型的回复质量,由此引出了扩充高质量数据集、Fine-tune、RAG、联网信息获取都是在提升回复质量。
大模型进化的方向
用户将从聊天中获取怎样的价值,或者说聊天机器人给用户在什么场景提供怎样的潜在价值是是出发点,换句话说满足了了人性中哪点或哪几点,相对于本我、自我、超我的马斯洛分层模型,我更喜欢用人性劣根性的七宗罪来提炼价值。
设计对话机器人是艺术和科学的融合,结合了用户界面设计UI、用户体验UX、交互设计ID和大模型训练。是用户针对其痛点场景的第一解决方案,产品自始至终的设计都应该牢记对用户提供价值。最核心的是理解用户需求,用户是不懂技术的,让用户学习如何写好prompt的产品体验是不合理的,如果在用户不感知的情况下帮助用户生成高质量的prompt,表面上式我想要,深挖到最后,都可以归结到人性层面,所以有时候用户的问,并不是用户真正想的问题,所以挖掘背后的问并为用户写出正确的Prompt是产品设计中必须考虑的点。
从表面的形式上看,未来大模型发展的趋势如下:
1.各种插件引入,给大模型补充数据、技能,搜索、地图、财经、天气数据等;增加在数据专业性和时效性;
2.应对隐私和幻觉,隐私包括个人电话、地址相关账号登信息的泄露,也包括公司的一些文档、信息、资料等泄露,幻觉是生成可靠的回复,当前的大语言模型是可能生成实事性的错误或者捏造相关事实。
对于幻觉,当前采用如下两种方法居多。
-
Fine-Tuning
-
Retrieval Augmented Generation (RAG).
3.由于部分大语言模型对话已经退出,因而当前已经收集到了海量的真实对话数据,理解机器人失败的原因仍然至关重要。分析见解不仅增强了用户体验,还揭示了聊天机器人设计中的潜在陷阱。通过研究机器人在用户旅程或对话流程中的不足之处,我们可以相应地完善和改进设计。
4.头部互联网公司继续领跑,并且在已有业务和通用对话机器人继续尝试,具有行业数据(金融、医疗、法律、软件等)将会构建行业大语言模型并司内尝试使用;
5.预计24年底到25年上半年,头部互联网通公司根据已有对话机器人收集的数据分析后,大概率会反应过来其以前的通用大模型全品类聊天注定是失败的产品,构建个人助理(类似企业高管的个人助理,只不过这里是大语言模型)大模型才是出路,并且即可可能成长为一下阿里、腾讯、字节,如果是上面三家中的一家,那么市值翻个好几倍也不在话下,个所以如何构建好个人场景的衣食住行等相关服务至关重要,这对于大公司是有优势的,比如字节跳动,旗下的抖音有电商、本地生活、休闲娱乐以及住房等多个维度的产品矩阵,当然在一两个领域里能成功已经是非常大的成功了,比如食这个领域里干掉美团,其实美团的体量很大,但是美团的壁垒并不高。
6.当前规模的大模型门槛越来越低,生态会越来越好,更多的中小公司会依靠大模型带来的能力,将企业提升一个等级,这在民营企业中最有可能出现。
7.未来大模型的规模会越来越大,涌现的能力会令人越来越吃惊,全民拥抱大模型的时代将在10年后来临,当前正处于大模型的进化、技术应用普及阶段。
相关文章:

大模型之十九-对话机器人
大语言模型的最早应用是Chatbot,其实我最早接触语义理解在2014年,2014年做智能音箱的时候,那时也是国内第一批做智能音箱的,在现在看起来当时的智能音箱比较傻,很多问题无法回答,长下文效果也不好ÿ…...

『力扣刷题本』:删除排序链表中的重复元素
一、题目 给定一个已排序的链表的头 head , 删除所有重复的元素,使每个元素只出现一次 。返回 已排序的链表 。 示例 1: 输入:head [1,1,2] 输出:[1,2]示例 2: 输入:head [1,1,2,3,3] 输出&am…...

Android S从桌面点击图标启动APP流程 (六)
系列文章 Android S从桌面点击图标启动APP流程 (一)Android S从桌面点击图标启动APP流程 (二) Android S从桌面点击图标启动APP流程 (三) Android S从桌面点击图标启动APP流程 (四) Android S从桌面点击图标启动APP流程 (五) Android 12的源码链接: android 1…...

Java I/O (输入/输出)
1.流的概念 流是一种有序的数据序列,根据操作类型,可以分为输入流和输出流两种。I/O流(输入输出)提供了一条通道程序,可以使用这条通道把源中的字节序列送到目的地。 1.1 输入流: 程序从指向源的输入流中读…...

nodejs+vue食力派网上订餐系统-计算机毕业设计
采用当前流行的B/S模式以及3层架构的设计思想通过 技术来开发此系统的目的是建立一个配合网络环境的食力派网上订餐系统,这样可以有效地解决食力派网上订餐管理信息混乱的局面。 本设计旨在提高顾客就餐效率、优化餐厅管理、提高订单准确性和客户的满意度。本系统采…...

【计算机视觉】对极几何
文章目录 一、极线约束(Epipolar Constraint)二、相机标定过的情况三、相机没有标定过的情况四、八点算法(eight-point algorithm) 我的《计算机视觉》系列参考UC Berkeley的CS180课程,PPT可以在课程主页看到。 在上一…...

强大易于编辑的流程图组织图绘制工具draw.io Mac苹果中文版
draw.io可以绘制多种类型的图表,包括但不限于流程图、组织结构图、网络图、UML图、电气工程图等。draw.io提供了丰富的图形元素和编辑功能,使用户能够轻松地创建和编辑各种复杂的图表。同时,该软件还支持多种导出格式,方便用户在不…...

c# .net6 在线条码打印基于
条码打印基于:BarTender、ORM EF架构 UI展示: 主页代码: using NPOI.OpenXmlFormats.Spreadsheet; using ServerSide.Models; using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawi…...

Hive SQL的编译过程
1.MapReduce实现基本SQL操作的原理 详细讲解SQL编译为MapReduce之前,我们先来看看MapReduce框架实现SQL基本操作的原理 1.1 Join的实现原理 select u.name, o.orderid from order o join user u on o.uid = u.uid; 在map的输出value中为不同表的数据打上tag标记,在reduce阶段…...

[架构之路-245/创业之路-76]:目标系统 - 纵向分层 - 企业信息化的呈现形态:常见企业信息化软件系统 - 企业资源管理计划ERP
目录 前言: 一、企业信息化的结果:常见企业信息化软件 1.1 企业资源管理计划 1.1.1 什么是ERP:企业最常用的信息管理系统 1.1.2 ERP的演进过程 1.1.3 EPR模块 1.1.4 EPR五个层级 1.1.5 企业EPR业务总体流程图 1.1.6 什么类型的企业需…...

数据库简史:多主数据库架构的由来和华为参天引擎的机遇
注:本文发表后,收到了很多后台反馈,其中关于大型机的早期成就不容省略。微调重发本文,纯属个人观点,错谬之处,仍然期待指正。 2023年10月13日,在北京举办的“2023金融业数据库技术大会"上&…...

C语言每日一练(二)
单链表经典算法专题 一、 单链表相关经典算法OJ题1:移除链表元素 解法一:在原链表中删除Node.nextnext的节点 typedef struct ListNode ListNode; struct ListNode* removeElements( ListNode* head, int val) {ListNode* pcur head;ListNode* pre h…...

HashJoin 在 Apache Arrow 和PostgreSQL 中的实现
文章目录 背景PostgreSQL HashJoin实现PG 执行器架构HashJoin 基本流程HashJoin 实现细节Join 类型HashJoin 的划分阶段HashJoin 的分批处理阶段JOIN 类型的状态机转换HashJoin 的投影和过滤 Arrow Acero HashJoin实现Acero 基本框架HashJoin 基本流程 总结 背景 近两个月转到…...

FL Studio21.2.0.3421最新汉化破解版中文解锁下载完整版本
音乐在人们心中的地位日益增高,近几年音乐选秀的节目更是层出不穷,喜爱音乐,创作音乐的朋友们也是越来越多,音乐的类型有很多,好比古典,流行,摇滚等等。对新手友好程度基本上在首位,…...

docker在java项目中打成tar包
docker在java项目中打成tar包 1、首先安装一个docker desktop 2、mvn install项目后,建立一个自己的dockerfile 这里我以我的代码举例,from 镜像,这里你也能打包好一个镜像的基础上,from打好的镜像,这里我们用openj…...

No175.精选前端面试题,享受每天的挑战和学习
🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云课上架的前后端实战课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你从入…...

【网安AIGC专题10.19】论文6:Java漏洞自动修复+数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会
How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面摘要贡献发现 介绍背景:漏洞修复需求和Java漏洞修复方向动机方法贡献 数据集先前的数据集和Java漏洞Benchmark数据集扩展要求数据处理工作最终数据集 VJBenchVJBench 与 Vul4J 的…...

解决国外镜像无法访问导致的R包无法安装问题
我自己的方法: install.packages("vcd", repos "https://mirrors.tuna.tsinghua.edu.cn/CRAN/") R包安装镜像设置的三种方法:R包安装镜像设置的三种方法 - 简书 更新了Rstudio后,出现 unable to access index for rep…...

【2021集创赛】Robei杯一等奖:基于Robei EDA工具的隔离病房看护机器人设计
本作品参与极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动。 团队介绍 参赛单位:重庆交通大学 队伍名称:一丘之貉 指导老师:毕波 李艾星 参赛队员:郁航 张坤 秦衡 总决赛奖项:Robei杯一等奖…...

Python之函数-传实参的两种方式
Python之函数-传实参的两种方式 函数参数 函数在定义是要定义好形式参数,调用时也提供足够的实际参数,一般来说,形参和实参个数要一致(可变参数除外)。实参传参方式 1、位置传参 定义时def f(x, y, z), 调用使用 f(1, 3, 5)&am…...

Hive客户端和Beeline命令行的基本使用
本专栏案例数据集链接: https://download.csdn.net/download/shangjg03/88478038 1.Hive CLI 1.1 命令帮助Help 使用 `hive -H` 或者 `hive --help` 命令可以查看所有命令的帮助,显示如下: usage: hive-d,--define <key=value> Variable subsitution to ap…...

Ubuntu 22.04自动登录进入桌面
1.编辑gdm3配置文件 sudo vim /etc/gdm3/custom.conf 2.修改内容为 AutomaticLoginEnableTrue AutomaticLoginusername 3.查看和重启服务 # 查看服务状态 systemctl --user status gnome-remote-desktop.service # 重启服务 systemctl --user restart gnome-remote-deskt…...

C#__简单了解XML文档
/* XML(可扩展标记语言):用于传输和存储数据 XML文档:树结构;包含根元素 XML元素:从开始标签到结束标签的部分 XML语法规则: 1、所有XML元素都必须有结束标签 …...

云游数智农业世界,体验北斗时空智能
今日,2023年中国国际农业机械展览会在武汉正式拉开帷幕,众多与会者云集,各类农机产品纷呈,盛况空前。 千寻位置作为国家北斗地基增强系统的建设与运营方,在中国国际农业机械展览会上亮相,以「北斗时空智能 …...

C# 递归算法使用简介_常用整理
一、递归简介 递归算法是一种直接或者间接调用自身函数或者方法的算法。 递归算法的实质是把问题分解成规模缩小的同类问题的子问题,然后递归调用方法来表示问题的解。递归算法对解决一大类问题很有效,它可以使算法简洁和易于理解。 递归本质是循环&a…...

[Python]unittest-单元测试
目录 unittest的大致构成: Test Fixture Test Case-测试用例 Test Suite-测试套件 Test Runner 批量执行脚本 makeSuite() TestLoader discover() 用例的执行顺序 忽略用例执行 skip skipIf skipUnless 断言 HTML测试报告 错误截图 unittest是python中的单元测…...

Jetpack:021-Jetpack中的滑动列表
文章目录 1. 概念介绍2. 使用方法2.1 函数参数2.2 列表成员 3. 示例代码4. 内容扩展5. 内容总结 我们在上一章回中介绍了Jetpack中底部导航栏相关的内容,本章回中主要介绍 滑动列表。闲话休提,让我们一起Talk Android Jetpack吧! 1. 概念介绍…...

基于单片机的空气质量检测系统
欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 技术交流认准下方 CSDN 官方提供的联系方式 文章目录 概要 一、主要内容二、系统方案设计2.1 系统方案设计2.2 主控制器模块选择 三、 系统软件设计4.1 程序结构分析4.2系统程序…...

论文阅读——InstructGPT
论文:Training_language_models_to_follow_instructions_with_human_feedback.pdf (openai.com) github:GitHub - openai/following-instructions-human-feedback 将语言模型做得更大并不能从本质上使它们更好地遵循用户的意图。例如,大型语…...

【表面缺陷检测】铝型材表面缺陷检测数据集介绍(含xml标签文件)
一、铝型材介绍 铝型材是一种由铝合金材料制成的,具有固定截面形状和尺寸的条形建材。由于其优良的物理性能和广泛的应用领域,铝型材在现代工业和生活中发挥着重要的作用。 1、铝型材的分类 根据截面形状的不同,铝型材可分为角铝、槽铝、工…...