AI 使人机交互发生根本性转变 AI芯片主战场,变了
语言将主导AI交互界面,同时AI应用正逐步适应人类
AI正创造人为中心和基于代理的未来。
这是 OpenAI 首位投资人 Vinod Khosla 关于 AI 交互与革命的最新洞察。Khosla 对常见术语“AI 硬件”和“小工具”表示怀疑,他主张从一个新的视角来看待这些设备,认为它们是即将到来的时代中不可或缺的组成部分,这个时代的特点是以低延迟语音交互作为主要的用户界面。
Khosla 强调,这不仅仅是关于设备的讨论,而是关于人机交互根本性转变的讨论。他认为 AI 将在我们与技术的关系中引发两个根本性的变化。首先,语音——已经是最自然的人类互动界面——将成为主导的交互界面。
想象一下,延迟时间减少到不到半秒,这与基于触摸的设备的迟缓形成了鲜明对比。甚至“无声语音”也在讨论之中——在公共场合如咖啡厅中,无需发出声音即可发出命令。通过检测这种“无声言语”,技术将允许人们在公共场所私下口述,而不被旁人听见。
第二个变革是应用程序将如何适应我们。不再需要像学习使用 Uber 或 SAP、Oracle 这样的复杂系统一样,去学习如何导航应用程序。
到目前为止,我们总是在适应软件——学习它的复杂性,记住层次化的菜单等等,以此来与机器通信。
现在,AI 正在使软件适应人类。这将导致新类型的硬件的诞生,这些硬件主要设计用于语音互动,计算机学习人类的语言和人类本身。虽然对于某些视觉任务可能仍然需要屏幕,但核心交互将转向语音——无论是无声的还是有声的。
设计师 Jony Ive 和 OpenAI 的 Sam Altman 讨论了一个 AI 硬件项目。多年前开始的 Humane 猜测了这种接口——但早期的热度很快消退了。这些企业家的方向是正确的,但他们的实现没有充分专注于 AI 使能的新用户体验。
Rabbit 凭借其最小化的设备引起了轰动,使得微软 CEO Satya Nadella 称其 R1 发布为“我看过的最令人印象深刻的展示之一,自 Steve Jobs 在 2007 年介绍 iPhone 以来,捕捉到了什么是可能的愿景。”
Khosla Ventures 也是 Rabbit 的投资者之一,有新 Newin 曾在第一时间分享过《【2.1 万字实录】Rabbit 创始人&CEO 吕骋最新对谈|R1 更像是 AI + iPod,而不是 iPhone 杀手》。
Khosla 认为 Rabbit 是重新定义人机交互在强大 AI 世界中的早期尝试。这些设备将围绕着我们应该通过自然语言用声音与计算机(或可以为我们运行应用的代理)对话的理念为中心,而不是通过人造构造。
以 Khosla 个人的生活习惯为例。当他徒步时,他会使用一个叫做 Picture This 的应用来识别我遇到的植物,但这个过程很麻烦:停下来,暂停有声读物,打开应用,拍照,等待答案加载,关闭应用,把手机放回口袋。
有了这项新技术,他只需将设备指向植物并问:“这是什么植物?”便会得到答案,然后我可以说“播放有声读物”并继续听我的书,无需中断或麻烦。
从成本角度看,这种以语音驱动的方法是一个游戏规则的改变者。它比传统的智能手机要便宜得多。形态因素的创新也很可能,尽管配备更大屏幕的手机不会消失。
Rabbit 的大型动作模型(LAM),基于神经符号方法,学会使用软件应用并跨应用工作,因此人类不需要了解其他应用或网站。Rabbit 的代理将与人类交谈并为他们使用这些应用。
语音比打字或触摸屏更简单、更高效。高分辨率图形和触摸界面要求昂贵、复杂的计算。相比之下,驱动 ChatGPT 和其他聊天机器人的非常大的 5000 亿参数大型语言模型试图学习所有曾经发布的内容。
Rabbit 的 LAM 表现得更像是学习如何使用应用和其他 LLM 的人类,因此人类不需要学习它们或掌握提示工程。LAM 学习使用软件的方式就像人类一样,而不是通过应用程序编程接口与应用通信,如传统软件所做的。
想象有人在你滑动手机时偷看你的肩膀并学习那些模式。那就是 LAM——或者未来可能被称为的东西。这是传统范式的完全颠覆,意味着最终我们不必与软件交互,因为 AI 将代表我们这样做。
手机,就像现在这样,被设计来分散我们的注意力。如果 Khosla 在徒步时不得不拿出手机,会看到电子邮件、短信和其他通知;他会被拉进某个社交平台,被广告打扰,甚至可能下陷入一个漩涡,毫不夸张地说。
手机不断争夺我们的注意力,将我们拉入通知和消息的漩涡。这些新设计,如 Rabbit,旨在节省时间并最小化分心。你告诉它要做什么,它就仅仅做那个,没有更多。
初创公司可以如此敏捷和创新!技术的未来不是关于渐进式变化或过去的外推,这不仅仅是关于制造另一个 iPhone 16 或 17——尽管那些将继续非常有价值。这是关于我们与设备互动方式的根本性转变,这是以 AI 为中心的,需要新的设计和新的优先级,硬件支持。初创公司最适合这样的转变。现有的大公司肯定会慢慢跟进。
这就像 Apple 支配手机市场之前的手机市场。在 2006 年,大名鼎鼎的是 Nokia、Motorola,也许还有 Samsung 和 BlackBerry。Apple 当时甚至还没有进入这个画面。
然后它突然推出 iPhone,彻底改变了游戏规则。通过一个创新的以用户为中心的触摸界面,在这个高度便携的计算机中,成为可能的数百万应用。
正因为下一个阶段不是关于硬件或小工具,而是关于人类与计算机互动方式的彻底改造,我们将把像 Rabbit 的 R1 这样的设备添加到我们的装备中。我们将使用一个按钮设备,通过自然语言驱动大多数互动,屏幕如我们所知将成为次要。
这些新设备能够做的很多事情可以通过在传统设备如智能手机上的“代理”应用来完成。但智能手机不提供亚秒级的、无干扰的互动和其他独特功能,这些是人类中心的 AI 将启用的。
新技术将出现以支持这个生态系统,如 植入隐形眼镜和眼镜的显示器 和许多不同的方法来 无声言语,以便在公共场所隐秘地使用设备。
这些设备正在发明一个以人为中心和基于代理的未来,由新的 AI 技术启用。Rabbit 正在对此进行真正的尝试,这不仅仅是一个渐进式的变化。其他人肯定会跟进,创造许多便于携带和使用的设备。
Apple 带给我们“有一个应用可以做到那个”的世界。Rabbit 式的设备将带给我们“有一个 AI 可以做到那个”的世界,通过一个以语音驱动的个人代理访问,可以为你运行应用(END)。
从训练芯片转向推理芯片
英伟达主导的AI芯片大战已经转向了一个新的战线——一个规模更大但也更具竞争力的战线。
英伟达通过提供训练人工智能模型这一极其复杂的工作所必需的芯片,将自己打造成一家价值2万亿美元的公司。随着行业的快速发展,更大的机会将是销售芯片使这些模型在训练后运行的芯片,为快速增长的实际使用生成式人工智能工具的公司和人们生产文本和图像。
目前,这种转变正在增加英伟达的销量。首席财务官科莱特·克雷斯 (Colette Kress) 上周表示,去年Nvidia数据中心业务的40%以上(收入超过470亿美元)用于部署人工智能推理系统,而不是训练。这一百分比是转变正在进行的第一个重要迹象。
克雷斯的评论缓解了一些担忧,即向部署人工智能系统的芯片(即执行所谓“推理”工作的芯片)的转变威胁到了英伟达的地位,因为与制造英伟达的芯片相比,这项工作可以使用功能更弱、成本更低的芯片来完成。
Melius Research分析师Ben Reitzes在给客户的一份报告中表示:“人们认为Nvidia在推理领域的份额将低于训练领域。” “这一发现有助于揭示其从即将到来的推理爆炸中受益的能力。”
许多竞争对手认为,随着推理芯片变得更加重要,他们在人工智能市场上拥有更好的机会。
生产数据中心中央处理器的英特尔公司相信,随着客户专注于降低人工智能模型的运行成本,其芯片将越来越有吸引力。英特尔专门生产的芯片类型已经广泛用于推理,在执行该任务时,拥有Nvidia的尖端且更昂贵的H100 AI芯片并不那么重要。
英特尔首席执行官帕特·基辛格 (Pat Gelsinger) 在去年12月的一次采访中表示:“推理的经济学是,我不会承受40,000美元的H100环境,因为它会消耗太多电量,需要新的管理和安全模型以及新的 IT 基础设施。” “如果我可以在标准 [英特尔芯片] 上运行这些模型,那是理所当然的。”
美国银行分析师Vivek Arya表示,向推理的转变可能是英伟达季度收益报告周三出现的最重要消息,该报告超出了华尔街的预期,导致其股价本周上涨8.5%,推动该公司估值约为2万亿美元。
Arya表示,随着对人工智能模型的训练投资激增,焦点转向从人工智能模型中创收,推理能力将会上升。与英伟达占据主导地位的人工智能训练相比,这可能更具竞争力。
推理增长的速度可能比之前预期的要快。今年早些时候,瑞银分析师估计90%的芯片需求来自训练,而这一推论到明年只会推动20%的市场份额。分析师在一份报告中表示,英伟达大约40%的数据中心收入来自推理,“这个数字比我们预期的要大”。
事实上,英伟达周三的财务业绩表明,其在人工智能芯片领域超过80%的市场份额尚未受到严重挑战。英伟达用于训练人工智能系统的芯片预计在可预见的未来仍将保持旺盛的需求。
在训练人工智能系统时,公司通过模型运行海量数据,教它们以能够实现人类发音表达的方式预测语言。这项工作需要强大的计算能力,非常适合Nvidia的图形处理单元(GPU)。
推理工作是指这些模型被要求处理新的信息并做出响应——更轻松的提升。
除了英特尔和AMD等Nvidia的老牌竞争对手之外,随着推理成为焦点,许多人工智能芯片初创公司也可能获得发展动力。
“我们看到我们的推理用例呈爆炸式增长,”SambaNova 的首席执行官罗德里戈·梁 (Rodrigo Liang) 说,SambaNova是一家初创公司,将人工智能芯片和软件相结合,可以进行推理和训练。“人们开始意识到 80% 以上的成本将用于推理,我需要寻找替代解决方案,”他说。
Groq 是一家由前谷歌人工智能芯片工程师乔纳森·罗斯 (Jonathan Ross) 创立的初创公司,近几个月来,该公司主页上的演示展示了其推理芯片可以如何快速地从大型语言模型中生成响应,因此引起了人们的兴趣激增。罗斯表示,该公司预计今年将部署42,000个芯片,明年将部署100万个芯片,但正在探索将芯片总数今年增加到220,000个,明年增加到150万个。
他说,推动这一转变的一个因素是,一些最先进的人工智能系统正在被调整,以产生更好的响应,而无需重新训练它们,从而将更多的计算工作推向推理。他说,Groq的专业芯片比Nvidia或其他芯片公司的产品运行速度更快、成本更低。
“据此推断,你可以部署什么取决于成本,”他说。“有很多模型可以在谷歌接受训练,但它们中大约80%没有得到部署,因为它们太贵了,无法投入生产。”
大型科技公司——包括 Meta、微软,谷歌和亚马逊——一直致力于内部开发推理芯片,认识到即将到来的转变以及能够更便宜地进行推理的好处。
例如,亚马逊自2018年以来就拥有推理芯片,该公司云计算部门数据和机器学习副总裁斯瓦米·西瓦苏布拉马尼安 (Swami Sivasubramanian) 去年表示,推理占其Alexa智能助手计算成本的40%。
就英伟达而言,它正在寻求在向推理过渡的过程中保持领先地位。去年,一款即将推出的芯片在一项关键的人工智能推理基准测试中取得了行业领先的结果,延续了该公司多年来在竞争中的主导地位。
去年12月,AMD推出了新的人工智能芯片,据称其推理能力优于Nvidia的芯片后,Nvidia在一篇博客文章中予以回击,对这一说法提出质疑。英伟达表示,AMD在宣称其性能时并未使用优化软件,如果这样做,英伟达的芯片速度将是原来的两倍。
相关文章:
AI 使人机交互发生根本性转变 AI芯片主战场,变了
语言将主导AI交互界面,同时AI应用正逐步适应人类 AI正创造人为中心和基于代理的未来。 这是 OpenAI 首位投资人 Vinod Khosla 关于 AI 交互与革命的最新洞察。Khosla 对常见术语“AI 硬件”和“小工具”表示怀疑,他主张从一个新的视角来看待这些设备&a…...
容器库(12)-std::unordered_multiset
unordered_multiset是以key为元素无序的关联容器,搜索、移除和插入操作是平均常数的时间复杂度。unordered_multiset在内部没有按任何顺序排列,而是放在桶当中的,放进哪个桶是通过计算key的hash值来决定的。和unordered_set不同的是ÿ…...
Mysql学习之事务日志undolog深入剖析
Undo log redo log 是事务持久性的保证,undo log是事务原子性的保证。在事务中更新数据的前置操作其实是要先写入一个undo log。 如何理解undo 日志? 事务需要保证原子性,也就是事务中的操作要么全部完成,要么什么也不做。但有时…...
springboot整合druid及可能遇到的问题
第一步,导入druid的maven依赖 在这里,我们选择导入druid-spring-boot-starter,使用配置文件的形式进行配置(不需要再编写配置类) <dependency><groupId>com.alibaba</groupId><artifactId>dr…...
c++文件的打开、读写和关闭。缓冲区的使用和控制。
在C中,文件的打开、读写和关闭通常使用标准库中的文件流对象(如std::ifstream用于输入文件,std::ofstream用于输出文件)来完成。这些对象封装了与操作系统交互的底层细节,使得文件操作更为简单和安全。 以下是文件打开…...
网络层的DDoS攻击与应用层的DDoS攻击之间的区别
DDoS攻击(即“分布是拒绝服务攻击”),是基于DoS的特殊形式的拒绝服务攻击,是一种分布式、协作的大规模攻击方式,主要瞄准一些企业或政府部门的网站发起攻击。根据攻击原理和方式的区别,可以把DDoS攻击分为两…...
Windows系统安全策略设置之本地NTLM重放提权
经安全部门研究分析,近期利用NTLM重放机制入侵Windows 系统事件增多,入侵者主要通过Potato程序攻击拥有SYSTEM权限的端口伪造网络身份认证过程,利用NTLM重放机制骗取SYSTEM身份令牌,最终取得系统权限,该安全风险微软并…...
AI云增强升级!还原生动人像,拍出质感照片
近期不少细心用户发现,在用HUAWEI Mate 60 Pro手机拍照后,使用相册中的AI云增强功能,照片变得更加细腻有质感。这是因为AI云增强升级并更新支持了人像模式拍摄的照片,高清自然的人像细节还原和单反级别的光学景深效果,…...
PHP WebSocket:技术解析与实用指南
本文旨在帮助初学者掌握在PHP中使用WebSocket的关键概念和技术。我们将深入讨论从建立连接、绑定到监听等各方面的操作,并提供易于理解和实践的指导。 一、socket协议的简介 WebSocket是什么,有什么优点 WebSocket是一个持久化的协议,这是…...
K8S实战:Centos7部署Kubernetes1.24.0集群
本人在参考Kubernetes(k8s) 1.24.0版本基于Containerd的集群安装部署部署Kubernetes1.24.0集群时,遇到几个问题,下面将要注意的点罗列在下面: 集群需要配置hosts,如下所示,IP根据自己的实际情况填写,否则在kubeadm in…...
webpack的使用(中)
前言:(承接webpack的使用(上))在实际开发过程中,webpack 默认只能打包处理以 .js 后缀名结尾的模块,其他非 js 后缀名结尾的模块,webpack 默认处理不了,需要调用 loader 加载器才可以正常打包&a…...
matlab经验模式分解的R波检测算法
1、内容简介 略 56-可以交流、咨询、答疑 2、内容说明 略 心血管疾病是威胁人类生命的主要疾病之一,而心电信号(electrocardiogram, ECG) 则是评价心脏功能的主要依据,因此,关于心电信号检测处理的研究一直为各方所…...
win10编译openjdk源码
上篇文章作者在ubuntu系统上实践完成openjdk源码的编译,但是平常使用更多的是window系统,ubuntu上编译出来JDK无法再windows上使用。所以作者又花费了很长时间在windows系统上完成openjdk源码的编译,陆续花费一个月的时间终于完成了编译。 本…...
mysql 自定义函数create function
方便后续查询,做以下记录; 自定义函数是一种与存储过程十分相似的过程式数据库对象, 它与存储过程一样,都是由 SQL 语句和过程式语句组成的代码片段,并且可以被应用程序和其他 SQL 语句调用。 自定义函数与存储过程之间…...
【析】装卸一体化车辆路径问题的自适应并行遗传算法
0 引言 国内外有关 VRPSPD的文献较多,求解目标多以最小化车辆行驶距离为主,但现实中可能存在由租赁费用产生的单次派出成本,需要综合考 虑单次派车成本和配送路径成本。…...
react项目中的redux以及react-router-dom
扫盲知识点: 1 传递自定义事件: <button onClick{(e)>{change(e)}}>获取事件对象e</button> 将事件对象e传递到了change的这个方法中。 2 同时传递自定义事件和参数: <button onClick{(e)>{change(‘我…...
django学习网址
https://www.django.cn/ Django中文网 https://docs.djangoproject.com/zh-hans/5.0/ Django 教程 | 菜鸟教程 (runoob.com) https://gitee.com/djangoadmin/DjangoAdmin_Django_Layui DjangoStarter: 基于Django定制的快速Web开发模板,功能包括:Do…...
@ 代码随想录算法训练营第4周(C语言)|Day21(二叉树)
代码随想录算法训练营第4周(C语言)|Day21(二叉树) Day21、二叉树(包含题目 ● 530.二叉搜索树的最小绝对差 ● 501.二叉搜索树中的众数 ● 236. 二叉树的最近公共祖先 ) 530.二叉搜索树的最小绝对差 题目…...
Android的消息机制--Handler
一、四大组件概述 Android的消息机制是由Handler、Message、MessageQueue,Looper四个类支撑,撑起了Android的消息通讯机制,Android是一个消息驱动系统,由这几个类来驱动消息与事件的执行 Handler: 用来发送消息和处…...
获取用户信息与token理解
获取用户信息和token是在开发Web应用程序时常见的需求,可以通过以下步骤来实现: 用户登录:用户在应用程序中输入用户名和密码进行登录验证。一旦验证成功,应用程序会生成一个唯一的token,并将其返回给客户端。存储tok…...
网络设备和网络软件
文章目录 网络设备和网络软件网卡交换机交换机的三个主要功能交换机的工作原理第二层交换和第三层交换交换机的堆叠和级联 路由器路由器工作原理 网关网关的分类 无线接入点(AP)调制解调器网络软件 网络设备和网络软件 网卡 网络接口卡又称网络适配器,简称网卡。网…...
全连接层是什么
个人浅显的看法: 当前层的每一个神经元,都和下一层的每一个神经元有连接,叫全连接层。 当前层有n个神经元,下一层有m个神经元,则全连接层,当前层的n个神经元和下一层m个神经元都有连接...
JAVA工程师面试专题-《Redis》篇
目录 一、基础 1、Redis 是什么 2、说一下你对redis的理解 3、Redis 为什么这么快? 4、项目中如何使用缓存? 5、为什么使用缓存? 6、Redis key 和value 可以存储最大值分别多是多少? 7、Redis和memcache有什么区别…...
JavaScript BOM
BOM:浏览器对象模型,可以让我们通过js来操作浏览器 window 代表整个浏览器窗口 同时也是页面中的全局对象 Location 代表浏览器地址栏信息 Navigator 代表浏览器信息 可以获取不同的浏览器信息 History 代表浏览器的历史记录 Screen 代表用户的屏幕信…...
uniapp微信小程序-项目实战修改密码
图标是使用uview里面的图标,icfont也可以 以下是所有代码 <template><view><!-- 密码三个 --><view class"password" v-for"(item,index) in userList"><view class"contentuser"><view class&qu…...
linux系统---防火墙拓展
目录 一、iptables 1.基本语法 2.四表五链——重点记忆 2.1四表 2.2五链 2.3总结 3.iptables选项示例 3.1 -Z 清空流量计数 3.2 -P 修改默认规则 3.3 -D 删除规则 3.4 -R 指定编号替换规则 4.白名单 5.通用匹配 6.示例 6.1添加回环网卡 6.2可以访问端口 6.3 主…...
就业的二三事
先说一下当前本人的情况:双非本一,研二在读,一篇图像处理方面的sci一区(二作),日常工作语言为python,有过一段开源实习。要开始准备实习了,发个帖子记录一下自己所收集的信息。 前几…...
Go语言必知必会100问题-05 接口污染
接口污染 在Go语言中,接口是我们设计和编写代码的基石。然而,像很多概念一样,滥用它是不好的。接口污染是指用不必要的抽象来编写代码(刻意使用接口),使得代码更难以理解。这是具有不同习惯,特…...
FastBee商业版本源码获取下载
一、系统功能 系统功能功能说明开源版本商业版本产品管理产品详情、产品物模型、产品分类、设备授权、产品固件支持支持设备管理设备详情、设备分组、设备日志、设备分享、设备实时控制、实时状态、数据监测支持支持物模型管理属性(设备状态和监测数据)…...
Java实战:Spring Boot集成Elasticsearch全文搜索引擎
本文将详细介绍如何在Spring Boot应用程序中集成Elasticsearch全文搜索引擎。我们将探讨Elasticsearch的基本概念,以及如何使用Spring Boot和Spring Data Elasticsearch模块来实现全文搜索功能。此外,我们将通过具体的示例来展示如何在Spring Boot应用程…...
福州网站快速排名/阳泉seo
6 命名空间的应用在C中,使用“命名空间”,是为了更好地管理代码。例如,程序员A定义了一个处理字符串的string类,程序员B定义了一个处理字符串的string类。那么,都是同样的类名string,但是,功能可…...
wordpress showposts/2021百度最新收录方法
计算机网络 练习(一百一十) 当使用时间到达租约期的()时,DHCP 客户端和 DHCP 服务器将更新租约。 A. 50% B. 75% C. 87.5% D. 100% ---------------------------------------- 答案: A 解析: …...
公司网站建设 wordpress/百度投稿平台
有一种工作是经常要接触视频的,目前很多的视频平台对视频的要求还是很高的,有一个上传视频大小的限制,超过这个大小的视频无法正常进行发布,过大的视频需要压缩变小,下面介绍具体的压缩方法,,那…...
个人互动网站/seo网站优化优化排名
G 题意: 就是给你n个关卡,每个关卡有多个前置关卡,只有把所有的前置关卡都打败,自己才能进入。然后每个关卡有一个防御值和特性值,如果小牛攻击力比他高,或者小牛有这个特性值,那么就可以打败他…...
如何建立一个公网可以访问的网站/2022年热点营销案例
首先下载安装git:https://git-scm.com/downloads/ 一路默认,安装完成后,打开文件夹C:\Users\Administrator\.ssh(Administrator是当前用户名),在空白处点鼠标右键选择“Git Bush Here” ,打开g…...
深圳市住建局和建设局官网/seo排名怎么做
参考链接: class.__mro__ 参考链接: class.mro() 参考链接: class.__subclasses__() 实验代码展示: # class Person(): # class Person(object): # class Person: class Person: # class Person(object): # class Person: # class Person(): 这三种写法都是可以的定义基类Pe…...