Sam Altman专访:GPT-4没太让我惊讶,ChatGPT则让我喜出望外
导读
ChatGPT、GPT-4 无疑是 2023 年年初人工智能界最大的「爆款」。3 月 26 日,OpenAI CEO、ChatGPT 之父 Sam Altman 接受了著名学者与科技播客、麻省理工大学研究员 Lex Fridman 的专访,Sam 分享了从OpenAI内部视角如何看待ChatGPT和GPT-4的里程碑式意义。智源社区整理了其中关于GPT-4的部分,供读者参考。
要点
▲ 我无法知晓历史书会对 GPT 的各个版本怎么评价。但如果非要我挑出一个至今看到的关键节点,我认为仍然是 ChatGPT。GPT-4 并没有太令我惊讶,ChatGPT 则让我有些喜出望外。
▲ 从某种程度上来说,GPT-4 系统增强了人类智能,可以被应用于各种各样的场景。
▲ 系统的易用性本身有时比基础模型的能力更重要。
▲ GPT-4 还不具备意识,也无法取代优秀的程序员。真正具有意识的人工智能应该能够告诉别人自己有意识,能表达自己的痛苦等情绪,理解自己的处境,有自己的记忆,并且能与人交互。
▲ 人工智能将对人类的生活质量带来巨大提升,我们可以治愈疾病、创造财富、增加资源、让人类感到快乐......看似人类不需要工作了,但是人类还需要社会地位、需要激情、需要创造、需要感受到自己的价值。因此,人工智能时代来临后,我们需要做的是找到新的工作、生活方式,拥抱新技术带来的巨大提升。
Sam Altman
OpenAI创始人之一,现任Y Combinator总裁、美国人工智能实验室OpenAI首席执行官。带领人工智能实验室OpenAI开发出聊天机器人程序ChatGPT,被媒体称为“ChatGPT之父”。
如果在维基百科上书写AI的历史,ChatGPT仍是最关键的节点
Q1
(L指代Lex Fridman,S代指Sam Altman)
L:什么是 GPT-4?它是怎样工作的?它最神奇的地方是什么?
S:现在回头来看,它还是很很初级的人工智能系统,其工作效率较低、存在一些小毛病,许多事完成得也不尽人意。尽管如此,它仍然为未来真正重要的技术指出了一条发展路径(即使该过程花费了几十年的时间)。
Q2
L:50 年后,当人回首早期的智能系统,GPT-4 会是一个真正巨大的飞跃吗,这是否是一个关键时刻?当人们在维基百科上书写人工智能的历史,会写上哪个版本的 GPT?
S:这个进步的过程是持续的,很难明确指定出一个历史性的时刻。我无法知晓历史书会对 GPT 的各个版本怎么评价。但如果非要我挑出一个至今看到的关键节点,我认为是 ChatGPT。ChatGPT 真正重要的并不是它的底层模型本身,而是如何利用底层模型,这涉及到基于人类反馈的强化学习(RLHF)及其接口。
Q3
L:RLHF 如何使 ChatGPT 有如此惊艳的性能?
S:我们用大量的文本数据训练了这些模型。在此过程中,他们学到了一些底层表征相关的知识,从而可以做一些惊艳众人的事情。但是在刚完成训练时,如果我们马上使用这个基础模型,尽管它可以在测试集上有很好的性能,但是它还并不太易于使用。为此,我们引入了一些人类反馈,实现了 RLHF。最简单的 RLHF 是:向模型给出两个版本的输出,让它判断人类评价者会更喜欢哪一个,然后通过强化学习将该信息反馈给模型。RLHF 出奇地有效,我们可以用极少的数据使模型更实用,我们通过该技术让模型与人类需求对齐,更容易给出对人有帮助的正确答案。无论基础的模型能力如何,系统的易用性十分关键。
Q4
L:如何理解通过使用 RLHF 技术,我们不再需要那么多的人类监督?
S:公平地说,相较于最初创建预训练大模型的科学研究,我们对这一部分的研究还处于早期,但是需要的数据确实更少了。
L:对于人类指导的研究十分有趣,也十分重要。我们通过这类研究理解如何让系统更实用、更智能、符合道德规范和人类的意图。引入人类反馈的过程也十分重要。
Q5
L:预训练数据集的大概有多么巨大?
S:我们费了很大力气与合作伙伴一起从互联网上的各个开源的数据库上抓取到了这些预训练数据,构建了庞大的数据集。实际上,除了 Reddit、报纸等媒体,世界上还有很多内容是大多数人意想不到的。清洗数据、过滤数据比收集数据更困难。
Q6
L:构建 ChatGPT 需要解决很多问题,例如:模型架构规模的设计,数据的选择,RLHF。这些部分结合起来有何神奇之处?
S:GPT-4 是我们真正推出的 ChatGPT 最终产品内部的版本,创造它所需的零部件数量还很难知晓,工作量很大。在早期的每个阶段,我们需要想出新的思路,或者很好地执行现有的想法。
L:GPT-4 中的一些技术步骤已经相对成熟,例如:在完成完整的训练模型之前,预测模型将会达到的性能。如何根据少量的训练就能知道训练完整的系统的特殊特性?就好比看到一个一岁的婴儿,就能知道他在高考中获得多少分。
S:这一成就令人惊讶,背后涉及许多的科学因素,最终达到人类所期待的智力水平。这一实现过程比我能够想象的要科学的多。正如所有新的科学分支一样,我们会发现一些无法拟合数据的新东西,并对此给出更好的解释,这正是科学发展的过程。尽管我们已经在社交媒体上发布了 GPT-4 的一些信息,但是我们仍然应该对其神奇之处心存敬畏。
GPT-4系统地增强了人类智能
Q7
L:GPT-4 这类语言模型可以学习或引用各个领域的素材。OpenAI 内部的研究者和工程师对语言模型的神奇之处是否有越来越深的理解?
S:我们可以通过各种方式评价模型,可以在训练好模型后在各类任务上对其进行测试,我们在 Github 上也开精力源了模型的测试过程,这很有帮助。重要的是,我们耗费了大量的人力、财力、时间来分析模型的实用性、模型如何为人们带来快乐和帮助、如何创造一个更好的世界、产生新的产品和服务。当然,我们至今仍然不能完全理解模型完成任务的全部内在过程,但我们会继续朝着这个方面努力。
Q8
L:GPT-4 将互联网上海量的信息压缩到了黑盒模型中「相对较少」的参数中,形成了人类智慧。请问从事实到智慧产生了怎样的飞跃?
S:我们将模型作为数据库吸取了人类知识,而不是将其用作推理引擎,系统的处理能力得到了神奇的提升。这样一来,系统实际上也能实现一定程度的推理,尽管某些学者可能认为这一说法并不严谨。从某种程度上来说,GPT-4 系统增强了人类智能,可以被应用于各种各样的场景。
L:ChatGPT 似乎在与人类的连续交互中「拥有」了智能,它在这种对话的方式中承认自己错误的假设,否定不合适的请求。
GPT-4不具有意识,也不会取代优秀的程序员
Q9
L:有些人很享受与 GPT 一起编程,有些人则害怕变成工作会被 GPT 取代。你怎么看待这一现象?
S:有一些关键的编程工作仍然需要人类的创造因素。GPT 类的模型会自动完成一些编程工作,但仍然无法取代优秀的程序员。有一些程序员会对未来的不确定性产生焦虑,但是更多的人会觉得它提升了自己的工作效率。
二三十年前,当「深蓝」击败了国际象棋大师卡斯帕罗夫后,也曾有人认为没有继续下国际象棋的必要了。但是国际象棋至今仍风靡全球。
人工智能将对人类的生活质量带来巨大提升,我们可以治愈疾病、创造财富、增加资源、让人类感到快乐......看似人类不需要工作了,但是人类还需要社会地位、需要激情、需要创造、需要感受到自己的价值。因此,人工智能时代来临后,我们需要做的是找到新的工作、生活方式,拥抱新技术带来的巨大提升。
Q10
L:Eliezer Yudkowsky 警告人工智能可能伤害人类,并给出了一些例子,我们几乎不可能一直让超级人工智能与人类意图「对齐」。你是否赞同他的观点?
S:这是有可能的。如果我们不谈论这一潜在的可能性,我们就不会投入足够的努力研发新技术来解决此类问题。很多新兴领域都存在此类问题,现在人们关心人工智能的能力和安全性。Elizer 的文章写得很好,但是人们很难跟进它的一些工作,存在一些逻辑问题,我并不完全支持他的看法。
早在人们相信深度学习、大语言模型的能力之前,就有很多有关人工智能安全的工作,我不认为这一领域有足够多的更新。理论确实很重要,但是需要不断地学习技术轨迹的变化,这种循环需要更加紧凑。我认为现在是研究人工智能安全的良好时机,可以探究这些新工具新技术与人类意图的「对齐」。
Q11
L:人工智能技术发展日新月异,有人说我们现在又进入了人工智能「腾飞」的阶段。当有人真正构建了通用人工智能,我们怎样知晓这种变化?
S:GPT-4 并没有太令我惊讶,ChatGPT 则稍稍让我有些喜出望外。尽管 GPT-4 令人印象深刻,但是它还并不是 AGI。AGI 的真正定义越来越重要,但我认为这距离我还很遥远。
Q12
L:你认为 GPT-4 有意识吗?
S:不,我认为它还没有意识。
L:我认为真正具有意识的人工智能应该能够告诉别人自己有意识,能表达自己的痛苦等情绪,理解自己的处境,有自己的记忆,并且能与人交互。而我觉得这些能力都是接口的能力,而不是底层知识。
S:我们 OpenAI 的首席科学家 Ilya Sutskever 曾经与我讨论过「如何知道模型是否有意识」。他认为,如果我们在数据集上小心地训练一个模型,不提及与意识或任何相关概念的主观体验,然后我们向模型描述这种意识的主观体验,看模型是否能领会我们传达的信息。
通用人工智能,我们走到了哪一步?
Q13
L:乔姆斯基等人对「大语言模型」能实现通用人工智能持批判态度。对此,你怎么看?大语言模型是否是通往通用人工智能的正确道路?
S:我认为大语言模型是通往 AGI 的道路中的一环,我们还需要其它非常重要的部分。
L:你认为智能体需要一个感受世界的「身体」吗?
S:我对此持谨慎态度。但在我看来,无法很好地融入已知的科学知识的系统不能称之为「超级智能」,它就像发明新的基础科学。为了实现「超级智能」,我们需要继续拓展 GPT 类的范式,这还有很长的路要走。
L:我认为通过改变训练 GPT 的数据,就已经可以获得各种巨大的科学突破。
Q14
L:随着提示(Prompt)链越来越长,这些交互本身就会成为人类社会的一部分,并互为基础。如何看待这一现象?
S:与 GPT 系统能完成某些任务相比,更让我激动的是人类参与到了这一工具的反馈回路中,我们可以从多轮交互的轨迹中学到更多的东西。AI 将拓展、放大人类的意图和能力,这也将塑造人们使用它的方式。也许,我们永远不会建造出 AGI,但是让人类变得更好这件事本身就是巨大的胜利。
整理:熊宇轩
更多内容 尽在智源社区
相关文章:
Sam Altman专访:GPT-4没太让我惊讶,ChatGPT则让我喜出望外
导读ChatGPT、GPT-4 无疑是 2023 年年初人工智能界最大的「爆款」。3 月 26 日,OpenAI CEO、ChatGPT 之父 Sam Altman 接受了著名学者与科技播客、麻省理工大学研究员 Lex Fridman 的专访,Sam 分享了从OpenAI内部视角如何看待ChatGPT和GPT-4的里程碑式意…...
弯道超车的机会
弯道超车的机会 原文地址:https://bmft.tech/#/1-throught/0302-chance 前言 我一直很想把自己思考的东西表达出来,苦于语文成绩差,文字功力不够,想来想去也不知道用什么话来开场。我不喜欢站在高处对别人指指点点,…...
【设计模式】创建型模式之原型模式
【设计模式】创建型模式之原型模式 文章目录【设计模式】创建型模式之原型模式1.概述2. 构成3. 实现3.1 浅克隆3.2 深克隆1.概述 原型模式(Prototype Pattern):是用于创建重复的对象,同时又能保证性能。这种类型的设计模式属于创建型模式,它…...
KMP算法——我欲修仙(功法篇)
个人主页:【😊个人主页】 系列专栏:【❤️我欲修仙】 学习名言:莫等闲、白了少年头,空悲切。——岳飞 系列文章目录 第一章 ❤️ 学习前的必知知识 第二章 ❤️ 二分查找 文章目录系列文章目录前言🚗&…...
【嵌入式Linux学习笔记】QT在Linux嵌入式设备上的使用
QT是目前主流的UI界面设计软件之一,Linux系统也支持QT应用,并且提供了很多方便的接口。所以有必要记录一下基于QT,在LCD屏幕上实现UI界面功能的各种细节。 学习视频地址:【正点原子】STM32MP157开发板 1. 系统配置 出于方便&am…...
js根据数据关键字实现模糊查询功能
js根据数据关键字实现模糊查询功能模糊查询实现模糊查询功能的步骤和一般方法第一步:创建假数据或请求接口数据第二步:分析数据格式,处理数据第三步:验证功能完整代码模糊查询 模糊查询功能是指在搜索或者查询时,允许…...
java获取对象属性
Field[] fields vo.getClass().getDeclaredFields(); for (Field field : fields) {//设置允许通过反射访问私有变量field.setAccessible(true);//获取字段的值String value "";Class<?> type field.getType();if (Date.class.equals(type)) {value DateU…...
51单片机(IIC协议OLED屏)
一、IIC协议 1、IIC协议概述 1.1、概述:IIC全称Inter-Integrated Circuit (集成电路总线) 是由PHILIPS公司在80年代开发的两线式串行总线,用于连接微控制器及其外围设备。IIC属于半双 工同步通信方式 1.2、特点:简单性和有效性。 由于接口直…...
你知道,华为对项目经理要求的3项技能5项素质是什么吗?
很多人一定在好奇,华为对项目经理的要求是什么呢?普通项目经理应具备什么素质,才能进入华为这样的大厂,在严峻的经济形势下无惧裁员呢? 一、三项软技能 我们在华为举办的项目经理论坛中找到了答案:对于华…...
优漫动游 提升效率常用的C4D技巧
C4D是近几年非常热的趋势,经常有人问3D相关的问题,想把自己在找捷径的过程中觉得最实用的小技巧分享给大家 1、快速定位层级和模型 模型的过程中,经常遇到模型层级多难定位的问题,逐级打开或者全部展开对于定位模型使…...
基于蚁群算法的时间窗口路径优化
目录 背影 蚁群算法的原理及步骤 基本定义 编程思路 适应度函数 算法的规则 特点 主要参数 代码 结果分析 展望 背影 现代物流配送对时间要求更高,是否及时配送是配送是否成功的重要指标,本文对路径优化加时间窗口,实现基于蚁群算法的时间窗口路径优化, 蚁群算法 基本…...
liunx
linux常用命令 mkdir :创建文件夹 rm -f :删除文件 docker cp 文件名 20f:容器内地址 将文件从linux系统移动到docker地址 ln -s 将两个文件做链接 compgen -u 查看所有用户 groups 查看所在组 vim 编辑 quit 退出 sudo su - root 获得root权限 cp dir1/…...
机动车发票组件【vue】
发票组件 问题反馈:在这就可以 Install-下载 npm install motorvehicles --savewarrning:我们推荐您设置key的,因为不存在它会带来数据的复用性问题usage-使用说明 import MotorVehiclesIvoice from motorvehiclesimport MotorVehiclesIvo…...
学习笔记-剖析k8s之StatefulSet的拓扑状态-3月day18
文章目录前言StatefulSetHeadless ServicePod的拓扑状态小结附前言 Deployment实际上并不足以覆盖所有的应用编排问题,原因在于Deployment对应用做了一个简单化的假设:一个应用的所有Pod,是完全一样的。所以,它们互相之间没有顺序…...
Java实现输出九九乘法口诀表,输入行数输出对应的梯形(平行四边形)这两个代码
目录 一、前言 二、代码部分 1.输出九九乘法口诀表的代码 三、程序运行结果(控制台输出) 一、前言 1.本代码是我在上学时写的,有一些地方没能完美实现,请包涵也请多赐教! 2.本弹窗界面可以根据简单的要求进行输…...
C++空间配置器
目录 1.什么是空间配置器 2.为什么需要空间配置器 3.SGI-STL空间配置器实现原理 3.1一级空间配置器 3.2二级空间配置器 3.2.1内存池 3.2.2 SGI-STL中二级空间配置器设计 3.3 空间配置器的默认选择 4.空间配置器与容器的结合 1.什么是空间配置器 空间配置器࿰…...
JConsole使用教程
JConsole是一个Java虚拟机的监控和管理工具,可以监控Java应用程序的内存使用、线程和类信息等。 以下是JConsole的使用教程: 1.启动JConsole JConsole是一个Java自带的工具,可以在bin目录下找到jconsole.exe文件。双击运行该文件即可启动JC…...
JS手写防抖和节流函数(超详细版整理)
1、什么是防抖和节流防抖(debounce):每次触发定时器后,取消上一个定时器,然后重新触发定时器。防抖一般用于用户未知行为的优化,比如搜索框输入弹窗提示,因为用户接下来要输入的内容都是未知的&…...
我的Macbook pro使用体验
刚拿到Mac那一刻,第一眼很惊艳,不经眼前一亮,心想:这是一件艺术品,太好看了吧 而后再体验全新的Macos 系统,身为多年的win用户说实话一时间还是难以接受 1.从未见过的访达,不习惯的右键 2. …...
炼石入选“首届工业和信息化领域商用密码应用峰会”典型方案
2023年3月22日-23日,浙江省经济和信息化厅、浙江省通信管理局、浙江省密码管理局、工业和信息化部商用密码应用产业促进联盟联合举办的“首届工业和信息化领域商用密码应用峰会”(以下简称峰会)在浙江杭州成功举办,旨在深入推进工…...
使用new bing chat成功了
步骤一:在扩展商店搜索并安装modheader 打开浏览器; 点击右上角的三个点图标,选择“更多工具” -> “扩展程序”; 在扩展程序页面上方的搜索框中输入“modheader”,然后点击“搜索商店”; 在搜索结果中找到“ModHeader”扩展程序,点击“添加至”按钮,然后再点击“添…...
Golang每日一练(leetDay0019)
目录 55. 跳跃游戏 Jump Game 🌟🌟 56. 合并区间 Mmerge Intervals 🌟🌟 57. 插入区间 Insert Interval 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练…...
记录一次性能测试遇到的问题
零、压测指标问题 压测指标,一定要需求方定 啊,谁提压测需求,谁来定压测指标。 如果需求方,对压测指标没有概念,研发和测试,可以把历史压测指标、生产数据导出来给需求方看,引导他们来定指标&…...
C++运算符重载基础教程
所谓重载,就是赋予新的含义。函数重载(Function Overloading)可以让一个函数名有多种功能,在不同情况下进行不同的操作。运算符重载(Operator Overloading)也是一个道理,同一个运算符可以有不同…...
Git命令总结
全局配置 git config --global user.name ‘你的名字’ git config --global user.email ‘你的邮箱’ 当前仓库配置 git config --local user.name ‘你的名字’ git config --local user.email ‘你的邮箱’ 查看 global 配置 git config --global --list 查看当前仓库…...
【车载以太网】BCM89572A0BCFBG、BCM89559GB0BCFBG、BCM89559GA0BCFBG具有安全启动和安全通信功能
BCM89572A0BCFBG 设备是Broadcom第六代完全集成的L2多层开关解决方案,支持车载网络应用的汽车认证(AEC-Q100)和温度等级。BCM8956X系列产品为汽车行业提高了具有多种一流功能的交换机的标准,例如802.1AE MACsec等集成安全功能,增加了主机连接…...
Lighttpd入门教程
Lighttpd入门教程概述入门教程安装配置静态文件服务动态文件服务虚拟主机SSL启动服务器日志模块总结lighthttpd使用场景和原理使用场景原理概述 Lighttpd(也称为轻量级HTTP服务器)是一款快速、灵活、轻量级的Web服务器,旨在提供高性能和低资…...
Springboot 多线程分批切割处理 大数据量List集合 ,实用示例
前言 哲学提问镇贴: 不了解异步怎么使用的看官, 可阅: SpringBoot 最简单的使用异步线程案例 Async_小目标青年的博客-CSDN博客 Springboot Async异步扩展使用 结合 CompletableFuture_小目标青年的博客-CSDN博客 想了解更多关于批量list处…...
SQLMAP工具基础使用
本文用的是kali自带的sqlmap工具 我们通过常用命令来理解sqlmap的基本使用 目录 检测注入 获取敏感信息 获取表 获取表的字段 获取数据 --technique 使用指定的注入方式 使用基于时间的延时注入 支持多种注入检测 默认是全部 注入时使用随机的 HTTP User-Agent 设置超时时间 读…...
初学多线程爬虫
多线程在爬虫中应用非常广泛,对于中大型项目来说很有必要,今天我将以初学者的姿态来完成一个简单的多线程爬虫程序。 1、如何认识多线程 计算机完成一项或多项任务,往往可以存在很高的并行度:若是多核处理器则天然的可以同时处理…...
wordpress 制作网站/百度人工电话
mysql安装包有源码包和二进制包。源码包安装时需要编译。二进制包安装时不需要编译。二进制格式的包名字很长,都带有版本号、适应平台、适应的硬件类型等,而源码格式仅仅就是一个版本号的tar包。源代码包里的文件往往会含有种种源代码文件,头…...
怎么做vip电影网站/西安网站建设哪家好
附件中是我根据原版zabbix-1.8.4的汉化,重新修改的。希望对初学者有所帮助。 (1)将zabbix网站下的include/locales目录下的汉化文件cn_zh.inc.php进行备份 (2)将附件中的文件解压后放到zabbix网站下的include/locales目…...
网站制作天津/种子搜索神器
1.相关资料 mybatis开发文档:https://mybatis.org/mybatis-3/zh/getting-started.htmlmybatis源码地址:https://github.com/mybatis/mybatis-3/releases 2.搭建步骤 (1) 创建 mysql 数据库表 CREATE TABLE t_user (id bigint(20) NOT NULL,user_nam…...
怎么看网站有没有做404/广东seo网站设计
物联网-wemos D1 Mini (esp8266)实验九 --- blynk APP远程控制格力空调开机并显示温湿度概述实验材料硬件硬件连接图引脚连接对照表Arduino端软件编写测试Wemos D1 Mini温湿度采集程序DHT库的安装将DHT采集代码整合到实验八中Bylnk端软件编写最终显示效果…...
普宁网站建设公司/游戏代理平台哪个好
作者:普京大帝 面试准备 简历优化 突出关键技能:将您的核心技能放在简历的顶部,以便雇主在扫描简历时立即看到您的专业知识和技能。着重强调项目经历:列举您最具代表性的项目经历,特别是那些能够体现您技术实力和解决…...
免费手机做网站/seo是免费的吗
放假几天回来,svn罢工了,加上我一直在两个地方同时操作svn,SVN——Previous operation has not finished;run ‘cleanup’ if it was interupted。 反正就是你一更新版本,就让你clean up ,一clean up 就报上述错误&…...