宇宙最强-GPT-4 横空出世:最先进、更安全、更有用
文章目录
- 前言
- 一、准确性提升
- 1.创造力
- 2.视觉输入
- 3.更长的上下文
- 二、相比于ChatGPT有哪些提升
- 1.GPT-4 的高级推理能力超越了 ChatGPT
- 2.GPT-4 在多种测试考试中均优于 ChatGPT。
- 三、研究团队在GPT-4模型都做了哪些改善
- 1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
- 2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
- 3.安全与对齐:
- 四、和一些开发创新产品的组织合作
- 五、其他
- 详细研究报告
- 基础设施:
- 局限性
- 可用性
- 总结
前言
昨晚OpenAI公开了GPT-4的进展,并可以基于ChatGPT实现GPT-4的使用和访问。博主连夜总结出以下Xmind,那么GPT-4到底有哪些巨大的能力提升呢,让我们来一探究竟!【如需进一步交流,请私信】

一、准确性提升
GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
GPT能力提升主要在三个方面:
1.创造力

如上图所示,是OpenAI官网展示的一个例子,这里我人肉翻译了下:
Input
用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,> 不重复任何字母。
Output
美丽的灰姑娘充满热切地生活,最终找到了幸福;她激发了嫉妒的亲戚们,神奇的爱情滋养着富有的王子;她悄悄地拯救了他,水晶鞋取得胜利,奇妙地将他们紧密团结在一起,这对热情洋溢的年轻人友好相处。
从上述例子汇总我们可以发现,GPT-4 比以往任何时候都更具创造性和协作性。官网说它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。
2.视觉输入
GPT-4还支持视觉输入


上面给出了一个例子:我可以用这些原料干什么,随后给出一张鸡蛋、面粉、奶油的图片。GPT-4给出如下回复:
Output
有很多种方法可以用这些食材制作美食!以下是一些可能的选择:
- 煎饼或华夫饼
- 可丽饼
- 法式吐司
- 煎蛋卷或意式烘蛋
- 派
- 蛋奶酥或布丁
- 蛋糕或纸杯蛋糕
- 松饼或面包
- 饼干或饼干
这只是其中的一些例子,但可能性是无穷无尽的!
这回复简直太赞了!
3.更长的上下文

GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。
二、相比于ChatGPT有哪些提升
1.GPT-4 的高级推理能力超越了 ChatGPT

Input
安德鲁从上午11点到下午3点有空,乔安娜从中午12点到下午2点,然后从下午3点半到5点有空。汉娜在中午12点有半小时空闲,然后在下午4点到6点有空。对于安德鲁、汉娜和乔安娜来说,安排一场时长30分钟的会议,有哪些开始时间的选项?
ChatGPT Output
以下是他们的空闲时间列表:
- 安德鲁:上午11点至下午3点
- 乔安娜:中午12点至下午2点,下午3点半至5点
- 汉娜:中午12点至12点半,下午4点至6点
根据他们的空闲时间,有一个30分钟的时间窗口,这三个人都有空,即下午4点至4点半。所以,会议可以安排在下午4点
GPT-4 Output
安德鲁:上午11点 - 下午3点
乔安娜:中午12点 - 下午2点,下午3点半 - 下午5点
汉娜:中午12点 - 12点半,下午4点 - 下午6点
可以安排30分钟会议的共同空闲时间:中午12点 - 12点半
2.GPT-4 在多种测试考试中均优于 ChatGPT。

在统一律师考试中,ChatGPT排名在倒数10%内,而GPT-4或者了前10%的好成绩,而在生物奥林匹克考试中,GPT-4的领先更加夸张,或者排名前1%的好成绩,而ChatGPT才排31名。
三、研究团队在GPT-4模型都做了哪些改善
1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。
2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
在我们的内部评估中,与 GPT-3.5 相比,GPT-4 响应不被允许内容请求的可能性低 82%,产生事实响应的可能性高 40%
3.安全与对齐:
- 1.通过人工反馈进行训练(人工+专家反馈)
- 我们纳入了更多的人工反馈,包括 ChatGPT 用户提交的反馈,以改进 GPT-4 的行为。我们还与 50 多位专家合作,在 AI 安全和保障等领域获得早期反馈。
- 2.从现实世界的使用中不断改进(现实世界反馈)
- 我们已经将我们以前模型在现实世界中使用的经验教训应用到 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着越来越多的人使用它,我们将定期更新和改进 GPT-4。
-
- GPT-4 辅助的安全研究(自己使用)
- GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建用于模型微调的训练数据,并在训练、评估和监控过程中迭代分类器。
四、和一些开发创新产品的组织合作
- Duolingo:一种对话类应用
- Be My Eyes:使用GPT-4提高视觉能力
- Stripe:使用GPT-4简化用户体验并打击欺诈
- Morgan Stanley:使用GPT-4来管理公司内部知识库
- Khan Academy:在试点项目中探索GPT-4的潜力
- Government of Iceland:使用GPT-4保护本土语言
- Etc.
五、其他
详细研究报告
https://openai.com/research/gpt-4
基础设施:
GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。
局限性
GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。
可用性
我们在 ChatGPT Plus 上提供 GPT-4,并作为开发人员构建应用程序和服务的 API。
总结
GPT-4的横空出世将ChatGPT的很多局限性突破了,虽然基础模型能力只有一点提升(官方团队谦虚之语),但是在各种测试中GPT-4都完爆ChatGPT了,如果想了解更多内容或者加入到AIGC&ChatGPT的研究交流中可以私信我!
相关文章:
宇宙最强-GPT-4 横空出世:最先进、更安全、更有用
文章目录前言一、准确性提升1.创造力2.视觉输入3.更长的上下文二、相比于ChatGPT有哪些提升1.GPT-4 的高级推理能力超越了 ChatGPT2.GPT-4 在多种测试考试中均优于 ChatGPT。三、研究团队在GPT-4模型都做了哪些改善1.遵循 GPT、GPT-2 和 GPT-3 的研究路径2.我们花了 6 个月的时…...
HashMap的实际开发使用
目 录 前言 一、HashMap是什么? 二、使用步骤 1.解析一下它实现的原理 编辑 2.实际开发使用 总结 前言 本章,只是大概记录一下hashMap的简单使用方法,以及理清一下hashMap的put方法的原理,以及get方法的原理。 一、Has…...
OpenCV入门(十三)快速学会OpenCV 12 图像梯度
OpenCV入门(十三)快速学会OpenCV 12 图像梯度1.Sobel算子1.1 计算x1.2 计算y1.3 计算xy2.Scharr算子2.1 计算x2.2 计算y2.3 计算xy3.Laplacian算子4.总结图像梯度计算的是图像变化的速度。对于图像的边缘部分,其灰度值变化较大,梯…...
软考:常见小题目计算题
01采购合同的类型采购合同主要包括总价类合同、成本补偿类合同、工料合同三大类合同。1、总价类合同此类合同为既定产品、服务或成果的采购设定一个总价。这种合同应在已明确定义需求,且不会出现重大范围变更的情况下使用。包括:(1࿰…...
【Linux】进程的程序替换
文章目录1. 程序替换1.创建子进程的目的是什么?2.了解程序是如何进行替换的3. 程序替换的基本原理当创建进程的时候,先有进程数据结构,还是先加载代码和数据?程序替换是整体替换,不是局部替换execl 返回值4. 替换函数1…...
【C++】模板(上)
文章目录1、泛型编程2、函数模板函数模板的实例化模板参数的匹配原则3、 类模板类模板的实例化1、泛型编程 void Swap(int& left, int& right) {int temp left;left right;right temp; } void Swap(double& left, double& right) {double temp left;left …...
express框架利用formidable上传图片
express框架,在上传图片功能方面,用formidable里面的incomingform功能,很方便。很多功能都已经封装好了,非常好用,简单,不需要写更深层次的代码了。确实不错。 下面是我自己跟着黑马教程的博客系统的部分&…...
测试背锅侠?入职软件测试后大d佬给我丢了这个bug分类分析,至今受益匪浅......
目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 刚成为入职…...
STM32 OTA应用开发——通过内置DFU实现USB升级(方式1)
STM32 OTA应用开发——通过内置DFU实现USB升级(方式1) 目录STM32 OTA应用开发——通过内置DFU实现USB升级(方式1)前言1 硬件介绍2 环境搭建2.1 Keil uVsion2.2 zadig2.3 STM32CubeProgrammer2.4 安装USB驱动3 OTA升级结束语前言 …...
基于MFC的JavaScript进行网页数据交互
目录 前言 一、创建html对话框工程 二、使用步骤 1.引入JavaScript接口代码 2.重写相关接口 3.在html网页中添加C/C调用的接口 4.在MFC工程中添加调用接口 5.设置确认按键触发调用 6.运行结果 总结 前言 如何快速的进行MFC开发,这里我介绍一种JavaScript与C/C交互的…...
AUTOSAR-Fee
Fee模块 全称Flash EEPROM Emulation Module,属于ECU抽象层 Fee模块本身是脱离硬件的,但是Fee模块可能会引用的Fls模块定制API,所以只能算半抽象. FEE模块应从设备特定的寻址方案和分段中抽象出来,并为上层提供虚拟寻址方案和分段(virtual addressing scheme and segment…...
Linux基本命令——操作演示
Linux基本命令——操作演示Linux的目录结构Linux命令入门目录切换相关命令(cd/pwd)相对路径、绝对路径和特殊路径符创建目录命令(mkdir)文件操作命令part1 (touch、cat、more)文件操作命令part2 (cp、mv、rm)查找命令 …...
【Linux】目录和文件的权限
Linux中的权限有什么作用Linux权限管理文件访问者的分类文件类型和访问权限(事物属性)**文件权限值的表示方法**文件访问权限的相关设置方法chmodchownchgrpumaskumask使用 sudo分配权限目录的权限Linux中的权限有什么作用 Linux下有两种用户࿱…...
Unity 优化之Player Setting
Quality SettingPixel Light Count 使用前向渲染时最大像素光源数。也是性能关键。数量越大消耗越多。Texture Quality:贴图质量,可以选择Half Res,这样速度会更快,但是贴图质量会轻微下降。Anisotropic Textures 纹理各向异形Ant…...
Qt——通过一个简单的程序例程熟悉使用Qt Creator软件进行项目搭建的基本流程(新建项目、项目的文件组成、修改ui文件、编译运行与调试)
【系列专栏】:博主结合工作实践输出的,解决实际问题的专栏,朋友们看过来! 《项目案例分享》 《极客DIY开源分享》 《嵌入式通用开发实战》 《C++语言开发基础总结》 《从0到1学习嵌入式Linux开发》 《QT开发实战》 《Android开发实战》...
Linux 如何使用 git | 新建仓库 | git 三板斧
文章目录 专栏导读 一、如何安装 git 二、注册码云账号 三、新建仓库 配置仓库信息 四、克隆远端仓库到本地 五、git 三板斧 1. 三板斧第一招:git add 2. 三板斧第二招:git commit 解决首次 git commit 失败的问题 配置机器信息 3. 三…...
3.springcloud微服务架构搭建 之 《springboot自动装配ribbon》
1.springcloud微服务架构搭建 之 《springboot自动装配Redis》 2.springcloud微服务架构搭建 之 《springboot集成nacos注册中心》 ribbon工作原理自己网上百度,说的都很详细 目录 1.项目引入openfeign和ribbon配置 2.新建lilock-ribbon-spring-boot-starter 3…...
【一】进程到底是个啥?
1. 什么是进程 进程(process):一个运行起来的程序,就是进程!,我们可以在任务管理中看到进程。 进程是操作系统进行资源分配的基本单位 2. 进程的管理 所谓的进程管理,其实就是分为两步&…...
[蓝桥杯] 双指针、BFS和DFS与图论问题
文章目录 一、日志统计 1、1 题目描述 1、2 题解关键思路与解答 二、献给阿尔吉侬的花束 2、1 题目描述 2、2 题解关键思路与解答 三、红与黑 3、1 题目描述 3、2 题解关键思路与解答 3、2、1 dfs题解代码 3、2、2 bfs题解答案 四、交换瓶子 4、1 题目描述 4、2 题解关键思路与…...
编译原理陈火旺版第四章课后题答案
下面答案仅供参考! 1.考虑下面文法G1: (1) 消去 Q 的左递归。然后,对每个非终结符,写岀不带回溯的递归子程序。 (2) 经改写后的文法是否是LL(1)的?给出它的预测分析表。 2.对下面的文法G: P→(E)lalblΛ (1)计算这个文法的每个非…...
python/java环境配置
环境变量放一起 python: 1.首先下载Python Python下载地址:Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个,然后自定义,全选 可以把前4个选上 3.环境配置 1)搜高级系统设置 2…...
屋顶变身“发电站” ,中天合创屋面分布式光伏发电项目顺利并网!
5月28日,中天合创屋面分布式光伏发电项目顺利并网发电,该项目位于内蒙古自治区鄂尔多斯市乌审旗,项目利用中天合创聚乙烯、聚丙烯仓库屋面作为场地建设光伏电站,总装机容量为9.96MWp。 项目投运后,每年可节约标煤3670…...
三分算法与DeepSeek辅助证明是单峰函数
前置 单峰函数有唯一的最大值,最大值左侧的数值严格单调递增,最大值右侧的数值严格单调递减。 单谷函数有唯一的最小值,最小值左侧的数值严格单调递减,最小值右侧的数值严格单调递增。 三分的本质 三分和二分一样都是通过不断缩…...
Golang——9、反射和文件操作
反射和文件操作 1、反射1.1、reflect.TypeOf()获取任意值的类型对象1.2、reflect.ValueOf()1.3、结构体反射 2、文件操作2.1、os.Open()打开文件2.2、方式一:使用Read()读取文件2.3、方式二:bufio读取文件2.4、方式三:os.ReadFile读取2.5、写…...
nnUNet V2修改网络——暴力替换网络为UNet++
更换前,要用nnUNet V2跑通所用数据集,证明nnUNet V2、数据集、运行环境等没有问题 阅读nnU-Net V2 的 U-Net结构,初步了解要修改的网络,知己知彼,修改起来才能游刃有余。 U-Net存在两个局限,一是网络的最佳深度因应用场景而异,这取决于任务的难度和可用于训练的标注数…...
【免费数据】2005-2019年我国272个地级市的旅游竞争力多指标数据(33个指标)
旅游业是一个城市的重要产业构成。旅游竞争力是一个城市竞争力的重要构成部分。一个城市的旅游竞争力反映了其在旅游市场竞争中的比较优势。 今日我们分享的是2005-2019年我国272个地级市的旅游竞争力多指标数据!该数据集源自2025年4月发表于《地理学报》的论文成果…...
2.2.2 ASPICE的需求分析
ASPICE的需求分析是汽车软件开发过程中至关重要的一环,它涉及到对需求进行详细分析、验证和确认,以确保软件产品能够满足客户和用户的需求。在ASPICE中,需求分析的关键步骤包括: 需求细化:将从需求收集阶段获得的高层需…...
在Android13上添加系统服务的好用例子
在Android13上添加一个自动的system service例子 留好,备用。 --- .../prebuilts/api/30.0/plat_pub_versioned.cil | 76 - .../prebuilts/api/31.0/plat_pub_versioned.cil | 94 - .../prebuilts/api/32.0/plat_pub_versioned.cil | 94 - frameworks/base/co…...
sql列中数据通过逗号分割的集合,按需求剔除部分值
前置 不会REGEXP 方法的需要在这里学习一下下 记sql字段逗号分隔,通过list查询 功能点 现有一个表格中一列存储的是标签的集合,通过逗号分割 入下: 其中tag_ids是逗号分割的标签,现在需要删除标签组中的一些标签,因…...
自动化立体仓库堆垛机控制系统STEP7 OB1功能块
1、堆垛机控制系统STEP7硬件组态如下图 CPU CPU 314C-2 PN/DP 6ES7 314-6EH04-0AB0 SM 338 POS-INPUT AO2x12Bit 6ES7 332-5HB01-0AB0 2、堆垛机控制系统STEP7内部变量 前进HMI M 0.0 BOOL 后退HMI M 0.1 BOOL 上升HMI M 0.2 B…...
