GPT会统治人类吗
一 前言
花了大概两天时间看完《这就是ChatGPT》,触动还是挺大的,让我静下来,认真地想一想,是否真正理解了ChatGPT,又能给我们以什么样的启发。
二 思考
在工作和生活中,使用ChatGPT或文心一言,逐渐形成了习惯,总想听听它们的意见。无论是小学作文还是小的编程测试例子,大部分情况下还是能够给我一个比较靠谱的意见,而且是个“知错就改”的AI,对于它的回答不满意,多换几个提示词总能给我想要的效果,这确实是令人吃惊和感到不可思议的,特别是在对有错别字的提问,上下文关联提问,能给出让人看得懂的回答,仿佛它存储了无穷多的知识。
2.1 高纬度是一种有效的压缩方法
首先我想到的这个模型在磁盘上存储大概有多大,问了下ChatGPT,3.5版本模型大概1.2TB的,包括权重文件必要文件等;
GPT-3.5 模型是一个非常大的模型,具体占用的磁盘空间会因为存储格式和配置参数的不同而有所变化。然而,根据 OpenAI 的官方文档,GPT-3.5 模型的大小大约为 1.2TB。这个大小包括了模型的权重参数、配置文件以及其他必要的文件。
请注意,这个数字是基于 GPT-3.5 模型的官方发布,可能会因为后续的模型更新和改进而有所变化。如果你需要具体的数字,建议参考 OpenAI 官方文档或联系 OpenAI 获取最新的信息
真是难以置信,在1.2TB的存储上,竟然可以满足各行各业人的提问,而且效果都还不错。
这里面存储的不光是知识,还有逻辑,最神奇的是语言习惯的逻辑,以前开发个类人的对话机器人是非常难的,别说人类语言,光编程语言编译都要进过词法分析、语法分析等复杂过程才能理解它要做什么,而GPT不用理解它们,就经过训练好,奇妙给出了符合语法和语义的答案。
所以,我认为GPT是一种高纬度的压缩,是对各类知识的内容的高纬度的提出抽象、是对语言高维度的抽象,虽然我们还不能完全理解这种逻辑。举个简单的例子有一张很大的纸,如果平铺开来可能有足球场那么大,但是如果折叠下,通过多次折叠后,这张纸,可能会变成拳头大小的模型。为什么它会变小了,因为它的维度变化了,它的被压缩了。 GPT -3 的参数有1750亿个,每个参数看做一个维度的话,表示的维度空间是很高的,所以它能压缩信息。
同样可以根据这样的启发,如果高维度的数据想要简化,需要降低维度,降低维度其实是减少信息的密度,如果高维度的信息,展开在低纬度是很庞大的。 这有点像一个立方体,如果展开平铺下来是有六个面的。
2.2 信息的无序是因为维度不够高
除了GPT能够回答各行各业的知识外,还有个神奇之处,它能给出网络上没有出现问题的答案,而且是合理的答案,而且是符合人类语言习惯的答案。
所以引申出了一个问题,GPT是否真的理解了我们的问题,如果理解了,为什么有的简单的数学计算会计算错误,如果没理解,它又如何给出了网上没有问题的合理答案那?
书中给出GPT本质在做续写,我们给出问题或提示词后,GPT根据我们给出的问题或词语给出最合理的续写,它觉得下个出现的词语靠的概率,即哪个词最该出现,就给出哪个词语,在使用过程中常常看到单词是一个个蹦出来的,那是从众多单词中,选择最合理的单词输出出来,这个类似于N-Gram,即每个单词出现不是孤立的,和它前面的N个词语相关,这就可以找到序列的秩序关系,同样的原理,对我们的语言也是一样,如果N足够长,那生成的句子,读起来就是合理的了,更奇妙的是这种合理不光是语言通顺与否的合理,而且是逻辑的合理,没有使用任何推理,仅仅使用神经网络训练出来的模型,就可以达到这种令人惊叹的效果。
这让我想到的那句话,一切答案都在问题之中,有了GPT,我们有了问题也就有了答案,嗨你看提问比答案更重要了,也可以说我们能理解的答案,其实蕴藏在以前的文本之中,只是GPT帮我们拼凑出来,展现给我们。
从某种意义来说,知识本质就是一种词语的关系,词序的排列,不光包括科学知识,还包括语言习惯、语义语法知识,只要维度够高,任何知识都可以通过单词来组合得到,这种组合的逻辑关系和内在联系可以将知识或信息进行高度的压缩。
看极客时间 《AI大数据模型之美》的一个对评分进行情感分析的例子,通过简单的调用GPT的API,计算评论内容和"好评"、"差评" 这两个词语的向量相似性,轻易地区分出了好评的评论和差评的评论:
import openai
import os
from openai.embeddings_utils import cosine_similarity, get_embedding
# 获取访问open ai的密钥
openai.api_key = os.getenv("OPENAI_API_KEY")
# 选择使用最小的ada模型
EMBEDDING_MODEL = "text-embedding-ada-002"
# 获取"好评"和"差评"的
positive_review = get_embedding("好评")
negative_review = get_embedding("差评")
positive_example = get_embedding("买的银色版真的很好看,一天就到了,晚上就开始拿起来完系统很丝滑流畅,做工扎实,手感细腻,很精致哦苹果一如既往的好品质")
negative_example = get_embedding("降价厉害,保价不合理,不推荐")
def get_score(sample_embedding):
return cosine_similarity(sample_embedding, positive_review) - cosine_similarity(sample_embedding, negative_review)
positive_score = get_score(positive_example)
negative_score = get_score(negative_example)
print("好评例子的评分 : %f" % (positive_score))
print("差评例子的评分 : %f" % (negative_score))
得分结果:
好评例子的评分 : 0.070963
差评例子的评分 : -0.081472
好评的评论和"好评"这个词语的相似性,比和"差评" 这个词语的相似性要大,相反也一样成立,简单来说在高维度上,好评的评论和"好评" 靠的更近,和"差评"离的更远,简单又神奇,就算把例子复杂化一点,用否定的否定来构建句子,仍然可以得到一样的效果:
good_restraurant = get_embedding("这家餐馆太好吃了,一点都不糟糕")
bad_restraurant = get_embedding("这家餐馆太糟糕了,一点都不好吃")
good_score = get_score(good_restraurant)
bad_score = get_score(bad_restraurant)
print("好评餐馆的评分 : %f" % (good_score))
print("差评餐馆的评分 : %f" % (bad_score))
得分结果:
好评餐馆的评分 : 0.062719
差评餐馆的评分 : -0.074591
这说明,这些单词或句子,在一个高维度的空间上,是存在一定的关系的,这个关系就是我们平时所说的所谓的知识。
以前我们都是通过学习文章,通过整体去理解文章,先通过语言的逻辑理解文章的含义,再通过逻辑抽象理解文章表达的内容。而GPT,是从单词的关系去理解,只要战的维度高,就能学到其中的逻辑其中我们低维度视角无法看到的内容。
三 未来
3.1 GPT的智能
据说GPT新版本已经通过了图灵测试,从一定程度上来说,它具备了人类所说的智慧,文字一直认为是人类才会的高级玩意,通过它我们交流了思想、传递了知识、交换了信息,现在GPT一个模型,只有1750亿参数的模型,通过学习网络上的文本资料,竟然构建了这样的知识库,不存储知识,却能根据知识回答问题,不存语法规则,却回答的合情合理,这种神奇的涌现效果,让人感觉神奇的同时,思考起来又不寒而栗。
随着它学习的越来越多内容,不光有问题,据说还有视频、录音、图片等,它会越来越像个各方面都在行的专家,可以在我们冥思苦想没有灵感的时候,给我们以启示,这些知识都是存在的,而我们却不知道竟然可以如此组合,它不能从无到有创建出一个独立的分支,却可以通过各种组合将现有的知识利用达到极致,这种组合何尝不是一种创新,利用它的能力,未来人类在交叉学科上,在知识本质的理解上,语言规律的摸索上,给人们更多的启迪。
这让我想起了GPT的API中的温度参数,这个参数在0-2之间变化,温度为0,输出的回答变化越小,温度为2,输出的变化最大,而且每个输出在语法和语义上都是合理的,答案的多样性,也许是人们创新的一个源泉了。
所以GPT的智能会越来越高、越来越像个各方面的专家,能给使用者带来不可思议组合式的创新。
3.2 AI最终会统治地球嘛
现在的GPT,对发明者来说,他们开始可能也不知道会有如此神奇的效果,通过多层神经网络的组合,通过大类的样本的续写训练,竟然涌现出来了类人的智能。
为什么2千亿左右的参数或神经网络的连接就可以模拟人类的知识和语言习惯,除N-Gram外,是否蕴含其他逻辑,其原理到底是什么,如果参数增加到万亿,训练出来的又是一个什么样的怪物,它是否拥有着自主意识,这个自主意识和人类的又肯定不同,它可能不是人们想的那样,有什么邪恶的想法,想要逃出来,统治人类啥的。它可能只是按照自己的规律走,只是从人类角度来看它可能有了自己的思考和逻辑,它不知道,可能只是沿着最优解去做,统治不统治人类可能只是个副产物。
我不知道,AI最终是否会统治地球,只是知道,如果统治了地球,那一定是以一个我们难以想象或理解的方式。
本文由 mdnice 多平台发布
相关文章:
GPT会统治人类吗
一 前言 花了大概两天时间看完《这就是ChatGPT》,触动还是挺大的,让我静下来,认真地想一想,是否真正理解了ChatGPT,又能给我们以什么样的启发。 二 思考 在工作和生活中,使用ChatGPT或文心一言,…...
win系统环境搭建(六)——Windows安装nginx
windows环境搭建专栏🔗点击跳转 win系统环境搭建(六)——Windows安装nginx 本系列windows环境搭建开始讲解如何给win系统搭建环境,本人所用系统是腾讯云服务器的Windows Server 2022,你可以理解成就是你用的windows10…...
Java中使用BigDecimal类相除保留两位小数
问题 遇到2个数相除,需要保留2位小数的结果。 解决 BigDecimal sum ...; BigDecimal yearValue ...;MathContext mathContext new MathContext(2, RoundingMode.DOWN); yearValue.divide(sum, mathContext);...
激光雷达在ADAS测试中的应用与方案
在科技高速发展的今天,汽车智能化已是必然的趋势,且自动驾驶汽车的研究也在世界范围内进行得如火如荼。而在ADAS测试与开发中,激光雷达以其高性能和高精度占据着非常重要的地位,它是ADAS测试与开发中不可缺少的组成。 一 激光雷达…...
malloc与free
目录 前提须知: malloc: 大意: 头文件: 申请空间: 判断是否申请成功: 使用空间: 结果: 整体代码: malloc申请的空间怎么回收呢? 注意事项: free:…...
计算周包材,日包材用来发送给外围系统
文章目录 1 Introduction2 code 1 Introduction In this example We get data from BOM and RESB . and calculate it . 2 code TYPES: BEGIN OF TY_ZPPT_0015_W,AUFNR TYPE ZPPT_0015-AUFNR,ZXH TYPE ZPPT_0015-ZXH,ZZJHID TYPE ZPPT_0015-ZZJHID,ZRJHID TYPE Z…...
R语言柱状图直方图 histogram
柱状图简介 柱状图也叫直方图,是展示连续性数值的分布状况。在x轴上将连续型数值分为一定数量的组,y轴显示对应值的频数。 R基本的柱状图 hist 我们用R自带的Orange数据来画图。 > head(Orange)Tree age circumference(圆周长) 1 1 118 …...
Linux磁盘管理:最佳实践
🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…...
uni-app:通过三目运算动态增加样式效果(class)
效果 代码 第一条:当变量line的值等于abc时,class就等于yes,反之class等于no(显然等于abc,执行yes,前景色为红色) 第一条:当变量line1的值等于abc时,class就等于yes,反之class等于noÿ…...
API安全
1 API的简介 API代表应用程序编程接口,它由一组允许软件组件进行通信的定义和协议组成。作为软件系统之间的中介,API使软件应用程序或服务能够共享数据和功能。但是API不仅仅提供连接基础,它还管理软件应用程序如何被允许进行通信和交互。API控制程序之间交换请求的类型、请…...
手写一个翻页功能
最近在对接海康摄像头,需要写一个翻页得功能,于是乎就想到了手写,然后就记录一下。在vue项目里写的 <img:src"require()"alt""click"onNext(delete)"/><img:src"require()"alt""…...
element show-overflow-tooltip 复制
el-table-column的show-overflow-tooltip弹出的提示无法复制,官方也暂时不准备解决,可以自己模拟一个 <el-table-column label"支付单号" width"100"><template #default"{ row }"><el-tooltip :content&…...
【C语言】指针的进阶(三)—— 模拟实现qsort函数以及指针和数组的笔试题解析
目录 1、模拟实现qsort函数 1.1、qsort函数的回顾 1.2、模拟实现qsort函数 2、指针和数组笔试题解析 2.1、一维数组 2.2、字符数组 1、模拟实现qsort函数 1.1、qsort函数的回顾 要模拟实现qsort函数,就要了解清楚qsort函数的参数以及使用方式。 我们先回顾一…...
Python 图像处理库PIL ImageOps笔记
# 返回一个指定大小的裁剪过的图像。该图像被裁剪到指定的宽高比和尺寸。 # 变量size是要求的输出尺寸,以像素为单位,是一个(宽,高)元组 # bleed:允许用户去掉图像的边界(图像四个边界ÿ…...
全球南方《乡村振兴战略下传统村落文化旅游设计》许少辉八一新枝——2023学生开学季辉少许
全球南方《乡村振兴战略下传统村落文化旅游设计》许少辉八一新枝——2023学生开学季辉少许...
【C语言】指针的进阶(一)
目录 前言 1. 字符指针 2. 指针数组 3. 数组指针 3.1 数组指针的定义 3.2 &数组名VS数组名 3.3 数组指针的使用 4. 数组参数、指针参数 4.1 一维数组传参 4.2 二维数组传参 4.3 一级指针传参 4.4 二级指针传参 5. 函数指针 前言 指针在C语言中可谓是有着举足轻重的…...
Spring学习(三):MVC
一、什么是MVC MVC(Model-View-Controller)是一种软件设计模式,用于组织和管理应用程序的代码结构。它将应用程序分为三个主要部分,即模型(Model)、视图(View)和控制器(…...
排查disabled问题之谷歌新版本特性
问题复现 最近我突然接手一个后台的bug,这个后台很久没有迭代更新了,我也不熟悉业务,所以只能看一下源码,问题很快就复现,测试的修复操作也很正确,就是因为渲染的input标签中存在disableddisabled’属性导…...
三、开发工具
开发工具 开发工具1.1.熟悉IDEA1.2.下载IDEA1.3.IDEA中文插件1.4.IDEA输出中文乱码1.5.使用IDEA —————————————————————————————————————————————————— —————————————————————————————————…...
代码解读:y.view(y.size(0), -1)---tensor张量第一维保持不变,其余维度展平
y.view(y.size(0), -1)代码解读: 用于改变PyTorch张量(tensor)y的形状的。 y.size(0)返回y的第一维的大小。 -1表示让PyTorch自动计算该维度的大小,以确保新的张量与原始张量有相同的元素数量。 功能:将y的第一维保持…...
必示科技赋能广发证券运维数字化实践案例,入选信通院《中国AIOps现状调查报告(2023)》
近期,“必示科技赋能广发证券运维数字化实践,打造智能运维数据中台”合作案例被中国信息通信研究院作为优秀金融案例项目,收录在最新的《中国AIOps现状调查报告(2023)》(金融行业仅3家)。 以必…...
特斯拉Dojo超算:AI训练平台的自动驾驶与通用人工智能之关键
特斯拉公开Dojo超算架构细节,AI训练算力平台成为其自动驾驶与通用人工智能布局的关键一环 在近日举行的Hot Chips 34会议上,特斯拉披露了其自主研发的AI超算Dojo的详细信息。Dojo是一个可定制的超级计算机,从芯片到系统全部由特斯拉自主设计…...
Linux中的一些常用命令
1.查看Linux系统中自带的GLIBC版本 ldd --version2.Linux中删除文件的命令 在Linux中,删除文件的命令是 rm。 使用 rm 命令时,请小心使用,因为它将直接删除文件,而不会将其移动到回收站。 以下是 rm 命令的一些常用选项&#…...
VRTK4⭐二.VRTK4的项目基础配置
文章目录 🟥 硬件基本配置🟧 设置XR Plug-in Management🟨 添加项目Tilia🟩 配置项目Hierarchy 🟥 硬件基本配置 解决使用OpenXR,HTC头显正常追踪,但手柄无法使用的问题. 问题如下: 当我们按照官方的标准流程配置完Op…...
word-doc和docx区别
office从业者路过。 文件结构上doc文件数据是以二进制形式存放的。 docx是以xml文件形式存放的。 doc兼容较差,docx效果更好。...
深度学习-偏导数复习
文章目录 前言1.偏导数2.偏导数概念1.对x的偏导数2.对y的偏导数3.多元函数偏导数4.如何计算偏导数1.二元函数的偏导数2.复杂函数的偏导数3.分段函数1.分界点的偏导数 5.偏导数与连续之间的关系6.偏导数的几何意义7.高阶偏导数1.定义2.高阶偏导数例题(二阶偏导数&…...
linux之jq命令
jq命令用于linux命令行对json进行处理 参数 option -r:去掉字符串的引号"例子 tt.json文件如下: [{"metric": "httpcode","tags": {"cluster": "tt","domain": "www.baidu.…...
nginx知识点详解:反向代理+负载均衡+动静分离+高可用集群
一、nginx基本概念 1. nginx是什么,做什么事情? Nginx是一个高性能的HTTP和反向代理服务器,特点是占有内存少,并发能力强。Nginx转为性能优化而开发,能经受高负载考验。支持热部署,启动容易,运…...
powerDesigner 的基本使用
打开powerDesigner 新建 PDM(物理数据模型) 添加表字段 双击表,设置ID自增 选择导出数据库表SQL 导出成功 使用三方工具连接数据库,然后运行对应SQL文件即可 导入SQL文件数据到powerDesigner...
Java下打印一个等腰三角型
想达到这个结果,通常的做法是通过拼结两个三角型达到,但是实际上还有最右边的第三个三角型没有处理,这个拼结的方法总让人看起来有一点不完美的感觉,于是我自创了一个思路,一气合成,代码如下(本…...
在线网站地图生成器/360优化关键词
Workerman_cor_ape这是什么Workerman_cor_ape 是知名php框架 Workerman 的强化版,在不影响任何使用方式,稳定性,性能前提下,增加了异步任务组件。原理是什么Workerman每个工作进程只有一个线程,这个线程既负责收发网络…...
office 网站制作/搜索引擎有哪些种类
自己没想出来, 代码来自别人的博客, 但是找不到出处了… 代码实现 int longestSubstring(string str) {//利用哈希的思想,key是每一个字符,value是其对应的下标// 存储上一个重复字符的位置int* lastPosition new int[256];//初始化,首字符之前没有与其重复的字符,都为-1for (…...
青县做网站/推广运营是什么工作
目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 jmeter 性能测试数据…...
做网站webform mvc/优化设计七年级上册数学答案
●MySQL事务隔离级别(1)●第1节:事务概述第2节:MySQL4种事务隔离级别分析第3节:总结1 事务概述什么是事务?数据库事务(简称:事务)是数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成。事务的使用是数据库管理系统区别文件系统的…...
问题反馈的网站怎么做/推广营销方案
*体会静坐的乐趣 *把不用的东西捐出去 *整理相片 *分类放置物品 *从家务中解放出来 *辞掉现在的工作 *种一棵树 *和孩子一起做游戏 *听听流行音乐 *多读书 &a…...
wordpress 产品视频上传/app 推广
修改鼠标滚轮方向&配置MacBook触控板的多指快捷操作背景:问题描述:解决办法:参考链接:软件下载:几点经验:背景: 从 macOS 转到 windows 系统最不适应的就是鼠标的滚轮方向,用久了…...