当前位置: 首页 > news >正文

ChatGPT 的一些思考

最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开始,就已经能够理解较多的上下文信息并给出符合上下文的回复,但是给人的震撼并不如这次 3.5/4.0 版本来的多。就我个人而言,最直接的比较震撼的是更加灵活的代码生成,小说续写改写等等,而且都是从自然语言习惯进行交流的,不用相对来说比较专业的术语或者提问方式就可以实现流畅的沟通。

这次 ChatGPT 的火爆让我重新回顾了下近些年来 AI 究竟在生活当中从哪些方面融入了我们的日常。就我个人而言,能够明显感受到或者了解到的 AI 实际应用的场景有下面几个:

  • 实时字幕/实时翻译;
  • 手机拍照(人像模式);
  • 图像文字提取
  • AI 绘画和人脸替换;

实时字幕的应用有几个细分,比如说双方交流的实时字幕生成,并不包含翻译部分,是把对方的话用对方的语言来实时生成字幕进行显示,特别适用于听力不好但是阅读能力比较好的人使用。典型的产品有WIN11 的全局实时字幕,小米手机的小米闻声实时字幕,当然还有其它的一些 APP,不过感觉一些专门做词典之类的软件反而并不如一些视频会议软件或者小米闻声做得好,讯飞也是做得比较好的。这种的典型应用场景就是春晚或者什么直播节目也可以进行实时字幕的生成,以及不同地区方言到统一官方语言的转换,还有就是需要进行语音实时转录文字,这个文字工作者应该会比较需要。还有一些细分就是同声传译,也就是除了识别对方说的话之外还额外帮你翻译出来转换到自己想用的语言上面去,这个准确度已经比以前提升了非常多了,这个极大的方便了不同国家不同语言口音的人交流,出国游的时候就不用担心会遇到无论如何也搞不懂说什么的状况。

手机拍照这个对于 AI 的应用也是愈来愈广泛,我就说一个比较典型的能够有明显感知的应用,比如说人像模式的拍照或者视频录制,需要进行背景虚化,以前的背景虚化搞得都是非常不准确的,该虚的地方没有虚好,该实的地方没有实,总之就是突出一个不稳定。而以小米为例,小米12s 系列就已经表现出了比较令人满意的背景虚化效果了,大部分情况下都可以得到令人满意的虚化效果。

还有就是图像文字提取,也就是古早时候的 OCR 技术实现的的升级版,比较明显的就是微信的图像文字提取,可以直接把图像当做文本文件进行选择、复制、剪切,十分方便。还有就是用于改作业、做作业的图像识别,直接可以识别出来文字和图形化的题目,并给出解析,这个也是非常能体现生产力的地方,当然还有很多其它的应用我就没过多涉及了,总之都是生产力提升的体现。

AI 绘画也是 AIGC 的一个比较令人震惊的应用,而且从目前来看,AI 绘画已经可以做到添加一些 AI 自己的艺术理解进去,有些情况下的画作已经比人类还要优秀了。最令我震惊的是最近的写实风 AI 图像生成,虽然一直被吐槽 AI 还是无法理解人类的手是什么个存在,但是通过一定的训练之后已经可以画出一些超写实的画作了,基本上乍一看看不出来真假。还有一部分是建模的应用,虽然不清楚具体的实现是不是基于传统 CV 还是改良后的 AI,但是我感觉纯传统 CV 应该做不到那么真实的模拟。而人脸替换则肯定是基于 AI 的实现了,这个在很多的短视频里面、电影里面都有体现了,已经达到相当的实用程度,不在是笨拙的纯玩具的级别。

而最近的 ChatGPT bing 版,我看好多时候回答已经体现出了一些独立人格的迹象,虽然它不一定是真的独立人格,但是给人的感觉已经非常接近了,对我来说已经有点恐怖谷效应了,属于非常接近但是还总是有一点不对劲的感觉。这次的版本更新给人一种强烈的危机感,毕竟离线训练版的就已经可以达到代码生成,超强的语义理解和交流,这些完全可以在不断的训练之中进化达到更强的程度。试想一下 ChatGPT 的接口引入到游戏产业,游戏里面的 NPC 可以产生完全符合现实中自然人类的对话和行为,这将创造一个极度真实的自由世界,只需要赋予每个 NPC 不同的 AI 人格,加之接口数据的指令化标准化就可以做到。

感觉下一次的社会层面技术大升级如初升红日,在远远的海岸线上已经绰约可见了。想象中的下一轮升级是属于 AI+机器人的,也就是把强 AI 录入到不同功用的机器人内生操作系统里面,由 AI 去控制完成一些自然语言指令,工业上或许要更加特殊化一些,但是生活和一些工业门类则可以做到完全使用自然语言去控制 AI+机器人实现真正的实用化的 AI 助手。而「流浪地球2」里面的机器人技术和 550 系列我感觉可能真的已经在不远的将来了,现在能想到的最可能的组合,AI+波士顿动力的机器人/机器狗,经过后续的接口对接和迭代或许可以在有生之年带来一场全新的技术革命,当然技术对于人类社会的冲击也许不可忽视,但是这是另外一个话题了。

目前已经可以看到端倪的,可以被少量或者大量替代的岗位我自己理解可能会有:程序员(UI 设计、互联网等比较标准化软件化的领域);效果调试(自动控制、Tuning);文字工作者(绘画、有一定格式要求的文章写手);语言工作者(翻译、同传);律师(一些民事领域的纠纷处理);服务类型岗位(流程处理、程式化的内容处理);会计(流程报表);司机等等。当然这些不会是完全替代,但是绝对会相当程度上解放其生产力,使得需要的工作岗位大量减少,只保留少部分中低端岗位和高端岗位,剩下的会被全部替代。

面对 AI 的的冲击,也许从个人来讲除了为此感到谨慎兴奋和享受其带来的便利之外,也该更多的去思考下对个人带来的影响。毫无疑问个人生产力会得到更大的解放,个人未来可能不需要再花大量的时间在一些日常家务、无效或者说无必要的人际交往等上面,更多把精力用于自己喜欢的事情和创造力上面去。但是也应警惕自己的可替代性,在向 AI 时代进化的过程初期和中期,肯定会牺牲掉一大部分人从而完成整个的过渡。我个人想到的不可替代的工作类型有:程序员(与硬件绑定较多的、高端理论发明、架构创造);医生(需要进行外科手术的);律师(刑事律师、经济领域、高端领域)等等。我想要特别说明的是教师,无论何种教师,教学工作内容简单与否,我想都是绝对不可替代的,即使 AI 的教学技术或许可以超过人类,但是学生家长是绝对不允许学生处在一个独立的学习环境的,客观条件上来讲义务教育阶段的学生也是绝对不可能适应独立学习环境的,初期学习是一个需要通过人际交往来实现的行为,脱离了人与人之间的交流,从目前的人类构造来讲,义务教育不太可能实现其预定的目标。

AI 的时代或许很快就会到来,个人虽不一定要深度参与其中,但是保持一定的敏感性还是很有必要的。

相关文章:

ChatGPT 的一些思考

最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开…...

GEE学习笔记 六十九:【GEE之Python版教程三】Python基础编程一

环境配置完成后,那么可以开始正式讲解编程知识。之前我在文章中也讲过,GEE的python版接口它是依赖python语言的。目前很多小伙伴是刚开始学习GEE编程,之前或者没有编程基础,或者是没有学习过python。为了照顾这批小伙伴&#xff0…...

大数据全系安装

内容版本号CentOS7.6.1810ZooKeeper3.4.6Hadoop2.9.1HBase1.2.0MySQL5.6.51HIVE2.3.7Sqoop1.4.6flume1.9.0kafka2.8.1scala2.12davinci3.0.1spark2.4.8flink1.13.5 1. 下载CentOS 7镜像 CentOS官网 2. 安装CentOS 7系统——采用虚拟机方式 2.1 新建虚拟机 2.2.1 [依次选择]-&…...

stable-diffusion-webui 安装使用

文章目录1.github 下载,按教程运行2.安装python 忘记勾选加入环境变量,自行加入(重启生效)3.环境变量添加后,清理tmp ,venv重新运行4.运行报错,无法升级pip,无法下载包,5…...

3D点云处理:点云聚类--FEC: Fast Euclidean Clustering for Point Cloud Segmentation

文章目录 聚类结果一、论文内容1.1 Ground Surface Removal1.2 Fast Euclidean Clustering题外:欧几里得聚类Fast Euclidean Clustering二、参考聚类结果 原始代码中采用的是pcl中的搜索方式,替换为另外第三方库,速度得到进一步提升。 一、论文内容 论文中给出的结论:该…...

华为OD机试题 - 射击比赛(JavaScript)| 代码+思路+重要知识点

最近更新的博客 华为OD机试题 - 括号检查(JavaScript) 华为OD机试题 - 最小施肥机能效(JavaScript) 华为OD机试题 - 子序列长度(JavaScript) 华为OD机试题 - 众数和中位数(JavaScript) 华为OD机试题 - 服务依赖(JavaScript) 华为OD机试题 - 字符串加密(JavaScript)…...

流程引擎之Flowable简介

背景Flowable 是一个流行的轻量级的采用 Java 开发的业务流程引擎,通过 Flowable 流程引擎,我们可以部署遵循 BPMN2.0 协议的流程定义(一般为XML文件)文件,并能创建流程实例,查询和访问流程相关的实例与数据…...

AcWing:4861. 构造数列、4862. 浇花(C++)

目录 4861. 构造数列 问题描述: 实现代码: 4862. 浇花 问题描述: 实现代码: 4861. 构造数列 问题描述: 我们规定如果一个正整数满足除最高位外其它所有数位均为 00,则称该正整数为圆数。 例如&…...

进程的概念

进程的概念 程序的概念 这里说的是一个可执行文件,passive的意思可以理解为我们这个执行文件需要我们进行双击才会被被执行。 双击后,程序入口地址读入寄存器,程序加载入主存,成为一个进程 进程是主动去获取想要的资源&#xff0…...

自动化测试5年经验,分享一些心得

自动化测试介绍 自动化测试(Automated Testing),是指把以人为驱动的测试行为转化为机器执行的过程。实际上自动化测试往往通过一些测试工具或框架,编写自动化测试用例,来模拟手工测试过程。比如说,在项目迭代过程中,持…...

independentsoft.de/MSG .NET Framework Crack

MSG .NET 是用于 .NET Framework / .NET Core 的 Microsoft Outlook .msg 文件 API。API 允许您轻松创建/读取/解析/转换 .msg 文件等。API 不需要在机器上安装 Microsoft Outlook 或任何其他第三方应用程序或库即可工作。 以下示例向您展示了如何打开现有文件并显示消息的某些…...

基于Transformer的NLP处理管线

HuggingFace transformers 是一个整合了跨语言、视觉、音频和多模式模态与最先进的预训练模型并且提供用户友好的 API 的AI开发库。 它由 170 多个预训练模型组成,支持 PyTorch、TensorFlow 和 JAX 等框架,能够在代码之间进行互操作。 这个库还易于部署&…...

二叉树OJ(一)二叉树的最大深度 二叉搜索树与双向链表 对称的二叉树

二叉树的最大深度 二叉树中和为某一值的路径(一) 二叉搜索树与双向链表 对称的二叉树 二叉树的最大深度 描述 求给定二叉树的最大深度, 深度是指树的根节点到任一叶子节点路径上节点的数量。 最大深度是所有叶子节点的深度的最大值。 (注:…...

使用Fairseq进行Bart预训练

文章目录前言环境流程介绍数据部分分词部分预处理部分训练部分遇到的问题问题1可能遇到的问题问题1问题2前言 本文是使用 fairseq 做 Bart 预训练任务的踩坑记录huggingface没有提供 Bart 预训练的代码 facebookresearch/fairseq: Facebook AI Research Sequence-to-Sequence…...

n阶数字回转方阵 ← 模拟法

【问题描述】 请编程输出如下数字回旋方阵。 【算法代码】 #include <bits/stdc.h> using namespace std;const int maxn100; int z[maxn][maxn];void matrix(int n) {int num2;z[0][0]1;int i0,j1;while(i<n && j<n) {while(i<j) z[i][j]num;while(j&…...

【人工智能AI】二、NoSQL 基础知识《NoSQL 企业级基础入门与进阶实战》

写一篇介绍 NoSQL 基础知识的技术文章&#xff0c;分5个章节&#xff0c;每个章节细分到3级目录&#xff0c;重点介绍一下NoSQL 数据模型&#xff0c;NoSQL 数据库架构&#xff0c;NoSQL 数据库特性等&#xff0c;不少于2000字。 NoSQL 基础知识 NoSQL&#xff08;Not Only SQ…...

Camera Rolling Shutter和Global Shutter的区别

卷帘快门&#xff08;Rolling Shutter&#xff09;与全局快门&#xff08;Global Shutter&#xff09;的区别 什么是快门 快门是照相机用来控制感光片有效曝光时间的机构。 快门是照相机的一个重要组成部分&#xff0c;它的结构、形式及功能是衡量照相机档次的一个重要因素。 …...

模版之AnyType

title: 模版之AnyType date: 2023-02-19 21:49:53 permalink: /pages/54a0bf/ categories: 通用领域编程语言C tags:C元编程 author: name: zhengzhibing link: https://azmddy.top/pages/54a0bf/ 模版之AnyType 在研究C的编译期反射时&#xff0c;发现了AnyType很有意思。 首…...

【汇编】一、环境搭建(一只 Assember 的成长史)

嗨~你好呀&#xff01; 我是一名初二学生&#xff0c;热爱计算机&#xff0c;码龄两年。最近开始学习汇编&#xff0c;希望通过 Blog 的形式记录下自己的学习过程&#xff0c;也和更多人分享。 这篇文章主要讲述汇编环境的搭建过程。 话不多说~我们开始吧&#xff01; 系统环…...

【博客628】k8s pod访问集群外域名原理以及主机开启了systemd-resolved的不同情况

k8s pod访问集群外域名原理以及使用了systemd-resolved的不同情况 1、不同情况下的linux主机访问外部域名原理 没有使用systemd-resolved的linux主机上访问外部域名一般是按照以下步骤来的&#xff1a; 从dns缓存里查找域名与ip的映射关系 从/etc/hosts里查找域名与ip的映射…...

测试3.测试方法的分类

3.测试分类 系统测试包括回归测试和冒烟测试 回归测试&#xff1a;修改了旧的代码后&#xff0c;重新测试功能是否正确&#xff0c;有没有引入新的错误或导致其它代码产生错误 冒烟测试&#xff1a;目的是确认软件基本功能正常&#xff0c;可以进行后续的正式测试工作 按是否…...

Android 基础知识4-2.9 FrameLayout(帧布局)详解

一、FrameLayout&#xff08;帧布局&#xff09;概述 FrameLayout又称作帧布局&#xff0c;它相比于LinearLayout和RelativeLayout要简单很多&#xff0c;因为它的应用场景也少了很多。这种布局没有方便的定位方式&#xff0c;所有的控件都会默认摆放在布局的左上角。 示例1代…...

Go语言xorm框架

xorm xorm是一个简单而强大的Go语言ORM库通过它可以使数据库操作非常简便。 官网: https://xorm.io/ 中文文档: https://gitea.com/xorm/xorm/src/branch/master/README_CN.md 特性 支持 Struct 和数据库表之间的灵活映射&#xff0c;并支持自动同步事务支持同时支持原始SQL…...

19_微信小程序之优雅实现侧滑菜单

19_微信小程序之优雅实现侧滑菜单一.先上效果图 要实现这样一个效果&#xff0c;布局其实很简单&#xff0c;整体布局是一个横向滚动的scroll-view&#xff0c;难点在于怎么控制侧滑菜单的回弹&#xff0c;以及寻找回弹的边界条件? 此篇文章主要是基于uni-app来实现的&#xf…...

JSP中JDBC与javaBean学习笔记

本博文源于博主偷偷复习期末的java web&#xff0c;博文主要讲述JDBC API与JavaBean&#xff0c;涉及driver,driver Manager\connection、statement接口、PreparedStatement接口、ResultSet接口&#xff0c;JavaBean包含一些标记介绍。 1.JDBC API JDBC由一组接口和类组成&am…...

编译Android系统源码推荐的电脑配置

工欲善其事&#xff0c;必先利其器。 看到很多客户&#xff0c;搞Android产品开发&#xff0c;用的电脑配置是惨不忍睹。 这些老板脑子有坑吗... ------------ 编译Android9推荐电脑配置&#xff1a; 处理器&#xff1a;酷睿i7 5代系列 8线程以上 内存&#xff1a; 8GB以上…...

加油站会员管理小程序实战开发教程10

上一篇我们介绍了计算距离及到店导航的功能,本篇我们介绍一下今日油价的功能。 如果要按日显示最新的数据,那么我们首先需要有数据源来存放每日的油价数据。这里涉及数据源的时候要考虑你的数据是只录入一条,还是每日录入一条。 录入一条呢,比较简单,但有个问题是如果我…...

shell编程之条件判断和流程控制

typora-copy-images-to: pictures typora-root-url: …\pictures 文章目录typora-copy-images-to: pictures typora-root-url: ..\..\pictures本节课程目标一、条件判断语法结构2. 条件判断相关参数㈠ 判断文件类型㈡ 判断文件权限㈢ 判断文件新旧㈣ 判断整数㈤ 判断字符串㈥ 多…...

第一次接触jquery

文章目录一.关于jqurey二.什么是jqurey三.上课实例1.表格 2.鼠标移动效果 3隐藏和显示效果代码如下注意一.关于jqurey 简而言之&#xff1a;jQuery 是一个 JavaScript 库。 jQuery 极大地简化了 JavaScript 编程。 二.什么是jqurey jQuery 是一个 JavaScript 函数库。 jQu…...

Vue中 引入使用 babel-polyfill 兼容低版本浏览器

注意&#xff1a;本文主要介绍的 vue-cli 版本&#xff1a;3.x&#xff0c; 4.x&#xff1b; 最近在项目中使用 webpack 打包后升级&#xff0c;用户反馈使用浏览器&#xff08;chrome 45&#xff09;访问白屏。经过排查发现&#xff1a;由于 chrome 45 无法兼容 ES6 语法导致的…...

网站 配色方案/免费推广网站视频

在C#编程中经常需要对一些键值对进行处理&#xff0c;一般我们可以使用字典或哈希表来实现。和字典比起来&#xff0c;哈希表占用系统资源更少更为方便。 下面举例说明哈希表的常用方法&#xff1a; 1, 添加元素&#xff1b; 2, 删除元素&#xff1b; 3, 遍历&#xff1b; 4, 查…...

网盘做网站空间/网站做外链平台有哪些

系统集成是指通过结构化的综合布线系统和计算机网络技术&#xff0c;将各个分离的设备&#xff08;如个人电脑&#xff09;、功能和信息等集成到相互关联的、统一和协调的系统之中&#xff0c;使资源达到充分共享&#xff0c;实现集中、高效、便利的管理&#xff0c;以发挥整体…...

广州 网站建设公司/百度官方下载

我在使用cherrypy3.2.4上传文件时遇到问题。(Python 2.7)我无法获取上传文件的原始数据。我试图调试如何从响应中获取数据值&#xff0c;但没有成功。有人知道怎么解决这个问题吗&#xff1f;在皮奥特这是我使用的代码&#xff1a;def index(self):return """Up…...

用虚拟机做网站服务器吗/做市场推广应该掌握什么技巧

最近项目中需要在SQL SERVER中进行分页&#xff0c;需要编写分页查询语句。之前也写过一些关于分页查询的语句&#xff0c;但是性能不敢恭维。于是在业务时间&#xff0c;在微软社区Bing了一篇老外写的关于SQL SERVER分页的文章。看过之后&#xff0c;感觉自己之前写的语句&…...

网站备案查询工信网/广告软文案例

将 ODE 的解约束为非负解。施加非负性并不总是微不足道的,但有时由于方程的物理解释或由于解决方案的性质,这是必要的。您应该只在必要时对解决方案施加此约束,例如在没有它的情况下集成失败的情况,或者解决方案不适用的情况。 如果解决方案的某些组件必须是非负的,则使用…...

昆明网站建设精英/seo网站管理

《计算机网络》作业二第3章计算机网络硬件设备练习一、填空题1《计算机网络》作业二第3章 计算机网络硬件设备练习一、填空题1. 有线传输介质包括________、_________、__________。2. 在局域网中常用的双绞线根据传输特性可以分为_________类。在典型的以太网中&#xff0c;通…...