2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!
文章目录
- 1 前言
- 2 Google I/O 发布者大会
- 3 PaLM 2模型
- 3 Bard项目
- 4 其他AI工具
- 4.1 AI 图片编辑 Magic Editor
- 4.2 Duet AI 办公
- 4.3 Universal Translator 翻译工具
- 4.4 Google 沉浸式导航
- 4.5 Google 搜索引擎
- 5 讨论
1 前言
每年必看两大会,苹果发布会和谷歌发布会,除了英语听力磨耳朵,看看库克飞檐走壁,吃瓜掉链子外,关注前沿技术,更是为了感受科技改变生活,本篇文章仅围绕人工智能AI方面
进行描述:
谷歌其实一直都是AI的老牌公司,眼看这一年被ChatGPT力压火的一塌糊涂,抢尽风头。去年OpenAI的ChatGPT突然发布确实是波**“偷袭”,措不及防。谷歌在2月才匆匆发布第一代Bard“应付”**一下,但是首次亮相就自信的出错。当时示例是“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?”查询读取。机器很快吐出三个想法,包括最后一个想法,“JWST 拍摄了我们太阳系外行星的第一张照片。但并非JWST拍摄的。2004 年,这一荣誉属于欧洲南方天文台的甚大望远镜 (VLT),美国宇航局证实了这一点。
有小伙伴就会问,**怎么这么扣细节?ChatGPT不也经常语无伦次吗?**非也,关于ChatGPT可以回看这篇文章,排除个别网友故意训练错误信息(即保证数据库纯净)外,需要正确的提问(引导)才能得到正确的回答:https://mp.weixin.qq.com/s/o4MeE_x0YwPVzSrybyoEVg
还有的小伙伴可能觉得AI这个话题年年谈,年年有,是不是要近饱和了?也不是,打个比喻,人们在冰海上远远的发现一块“浮冰”,有破冰船了接近一看发现是个冰山,等有条件下潜了才渐渐发现“真理面纱”。确实是越探索,知道的越多越觉得无知。
AI从未接近饱和,甚至可以说是刚开始,才刚摸到门槛。
2 Google I/O 发布者大会
北京时间5月11日凌晨,**「Google I/O 发布者大会」**亮相,全会围绕“Making AI more helpful for everyone”让人工智能对各个领域各尽所长。
目前还未恰到饭,侧重点在于PaLM 2模型、Bard和其他相关的AI工具。
3 PaLM 2模型
OpenAI的GPT-4模型现在公认一家独大,现谷歌宣布PaLM 2可以一战,下述内容基于谷歌发表的技术报告
其中提到三大亮点:
- 多语言性: PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言。这显着提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。
- 推理: PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。
- 编码: PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言,但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。
这里是对比于PaLM1代,也是在文件中提到放在第一位的就是语言能力。按照CEFR定义,每场写作考试都由三位专业的母语人士进行评分,PaLM 2的日语达到了A/特别A级,在法语方面达到了C1级。这个是很有用的,做科研的都知道,一定条件下机翻是永远替代不了原生语言,不然润色服务也不会这么盆满钵满了。
解释翻译的波斯谚语的含义,挺有意思的,能理解深意,还是着重在**“会思考”**,这是区别人工智能和人工机器的一大关键点。
这是各语言下1代和2代的一个ROC评分,可以理解为是准确性,越高越好
横向对比12
种编程语言评估,可以理解为与人工作的一个编码的准确性,也是越高越好
3 Bard项目
Bard是和ChatGPT一样是个语言模型,中文名字叫巴德,就是在今天凌晨,谷歌已经取消wait list
名单了,直接开放于180个国家和地区,和微软一样重磅,微软是在五一期间开放了New Bing
,但是每天只能问20个问题,笔者还在测试中,埋个伏笔。
Bard是搭载了PaLM2模型
的,按技术报告来看应该是挺牛的,据说编程能力更胜一筹,大家可以体验一下,不过暂不支持中文,Bard网址:https://bard.google.com/
有意思:
4 其他AI工具
4.1 AI 图片编辑 Magic Editor
这一张是调色,然后把长椅移到画面中间以保持空间填充,精神抖擞。不过还是小有瑕疵,观察一下长椅的阴影,但是笔者认为比起iPhone14Pro的高度锐化和三星的“创造月球照片”好多了:
Google 分享了几个 Magic Editor 的实际应用示例,它们都非常酷。在一张人在瀑布前的照片中,谷歌将人完全移到照片的一侧,抹去背景中的人,并使天空更蓝。
无法上传GIF,可移步到下方公众号查看原文
听说该工具会优先登陆于谷歌的Pixel手机。
4.2 Duet AI 办公
涵盖了一系列适用于 Google 生产力应用程序的生成式 AI 工具。正如我们今年早些时候详述的那样,这包括 Docs 和 Gmail 中的写作帮助、幻灯片的图像生成、Meet 的自动会议摘要等等。但在谷歌 I/O 上,唯一真正的新闻是写作辅助也将出现在移动版 Gmail 中,它将被标记为“帮我写”——Smart Compose 的升级版。
- 轻松生成专业化的岗位描述
- 在Gmail将会议记录转换成电子邮件
- 还有很多~~~~
但是使用仍需加入workspace的waitlist,只能等了
网址:https://workspace.google.com/labs-sign-up/
4.3 Universal Translator 翻译工具
该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该实用程序不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情。输出的人说话视频会根据目标语言的发音同步嘴唇的动作。
如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的嘴唇。
但是一向注重版权的歪果仁肯定会考虑到安全这点,所以会限制一般用户,需要授权通过才能使用。
4.4 Google 沉浸式导航
谷歌地图一直都很牛,不少人用过Google Earth
,好评连连吧。这一次升级体现在**“沉浸式”,新视图将填充 3D 建筑、植被,为用户提供更好的视角,在展示街道及其周围环境的同时提供更多细节。用户不仅可以实时查看所有这些信息,还可以调整时间以查看天气和交通在过去几个小时内可能发生的变化,实现真正的云游**。
这个功能在夏季推出,到 2023 年底将在 15 个城市推出。
4.5 Google 搜索引擎
这个功能放在最后,与 Microsoft 的Bing
体验类似,这个新面板中有一些东西,所有这些都是为了让你在输入更自然的搜索提示时一目了然的信息。
该体验即将登陆谷歌实验室,并将在未来几周内推出,还是要申请waitlist
。
5 讨论
人工智能的发展其实在第一波ChatGPT惊雷后是没有太大感觉差异的,因为后续的更新换代和接二连三的同台竞技产品(文心一言、阿里的AI、和鲸的AI等),即便是很多镜像的,“国产ChatGPT”,都是大语言模型
,一代又一代只是算法上的优化和扩大模型,在我们的基础使用体验上并没有太大差别。
笔者觉得人工智能现在掀起的波浪其实遍布各个方向,只不过我们大多数人都只关注于文本聊天模型,所以还没接触到真正的“AI改变生活”
,不过这个交给专业团队,交给工业界了,外行看热闹,内行看门道,作为不涉及研发,不涉及开发的我们,看着门道的热闹也是可以的
相关文章:

2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!
文章目录 1 前言2 Google I/O 发布者大会3 PaLM 2模型3 Bard项目4 其他AI工具4.1 AI 图片编辑 Magic Editor4.2 Duet AI 办公4.3 Universal Translator 翻译工具4.4 Google 沉浸式导航4.5 Google 搜索引擎 5 讨论 1 前言 每年必看两大会,苹果发布会和谷歌发布会&am…...

MySQL和Redis如何保证数据一致性?
前言 由于缓存的高并发和高性能已经在各种项目中被广泛使用,在读取缓存这方面基本都是一致的,大概都是按照下图的流程进行操作: 但是在更新缓存方面,是更新完数据库再更新缓存还是直接删除缓存呢?又或者是先删除缓存再…...

Markdown使用(超详细)
(HBuilderX) 掌握md及HBuilderX对md的强大支持。如果没有点右键设置自动换行,可按Alt滚轮横向滚动查看。 很多人只把markdown用于网络文章发表,这糟蹋了markdown。 markdown不止是HTML的简化版,更重要的是txt的升级版…...

yolov5实现扑克牌识别的产品化过程
文章目录 介绍项目下载硬件准备软件环境素材获取自行获取素材网盘获取图片标注模型训练窗口截图窗口截图(HWND)桌面截图wgc方法最终采用的方式WGC使用方法如何保存灰度图片python 如何加载dll库图片推理扑克牌逻辑ui编写模型加密软件授权软件加密软件打包安装包制作...

第07讲:Java High Level Client,读写 ES 利器
SkyWalking OAP 后端可以使用多种存储对数据进行持久化,例如 MySQL、TiDB 等,默认使用 ElasticSearch 作为持久化存储,在后面的源码分析过程中也将以 ElasticSearch 作为主要存储进行分析。 ElasticSearch 基本概念 本课时将快速介绍一下 E…...

dockerfile暴力处理配置文件外提
前言: 一般来说,springboot打成的jar运行时,同目录/config目录下放application.yml文件会被进行加载,然后通过设置docker映射出宿主机即可做到配置文件外配的效果,但很多时候别的配置文件做不到这种效果,说…...
如何快速给出解释——正交矩阵子矩阵的特征值的模必然不大于1
Memory 首先快速回忆一下正交矩阵的定义: A为n阶实矩阵,且满足A‘AE或是说AA’E,那么A为正交矩阵。 (啊,多么简洁的定义) 其次快速想到它的性质: ① 实特征值必然 或 其他复数…...

c语言-位运算
位运算小结 位运算不管是在C语言中,或者其他语言,都是经常会用到的,所以本文也就不固定以某种语言来举例子了,原始点就从0、1开始。位运算主要包括按位与(&)、按位或(|)、按位异或(^)、取反(~)、左移(<<)、右移(>…...

【Android学习专题】安卓样式学习(学习内容记录)
学习记录内容来自《Android编程权威指南(第三版)》 样式调整和添加 调整颜色资源(res/values/colors.xml) 格式: 添加样式(res/values/styles.xml),(创建BeatBox项目时…...

普罗米修斯统计信息上报结构设计
为了实现高效的监控和警报,普罗米修斯提供了一个强大的统计信息上报机制。通过这个机制,可以将应用程序的各种统计信息发送到普罗米修斯,普罗米修斯会对这些信息进行处理,然后提供丰富的监控和警报功能。下面是基本的统计信息上报…...

两个系统之间的传值
在两个系统之间传值可以采用以下几种方式: 使用 URL 参数:可以将数据作为 URL 参数传递给另一个系统,另一个系统可以解析 URL 参数并获取数据。例如:Example Domain 使用 Cookie:可以在一个系统中设置 Cookie…...

PostgreSQL(五)JDBC连接串常用参数
目录 1.单机 PostgreSQL 连接串2.集群PostgreSQL 连接串 PostgreSQL JDBC 官方驱动下载地址: https://jdbc.postgresql.org/download/ PostgreSQL JDBC 官方参数说明文档: https://jdbc.postgresql.org/documentation/use/ 驱动类: driver-…...

如何修改浏览器中导航栏的背景色和字体
在日常使用电脑时,我们总会使用浏览器来浏览网页。而浏览器中的导航栏是用户进行网页浏览的主要界面之一,其背景色和字体的选择对用户的体验有着重要的影响。因此,为了让导航栏更加美观和易于使用,我们需要对其背景色和字体进行修…...

如何选择合适的智能氮气柜?
随着电子产品的普及,IC、半导体、精密元件、检测仪器之类的物品对湿度要求越来越高,潮湿、霉菌和金属氧化所造成的损害,随时在发生。人们对于物品的存放环境要求逐渐提高,利用防潮设备如智能氮气柜、电子防潮柜来存储产品也越来越…...

双向链表(数据结构)(C语言)
目录 概念 带头双向循环链表的实现 前情提示 双向链表的结构体定义 双向链表的初始化 关于无头单向非循环链表无需初始化函数,顺序表、带头双向循环链表需要的思考 双向链表在pos位置之前插入x 双向链表的打印 双链表删除pos位置的结点 双向链表的尾插 关…...

离线安装Percona
前言 安装还是比较简单,这边简单进行记录一下。 版本差异 一、离线安装Percona 下载percona官网 去下载你需要对应的版本 jemalloc-3.6.0-1.el7.x86_64.rpm 需要单独下载 安装Percona 进入RPM安装文件目录,执行下面的脚本 yum localinstall *.rpm修改…...

界面控件Telerik UI for WinForms使用指南 - 数据绑定 填充(二)
Telerik UI for WinForms拥有适用Windows Forms的110多个令人惊叹的UI控件,所有的UI for WinForms控件都具有完整的主题支持,可以轻松地帮助开发人员在桌面和平板电脑应用程序提供一致美观的下一代用户体验。 Telerik UI for WinForms组件为可视化任何类…...

通过栈/队列/优先级队列/了解容器适配器,仿函数和反向迭代器
文章目录 一.stack二.queue三.deque(双端队列)四.优先级队列优先级队列中的仿函数手搓优先级队列 五.反向迭代器手搓反向迭代器 vector和list我们称为容器,而stack和queue却被称为容器适配器。 这和它们第二个模板参数有关系,可以…...

leetcode 704. 二分查找
题目描述解题思路执行结果 leetcode 704. 二分查找 题目描述 二分查找 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 示…...

蓝牙耳机什么牌子好?500内好用的蓝牙耳机推荐
随着蓝牙耳机的受欢迎程度越来越高,近几年来,无蓝牙耳机市场呈爆发式增长,蓝牙耳机品牌也越来越多。那么蓝牙耳机什么牌子好?接下来,我来给大家推荐几款500内好用的蓝牙耳机,一起来看看吧。 一、南卡小音舱…...

设计模式 -- 中介者模式
前言 月是一轮明镜,晶莹剔透,代表着一张白纸(啥也不懂) 央是一片海洋,海乃百川,代表着一块海绵(吸纳万物) 泽是一柄利剑,千锤百炼,代表着千百锤炼(输入输出) 月央泽,学习的一种过程,从白纸->吸收各种知识->不断输入输出变成自己的内容 希望大家一起坚持这个过程,也同…...

人工智能的未来之路:语音识别的应用与挑战
随着人工智能技术的不断发展,语音识别已成为人工智能领域的一个重要应用。语音识别是指通过计算机对语音信号进行处理,将其转换为可以被计算机识别的文本或指令的过程。语音识别技术的应用范围非常广泛,例如智能家居、语音助手、智能客服、智…...

c++ 友元介绍
友元的目的就是让一个函数或类访问另一个函数中的私有成员 友元函数 (1)普通函数作为友元函数 class 类名{friend 函数返回值类型 友元函数名(形参列表);//这个形参一般是此类的对象.... } 经过以上操作后,友元函数就可以访问此类中的私有…...

四维轻云地理空间数据在线管理软件能够在线管理哪些数据?
四维轻云是一款地理空间数据在线管理软件,支持各类地理空间数据的在线管理、浏览及分享,用户可不受时间地点限制,随时随地查看各类地理空间数据。软件还具有项目管理、场景搭建、素材库等功能模块,支持在线协作管理,便…...

学习 GitHub 对我们有什么好处?
学习 GitHub 对我们有什么好处? 为什么要学习 GitHub,或者说学习 GitHub 对我们有什么好处? 理由一:GitHub 上有很多大牛出没,国外的咱先不说,就国内的像百度、腾讯、阿里之类的大公司,里面的很…...

java记录-反射
什么是反射 反射是一种让Java拥有一定动态性的机制,它允许程序在执行期间取得任何类的内部信息,并且直接操作任意对象的内部属性及方法 类加载 类加载后通过堆内存方法区的Class类型对象就能了解该类的结构信息,这个对象就像该类的一面镜子…...

这次彻底不需要账号了,无需魔法永久白嫖GPT
免费GPT 自GPT风靡以来,大家用的是不亦乐乎,你用他去解决过实际问题,你用他去写过代码,你用他去修改过bug,你用他去写过sql,你用他去画过图,你问过他你能想到的任何“刁钻”问题。 你ÿ…...

远程桌面连接是什么?如何开启远程桌面连接详细教程
远程桌面连接是一种非常方便的技术,它允许用户通过互联网在不同的计算机之间共享资源和访问数据。目前这个技术已经广泛地应用于企业、教育、医疗和其他领域,使得人们能够更高效地工作和学习。 这篇文章,我将解释远程桌面连接是什么…...

lua实战(2)
目录 值和类型子类型类型字符串type (v) 值和类型 Lua是一种动态类型语言。这意味着变量没有类型;只有价值观才有意义。该语言中没有类型定义。所有值都有自己的类型。 Lua中的所有值都是一等值。这意味着所有的值都可以存储在变量中,作为参数传递给其他函数&…...

UI自动化测试案例——简单的Google搜索测试
以下是一个UI自动化测试的经典案例: import unittest from selenium import webdriverclass GoogleSearchTest(unittest.TestCase):def setUp(self):# 创建Chrome浏览器实例self.driver webdriver.Chrome()self.driver.maximize_window() # 最大化浏览器窗口def t…...