当前位置: 首页 > news >正文

2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!

文章目录

    • 1 前言
    • 2 Google I/O 发布者大会
    • 3 PaLM 2模型
    • 3 Bard项目
    • 4 其他AI工具
      • 4.1 AI 图片编辑 Magic Editor
      • 4.2 Duet AI 办公
      • 4.3 Universal Translator 翻译工具
      • 4.4 Google 沉浸式导航
      • 4.5 Google 搜索引擎
    • 5 讨论

1 前言

每年必看两大会,苹果发布会谷歌发布会,除了英语听力磨耳朵,看看库克飞檐走壁,吃瓜掉链子外,关注前沿技术,更是为了感受科技改变生活,本篇文章仅围绕人工智能AI方面进行描述:

谷歌其实一直都是AI的老牌公司,眼看这一年被ChatGPT力压火的一塌糊涂,抢尽风头。去年OpenAI的ChatGPT突然发布确实是波**“偷袭”,措不及防。谷歌在2月才匆匆发布第一代Bard“应付”**一下,但是首次亮相就自信的出错。当时示例是“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?”查询读取。机器很快吐出三个想法,包括最后一个想法,“JWST 拍摄了我们太阳系外行星的第一张照片。但并非JWST拍摄的。2004 年,这一荣誉属于欧洲南方天文台的甚大望远镜 (VLT),美国宇航局证实了这一点。

有小伙伴就会问,**怎么这么扣细节?ChatGPT不也经常语无伦次吗?**非也,关于ChatGPT可以回看这篇文章,排除个别网友故意训练错误信息(即保证数据库纯净)外,需要正确的提问(引导)才能得到正确的回答:https://mp.weixin.qq.com/s/o4MeE_x0YwPVzSrybyoEVg

还有的小伙伴可能觉得AI这个话题年年谈,年年有,是不是要近饱和了?也不是,打个比喻,人们在冰海上远远的发现一块“浮冰”,有破冰船了接近一看发现是个冰山,等有条件下潜了才渐渐发现“真理面纱”。确实是越探索,知道的越多越觉得无知

AI从未接近饱和,甚至可以说是刚开始,才刚摸到门槛。

2 Google I/O 发布者大会

北京时间5月11日凌晨,**「Google I/O 发布者大会」**亮相,全会围绕“Making AI more helpful for everyone”让人工智能对各个领域各尽所长。

目前还未恰到饭,侧重点在于PaLM 2模型、Bard和其他相关的AI工具。

3 PaLM 2模型

OpenAI的GPT-4模型现在公认一家独大,现谷歌宣布PaLM 2可以一战,下述内容基于谷歌发表的技术报告

其中提到三大亮点:

  • 多语言性: PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言。这显着提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。
  • 推理: PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。
  • 编码: PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言,但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。

这里是对比于PaLM1代,也是在文件中提到放在第一位的就是语言能力。按照CEFR定义,每场写作考试都由三位专业的母语人士进行评分,PaLM 2的日语达到了A/特别A级,在法语方面达到了C1级。这个是很有用的,做科研的都知道,一定条件下机翻是永远替代不了原生语言,不然润色服务也不会这么盆满钵满了。

解释翻译的波斯谚语的含义,挺有意思的,能理解深意,还是着重在**“会思考”**,这是区别人工智能和人工机器的一大关键点。

这是各语言下1代和2代的一个ROC评分,可以理解为是准确性,越高越好


横向对比12种编程语言评估,可以理解为与人工作的一个编码的准确性,也是越高越好

3 Bard项目

Bard是和ChatGPT一样是个语言模型,中文名字叫巴德,就是在今天凌晨,谷歌已经取消wait list名单了,直接开放于180个国家和地区,和微软一样重磅,微软是在五一期间开放了New Bing,但是每天只能问20个问题,笔者还在测试中,埋个伏笔。

Bard是搭载了PaLM2模型的,按技术报告来看应该是挺牛的,据说编程能力更胜一筹,大家可以体验一下,不过暂不支持中文,Bard网址:https://bard.google.com/

有意思:

4 其他AI工具

4.1 AI 图片编辑 Magic Editor

这一张是调色,然后把长椅移到画面中间以保持空间填充,精神抖擞。不过还是小有瑕疵,观察一下长椅的阴影,但是笔者认为比起iPhone14Pro的高度锐化和三星的“创造月球照片”好多了:

Google 分享了几个 Magic Editor 的实际应用示例,它们都非常酷。在一张人在瀑布前的照片中,谷歌将人完全移到照片的一侧,抹去背景中的人,并使天空更蓝。

无法上传GIF,可移步到下方公众号查看原文

听说该工具会优先登陆于谷歌的Pixel手机。

4.2 Duet AI 办公


涵盖了一系列适用于 Google 生产力应用程序的生成式 AI 工具。正如我们今年早些时候详述的那样,这包括 Docs 和 Gmail 中的写作帮助、幻灯片的图像生成、Meet 的自动会议摘要等等。但在谷歌 I/O 上,唯一真正的新闻是写作辅助也将出现在移动版 Gmail 中,它将被标记为“帮我写”——Smart Compose 的升级版。

  • 轻松生成专业化的岗位描述
  • 在Gmail将会议记录转换成电子邮件
  • 还有很多~~~~

但是使用仍需加入workspace的waitlist,只能等了
网址:https://workspace.google.com/labs-sign-up/

4.3 Universal Translator 翻译工具

该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该实用程序不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情。输出的人说话视频会根据目标语言的发音同步嘴唇的动作。

如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的嘴唇。

但是一向注重版权的歪果仁肯定会考虑到安全这点,所以会限制一般用户,需要授权通过才能使用。

4.4 Google 沉浸式导航

谷歌地图一直都很牛,不少人用过Google Earth,好评连连吧。这一次升级体现在**“沉浸式”,新视图将填充 3D 建筑、植被,为用户提供更好的视角,在展示街道及其周围环境的同时提供更多细节。用户不仅可以实时查看所有这些信息,还可以调整时间以查看天气和交通在过去几个小时内可能发生的变化,实现真正的云游**。

这个功能在夏季推出,到 2023 年底将在 15 个城市推出。

4.5 Google 搜索引擎

这个功能放在最后,与 Microsoft 的Bing体验类似,这个新面板中有一些东西,所有这些都是为了让你在输入更自然的搜索提示时一目了然的信息。

该体验即将登陆谷歌实验室,并将在未来几周内推出,还是要申请waitlist

5 讨论

人工智能的发展其实在第一波ChatGPT惊雷后是没有太大感觉差异的,因为后续的更新换代和接二连三的同台竞技产品(文心一言、阿里的AI、和鲸的AI等),即便是很多镜像的,“国产ChatGPT”,都是大语言模型,一代又一代只是算法上的优化和扩大模型,在我们的基础使用体验上并没有太大差别。

笔者觉得人工智能现在掀起的波浪其实遍布各个方向,只不过我们大多数人都只关注于文本聊天模型,所以还没接触到真正的“AI改变生活”,不过这个交给专业团队,交给工业界了,外行看热闹,内行看门道,作为不涉及研发,不涉及开发的我们,看着门道的热闹也是可以的

相关文章:

2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!

文章目录 1 前言2 Google I/O 发布者大会3 PaLM 2模型3 Bard项目4 其他AI工具4.1 AI 图片编辑 Magic Editor4.2 Duet AI 办公4.3 Universal Translator 翻译工具4.4 Google 沉浸式导航4.5 Google 搜索引擎 5 讨论 1 前言 每年必看两大会,苹果发布会和谷歌发布会&am…...

MySQL和Redis如何保证数据一致性?

前言 由于缓存的高并发和高性能已经在各种项目中被广泛使用,在读取缓存这方面基本都是一致的,大概都是按照下图的流程进行操作: 但是在更新缓存方面,是更新完数据库再更新缓存还是直接删除缓存呢?又或者是先删除缓存再…...

Markdown使用(超详细)

(HBuilderX) 掌握md及HBuilderX对md的强大支持。如果没有点右键设置自动换行,可按Alt滚轮横向滚动查看。 很多人只把markdown用于网络文章发表,这糟蹋了markdown。 markdown不止是HTML的简化版,更重要的是txt的升级版…...

yolov5实现扑克牌识别的产品化过程

文章目录 介绍项目下载硬件准备软件环境素材获取自行获取素材网盘获取图片标注模型训练窗口截图窗口截图(HWND)桌面截图wgc方法最终采用的方式WGC使用方法如何保存灰度图片python 如何加载dll库图片推理扑克牌逻辑ui编写模型加密软件授权软件加密软件打包安装包制作...

第07讲:Java High Level Client,读写 ES 利器

SkyWalking OAP 后端可以使用多种存储对数据进行持久化,例如 MySQL、TiDB 等,默认使用 ElasticSearch 作为持久化存储,在后面的源码分析过程中也将以 ElasticSearch 作为主要存储进行分析。 ElasticSearch 基本概念 本课时将快速介绍一下 E…...

dockerfile暴力处理配置文件外提

前言: 一般来说,springboot打成的jar运行时,同目录/config目录下放application.yml文件会被进行加载,然后通过设置docker映射出宿主机即可做到配置文件外配的效果,但很多时候别的配置文件做不到这种效果,说…...

如何快速给出解释——正交矩阵子矩阵的特征值的模必然不大于1

Memory 首先快速回忆一下正交矩阵的定义: A为n阶实矩阵,且满足A‘AE或是说AA’E,那么A为正交矩阵。 (啊,多么简洁的定义) 其次快速想到它的性质: ① 实特征值必然 或 其他复数…...

c语言-位运算

位运算小结 ​ 位运算不管是在C语言中&#xff0c;或者其他语言&#xff0c;都是经常会用到的&#xff0c;所以本文也就不固定以某种语言来举例子了&#xff0c;原始点就从0、1开始。位运算主要包括按位与(&)、按位或(|)、按位异或(^)、取反(~)、左移(<<)、右移(>…...

【Android学习专题】安卓样式学习(学习内容记录)

学习记录内容来自《Android编程权威指南&#xff08;第三版&#xff09;》 样式调整和添加 调整颜色资源&#xff08;res/values/colors.xml&#xff09; 格式&#xff1a; 添加样式&#xff08;res/values/styles.xml&#xff09;&#xff0c;&#xff08;创建BeatBox项目时…...

普罗米修斯统计信息上报结构设计

为了实现高效的监控和警报&#xff0c;普罗米修斯提供了一个强大的统计信息上报机制。通过这个机制&#xff0c;可以将应用程序的各种统计信息发送到普罗米修斯&#xff0c;普罗米修斯会对这些信息进行处理&#xff0c;然后提供丰富的监控和警报功能。下面是基本的统计信息上报…...

两个系统之间的传值

在两个系统之间传值可以采用以下几种方式&#xff1a; 使用 URL 参数&#xff1a;可以将数据作为 URL 参数传递给另一个系统&#xff0c;另一个系统可以解析 URL 参数并获取数据。例如&#xff1a;Example Domain 使用 Cookie&#xff1a;可以在一个系统中设置 Cookie&#xf…...

PostgreSQL(五)JDBC连接串常用参数

目录 1.单机 PostgreSQL 连接串2.集群PostgreSQL 连接串 PostgreSQL JDBC 官方驱动下载地址&#xff1a; https://jdbc.postgresql.org/download/ PostgreSQL JDBC 官方参数说明文档&#xff1a; https://jdbc.postgresql.org/documentation/use/ 驱动类&#xff1a; driver-…...

如何修改浏览器中导航栏的背景色和字体

在日常使用电脑时&#xff0c;我们总会使用浏览器来浏览网页。而浏览器中的导航栏是用户进行网页浏览的主要界面之一&#xff0c;其背景色和字体的选择对用户的体验有着重要的影响。因此&#xff0c;为了让导航栏更加美观和易于使用&#xff0c;我们需要对其背景色和字体进行修…...

如何选择合适的智能氮气柜?

随着电子产品的普及&#xff0c;IC、半导体、精密元件、检测仪器之类的物品对湿度要求越来越高&#xff0c;潮湿、霉菌和金属氧化所造成的损害&#xff0c;随时在发生。人们对于物品的存放环境要求逐渐提高&#xff0c;利用防潮设备如智能氮气柜、电子防潮柜来存储产品也越来越…...

双向链表(数据结构)(C语言)

目录 概念 带头双向循环链表的实现 前情提示 双向链表的结构体定义 双向链表的初始化 关于无头单向非循环链表无需初始化函数&#xff0c;顺序表、带头双向循环链表需要的思考 双向链表在pos位置之前插入x 双向链表的打印 双链表删除pos位置的结点 双向链表的尾插 关…...

离线安装Percona

前言 安装还是比较简单&#xff0c;这边简单进行记录一下。 版本差异 一、离线安装Percona 下载percona官网 去下载你需要对应的版本 jemalloc-3.6.0-1.el7.x86_64.rpm 需要单独下载 安装Percona 进入RPM安装文件目录&#xff0c;执行下面的脚本 yum localinstall *.rpm修改…...

界面控件Telerik UI for WinForms使用指南 - 数据绑定 填充(二)

Telerik UI for WinForms拥有适用Windows Forms的110多个令人惊叹的UI控件&#xff0c;所有的UI for WinForms控件都具有完整的主题支持&#xff0c;可以轻松地帮助开发人员在桌面和平板电脑应用程序提供一致美观的下一代用户体验。 Telerik UI for WinForms组件为可视化任何类…...

通过栈/队列/优先级队列/了解容器适配器,仿函数和反向迭代器

文章目录 一.stack二.queue三.deque&#xff08;双端队列&#xff09;四.优先级队列优先级队列中的仿函数手搓优先级队列 五.反向迭代器手搓反向迭代器 vector和list我们称为容器&#xff0c;而stack和queue却被称为容器适配器。 这和它们第二个模板参数有关系&#xff0c;可以…...

leetcode 704. 二分查找

题目描述解题思路执行结果 leetcode 704. 二分查找 题目描述 二分查找 给定一个 n 个元素有序的&#xff08;升序&#xff09;整型数组 nums 和一个目标值 target &#xff0c;写一个函数搜索 nums 中的 target&#xff0c;如果目标值存在返回下标&#xff0c;否则返回 -1。 示…...

蓝牙耳机什么牌子好?500内好用的蓝牙耳机推荐

随着蓝牙耳机的受欢迎程度越来越高&#xff0c;近几年来&#xff0c;无蓝牙耳机市场呈爆发式增长&#xff0c;蓝牙耳机品牌也越来越多。那么蓝牙耳机什么牌子好&#xff1f;接下来&#xff0c;我来给大家推荐几款500内好用的蓝牙耳机&#xff0c;一起来看看吧。 一、南卡小音舱…...

使用分级同态加密防御梯度泄漏

抽象 联邦学习 &#xff08;FL&#xff09; 支持跨分布式客户端进行协作模型训练&#xff0c;而无需共享原始数据&#xff0c;这使其成为在互联和自动驾驶汽车 &#xff08;CAV&#xff09; 等领域保护隐私的机器学习的一种很有前途的方法。然而&#xff0c;最近的研究表明&…...

将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?

Otsu 是一种自动阈值化方法&#xff0c;用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理&#xff0c;能够自动确定一个阈值&#xff0c;将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

ios苹果系统,js 滑动屏幕、锚定无效

现象&#xff1a;window.addEventListener监听touch无效&#xff0c;划不动屏幕&#xff0c;但是代码逻辑都有执行到。 scrollIntoView也无效。 原因&#xff1a;这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作&#xff0c;从而会影响…...

【碎碎念】宝可梦 Mesh GO : 基于MESH网络的口袋妖怪 宝可梦GO游戏自组网系统

目录 游戏说明《宝可梦 Mesh GO》 —— 局域宝可梦探索Pokmon GO 类游戏核心理念应用场景Mesh 特性 宝可梦玩法融合设计游戏构想要素1. 地图探索&#xff08;基于物理空间 广播范围&#xff09;2. 野生宝可梦生成与广播3. 对战系统4. 道具与通信5. 延伸玩法 安全性设计 技术选…...

深度学习习题2

1.如果增加神经网络的宽度&#xff0c;精确度会增加到一个特定阈值后&#xff0c;便开始降低。造成这一现象的可能原因是什么&#xff1f; A、即使增加卷积核的数量&#xff0c;只有少部分的核会被用作预测 B、当卷积核数量增加时&#xff0c;神经网络的预测能力会降低 C、当卷…...

论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture Fuzzing

Muffin 论文 现有方法 CRADLE 和 LEMON&#xff0c;依赖模型推理阶段输出进行差分测试&#xff0c;但在训练阶段是不可行的&#xff0c;因为训练阶段直到最后才有固定输出&#xff0c;中间过程是不断变化的。API 库覆盖低&#xff0c;因为各个 API 都是在各种具体场景下使用。…...

Tauri2学习笔记

教程地址&#xff1a;https://www.bilibili.com/video/BV1Ca411N7mF?spm_id_from333.788.player.switch&vd_source707ec8983cc32e6e065d5496a7f79ee6 官方指引&#xff1a;https://tauri.app/zh-cn/start/ 目前Tauri2的教程视频不多&#xff0c;我按照Tauri1的教程来学习&…...

SQL注入篇-sqlmap的配置和使用

在之前的皮卡丘靶场第五期SQL注入的内容中我们谈到了sqlmap&#xff0c;但是由于很多朋友看不了解命令行格式&#xff0c;所以是纯手动获取数据库信息的 接下来我们就用sqlmap来进行皮卡丘靶场的sql注入学习&#xff0c;链接&#xff1a;https://wwhc.lanzoue.com/ifJY32ybh6vc…...

EasyRTC音视频实时通话功能在WebRTC与智能硬件整合中的应用与优势

一、WebRTC与智能硬件整合趋势​ 随着物联网和实时通信需求的爆发式增长&#xff0c;WebRTC作为开源实时通信技术&#xff0c;为浏览器与移动应用提供免插件的音视频通信能力&#xff0c;在智能硬件领域的融合应用已成必然趋势。智能硬件不再局限于单一功能&#xff0c;对实时…...

十二、【ESP32全栈开发指南: IDF开发环境下cJSON使用】

一、JSON简介 JSON&#xff08;JavaScript Object Notation&#xff09;是一种轻量级的数据交换格式&#xff0c;具有以下核心特性&#xff1a; 完全独立于编程语言的文本格式易于人阅读和编写易于机器解析和生成基于ECMAScript标准子集 1.1 JSON语法规则 {"name"…...