2024年了,苹果可以通话录音了
人不走空
🌈个人主页:人不走空
💖系列专栏:算法专题
⏰诗词歌赋:斯是陋室,惟吾德馨
6月11日凌晨,苹果在WWDC24大会上,密集输出了酝酿多时的AI应用更新。苹果对通话、对话、图片,乃至最令人一言难尽的Siri都做了“全家桶”式改造,可谓诚意满满。市场的反应是滞后的。或因出现了过多OpenAI的能力介入,大会后,“苹果市值一夜蒸发4213亿元”的话题也随之冲上热搜。但一夜过后,苹果股价又大涨7.26%,市值涨至31765亿美元,单日上涨超2150亿美元,合超15000亿人民币。
继OpenAI、微软、谷歌、Meta相继奔赴“AI高考”,掀起了一波波热浪后,苹果作为最后一个被万众期待的优等生,磨蹭许久,也终于交卷了。
6月11日凌晨,苹果2024年全球开发者大会(WWDC24)如约而至。不出所料,发布会上对AI功能的介绍吸引了最多目光,占据了多达一半的演讲时间。
此前,围绕着苹果与OpenAI的合作落地,苹果会不会借此改造一言难尽的Siri,苹果的AI命名(Apple Intelligence)问题,轮番上阵的预热和讨论,已经在互联网上持续了不短的时间。
最意味深长的部分则是,向来崇尚自有生态的苹果,虽然屡屡传出将允许OpenAI深度介入,但或出于“挣扎”,传言也数次被“辟谣”。发布会让猜测的靴子落地——苹果与OpenAI达成的,几乎是“颗粒度级”的合作。
很难说这样的升级,对于苹果究竟是喜是忧。最直观的是,市场反应惨淡:发布会进行同时,苹果股价便不断下跌,最终每股报收193.12美元,跌1.91%,市值缩水578亿美元至2.96万亿美元。
微博上有用户表示:比起AI能力,发布会最大亮点是——电话通话终于允许录音了。
▲ 图 / 科技博主@AshutoshShrivastava
AI全家桶,OpenAI来套壳
大会开始,OpenAI创始人山姆·奥特曼(Sam Altman)被安排到了前排就座。这是他自2008年后第二次于公众视野亮相WWDC,似乎也预示着,苹果这次与OpenAI的合作,绝不寻常。
虽然5月以来,OpenAI、微软、谷歌、Meta已密集地上演了一场场“AI春晚”,展示了不少精彩技术;但AI距离普通人的理解,以及真实的场景落地还有不小距离。而苹果看起来,才是最有希望将“AI”拉入凡间的公司:可以用更贴近用户的手机AI功能,通过OS和各种App与生活交融。
这也是苹果在这次发布会上希望传达的调性,库克将苹果的升级概括为个人智能(personal intellegence)。他表示:“我们希望产品强大、易用、符合直觉、能和现有的产品集成、个人化。”
作为预热过场,苹果先用了一个多小时介绍了MR头显VisionPro、iOS、Watch OS、iPad OS、Mac OS乃至于Apple TV的一系列更新。这些“点缀前菜”让观众们听得不胜其烦,直到进度条拉到1小时后,Apple Intelligence才姗姗来迟——把One more thing放在最后,也是苹果的传统艺能。
很难讲苹果的AI升级究竟有多少震撼惊喜。其展示的各类功能,比如人工助手回答问题、修改图片、自动翻译、邮件摘要、润色文章等,在近期AI厂商和国内的AI手机发布上都“似曾相识”。但苹果的整合能力,还是能让人看到AI可能带来的深刻改变。
能显现出苹果最大决心的,无疑是为Siri引用了GPT-4o,让它变得更聪明。
回头看去,诞生于2011年的Siri,着实是起了大早赶了晚集。在ChatGPT横空出世前,Siri十几年来从智能助手,沦为了只会讲笑话和被“调戏”的对象,难用程度已“槽多无口”。
发布会前,外媒曾剧透,苹果对于是否要帮Siri全面接入ChatGPT,有过两极分化的“撕裂”讨论。从结果看,不论是在AI大潮中感到了沉重危机,还是对OpenAI最终认栽,苹果都痛下了决心,让Siri活成它该有的样子。
▲ Siri将支持文字交互
Siri的升级不可谓不多:苹果为其在主屏上设计了一个大光圈;基于Apple Intelligence能力,Siri具备了丰富的语义和大模型上下文理解能力,能理解用户对“那次”“那时”“那里”等代词的具体描述。在原本的语音交互外,Siri还将增加文字交互功能、跨App执行操作等新玩法。
现在,用户可以用文字、语音与Siri交流,它可以读懂用户说话间的犹豫——当遇到困难问题时,比如用户询问某道复杂菜式的做法时,Siri会提示是否需要唤起ChatGPT,并由后者详细作答。
有了GPT-4o的能力垫底,用户可以用文档、图片、PDF多模态对Siri提问,它也可以基于iPhone内的应用和数据库,做出反应。
比如,一个朋友在短信中提到新地址,用户可以让Siri把地址添加到联系人卡片上。用户也可以直接对Siri说:找到某张图片,并进行修图。或者在填表时,提示“帮我找到驾驶证号码”,并填到表格内。
苹果还在发布会上展示了一个智能示例,对Siri说,“我要去机场接妈妈了”,苹果便会读取妈妈的航班信息、时刻延误、机场交通,接着智能生成好时间表,填入日程中。
▲ Siri可读取iMessage中的地址并添加到联系人卡
iPhone 15 Pro以上能用,国行暂无缘
为了表达对AI智能化的诚意,苹果着实一股脑拿出了“全家桶”的选择。从通话、语音转文字、智能对话助手、图片处理,到访问第三方应用,苹果几乎对每项核心功能都进行了智能优化。
例如,Apple Intelligence支持智能回复邮件。面对长篇的邮件线程,用户仅需轻触屏幕,就可获取关键信息。iPhone可以对邮件快速总结提要,进行简单回复,同步翻译。
基于苹果内置芯片的强大算力,Apple Intelligence也把生成式模型部署在了iPhone、iPad和Mac本地,让苹果的原生系统多了不少新功能。
例如iPhone始终被诟病的无法通话录音,也终于做出了改变,更新后不仅能够录音,在AI加持下还能够提供文字转录、要点提取等服务。不过,使用通话录音时,考虑到隐私保护,对方将会收到相应通知。
针对无边记等写作应用,Apple Intelligence会帮助用户提供写作优化建议、内容校对等,用户可以从多个版本中挑选,调整文风以适应不同的读者和场合。例如,用户撰写邮件时,写作工具菜单会弹出润色选项,并提供智能回复邮件等功能。
最能让用户发挥个人想象力的功能还包括“智能图像生成”。苹果推出了Genmoji(表情生成)功能,支持用户通过自然语言描述生成表情符号;并进一步推出了Image Playground(图像游乐场),能够让用户自选服装、地点、配饰等关键词,在几秒钟内创造出有趣的图像。
种种Apple Intelligence的功能更新,背后少不了和各家大模型,特别是OpenAI达成的颗粒级合作。如AI从业者“歸藏”所说:“连文字改写都用的ChatGPT,图像看起来用的是DALL-E(OpenAI于2021年发布的图像生成模型)。”
而对于以上的大模型调取,苹果宣布都将完全免费。用户不必创建账户,就可以免费使用ChatGPT,ChatGPT订阅用户也能关联自己的账户,并在苹果设备中接入付费功能。
包含上述功能的“英语试用版”系统将于今年夏天推出,并于今秋落地在iOS 18、iPadOS 18及macOS Sequoia中。但考虑到GPT-4o对大陆的访问限制,本次iPhone和Mac功能更新,可能基本与国行版本无缘。
按照官方说法,苹果还计划于明年推出更多AI功能。但由于以上功能需要A17 Pro芯片支持,用户必须要购买iPhone 15 Pro以上级别产品,才可以使用。
苹果努力捍卫AI铁王座
实际上,这是一场并无多少秘密的发布会。几乎提前一星期,WWDC24的核心信息就被路透殆尽。可以预见的是,苹果发布的诸多功能,将很快引来友商跟随。而在大模型和AIGC时代,作为智能手机市场的“旧王”,苹果将如何捍卫铁王座,也将成为重要命题。
但某种程度上,对自有生态护城河格外重视的苹果,选择对OpenAI敞开大门,已经站在了被动的身位。虽然在大模型横空出世后,苹果一度也躬身入局尝试自研,但结果并不尽如人意。
去年,市场一度传出苹果正在积极自研大模型“Ajax”。今年3月苹果曾公布自研的MM1多态大语言模型,但后来并未对该模型开启公测,也未发布上线时间规划。
同月,在发布新款Macbook Air时,苹果也在宣传文案中首次强调了“AI”。4月,曾有媒体爆料称苹果正在研发一种运行于设备端的大型语言模型,该模型将优先保证响应速度和隐私保护能力。
不过这些,显然都未帮助苹果放大出强劲势能,挽救AI颓势。而友商们,还在不断通过各种合作,跑步入场AI硬件。
早在2023年,华为、小米、vivo、OPPO、荣耀等国产手机厂商,就已开始大模型试水,自研亦或接入外部大模型的努力,频频见于报端。
2023年7月,华为在开发者大会HDC上发布了盘古大模型3.0,官宣新一代智能操作系统HarmonyOS 4已接入了盘古大模型。一个月后,在年度演讲上,雷军透露小米的13亿参数版本自研大模型已经成功在手机端侧跑通。11月,vivo、OPPO先后推出蓝心大模型矩阵(BlueLM)和安第斯大模型(AndesGPT),同期搭载于手机亮相。
兜兜转转,苹果在手机大模型赛道的进度条显然落后了。而这在本已红海厮杀的智能手机市场中,无疑是极大劣势。
有开发者指出,目前还未有一家智能手机企业如苹果这样,如此大范围、细颗粒度地引入了AI大模型的嵌入。随之而来地,频繁端侧推理带来的高耗电问题能否解决?还要等苹果全面开放使用后,才有论断。
值得一提的是,2008年,年仅23岁的山姆·奥特曼曾来WWDC演讲,推广自己的首个创业项目,并于Apple Store上架了好友定位应用Loopt。16年后,凭借苹果与OpenAI的深度合作,山姆不仅再次成为WWDC座上宾,更摇身变为最大的隐形Boss,堪称最大赢家。
在大会结束后,山姆通过个人社交媒体发帖称:“非常开心与苹果达成伙伴关系,并将在今年晚些时候将ChatGPT嵌入他们的设备中。”
▲ 图 / 网络
对于OpenAI而言,在微软之后又收获了苹果这个重大的合作伙伴,意味着在大模型的浪潮里,又多了一块最重磅级别的压舱石。
不过苹果的合作,也未必代表着甘愿长期与OpenAI绑定,或许也只是在为自研进程争取时间。近期,Siri联合创始人达格·基特劳斯 (Dag Kittlaus) 预测:OpenAI 的合作对苹果来说可能只是短期到中期的关系。
(文中插图如无特别说明,均来自于苹果)
作者其他作品:
【Java】Spring循环依赖:原因与解决方法
OpenAI Sora来了,视频生成领域的GPT-4时代来了
[Java·算法·简单] LeetCode 14. 最长公共前缀 详细解读
【Java】深入理解Java中的static关键字
[Java·算法·简单] LeetCode 28. 找出字a符串中第一个匹配项的下标 详细解读
了解 Java 中的 AtomicInteger 类
算法题 — 整数转二进制,查找其中1的数量
深入理解MySQL事务特性:保证数据完整性与一致性
Java企业应用软件系统架构演变史
相关文章:
2024年了,苹果可以通话录音了
人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 6月11日凌晨,苹果在WWDC24大会上,密集输出了酝酿多时的AI应用更新。苹果对通话、对话、图…...
书生·浦语大模型实战营第二期作业五
1、开发机创建conda环境: 2、安装第三方库: 3、新建pipeline_transformer.py文件,并运行: 4、运行结果: 5、执行模型: 6、与大模型进行对话: 7、默认占有的显存: 8、--cache-max-en…...
树莓派4B_OpenCv学习笔记9:图片的腐蚀与膨胀
今日继续学习树莓派4B 4G:(Raspberry Pi,简称RPi或RasPi) 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1: 图像的膨胀与腐蚀一般用于灰度图或者二值图,今日便来学习…...
Perplexity AI — 探索网络,发掘知识,沟通思想
体验地址:Perplexity AI (国外网站访问需要梯子) Perplexity AI是一款功能强大的人工智能搜索引擎,其特点和优势主要体现在以下几个方面: 功能: 自然语言搜索:Perplexity AI可以理解用户的自然…...
RPC知识
一、为什么要有RPC: HTTP协议的接口,在接口不多、系统与系统交互较少的情况下,解决信息孤岛初期常使用的一种通信手段;优点就是简单、直接、开发方便,利用现成的HTTP协议进行传输。 但是,如果是一个大型的网…...
【爬虫】requests 结合 BeautifulSoup抓取网页数据
一、BeautifulSoup使用步骤 BeautifulSoup 是一个用于从 HTML 或 XML 文件中提取数据的 Python 库。以下是如何使用 BeautifulSoup 来解析 HTML 并提取信息的基本步骤: 1、安装: 如果你还没有安装 BeautifulSoup,你可以使用 pip 来安装它。…...
安全测试框架 二
使用安全测试框架进行测试,可以遵循以下步骤进行,以确保测试的全面性和系统性: 一、明确测试目标和需求 确定测试的范围和重点,明确要测试的系统或应用的安全性方面的关键点和重要性。根据业务需求和安全标准,制定详…...
安徽京准-NTP网络授时服务器助力助力甘南州公共资源交易
安徽京准-NTP网络授时服务器助力助力甘南州公共资源交易 安徽京准-NTP网络授时服务器助力助力甘南州公共资源交易 2024年5月中旬,我安徽京准科技生产研发的NTP时钟服务器成功投运甘南州公共资源交易中心,为该中心的计算机网络系统及其他各业务子系统提供…...
大数据—什么是大数据?
大数据是指所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。想要更加全面地了解大数据的概念,可以从以下几个维度进行介绍: 大数据的定义: 基本…...
德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第十一周) - 自然语言处理扩展研究
自然语言处理扩展研究 1. 多语言研究2. 语言锚定3. 伦理问题 1. 多语言研究 多语言(Multilinguality)是NLP的一个重要研究方向,旨在开发能够处理多种语言的模型和算法。由于不同语言在语法、词汇和语义结构上存在差异,这成为一个复杂且具有挑战性的研究…...
支持向量机(SVM)中核函数的本质意义
本质上在做什么? 内积是距离度量,核函数相当于将低维空间的距离映射到高维空间的距离,并非对特征直接映射。 为什么要求核函数是对称且Gram矩阵是半正定? 核函数对应某一特征空间的内积,要求①核函数对称;②…...
SpringBoot使用jasypt实现数据库信息的脱敏,以此来保护数据库的用户名username和密码password(容易上手,详细)
1.为什么要有这个需求? 一般当我们自己练习的时候,username和password直接是爆露出来的 假如别人路过你旁边时看到了你的数据库账号密码,他跑到他的电脑打开navicat直接就是一顿连接,直接疯狂删除你的数据库,那可就废…...
Python日志配置策略
1 三种情况下都能实现日志打印: 被库 A 调用,使用库 A 的日志配置。被库 B 调用,使用库 B 的日志配置。独立运行,使用自己的日志配置。 需要实现一个灵活的日志配置策略,使得日志记录器可以根据调用者或运行环境自动…...
想学编程,什么语言最好上手?
Python是许多初学者的首选,因为它的语法简洁易懂,而且有丰富的资源和社区支持。我这里有一套编程入门教程,不仅包含了详细的视频 讲解,项目实战。如果你渴望学习编程,不妨点个关注,给个评论222,…...
binlog和redolog有什么区别
在数据库管理系统中,binlog(binary log)和 redolog(redo log)是两种重要的日志机制,它们在数据持久性和故障恢复方面扮演着关键角色。虽然它们都用于记录数据库的变化,但它们的目的和使用方式有…...
Linux笔记--ubuntu文件目录+命令行介绍
文件目录 命令行介绍 当我们在ubuntu中命令行处理位置输入ls后会显示出其所有目录,那么处理这些命令的程序就是shell,它负责接收用户的输入,并根据输入找到其他程序并运行 命令行格式 linux的命令一般由三部分组成:command命令、…...
71、最长上升子序列II
最长上升子序列II 题目描述 给定一个长度为N的数列,求数值严格单调递增的子序列的长度最长是多少。 输入格式 第一行包含整数N。 第二行包含N个整数,表示完整序列。 输出格式 输出一个整数,表示最大长度。 数据范围 1 ≤ N ≤ 100000…...
解决必剪电脑版导出视频缺斤少两的办法
背景 前几天将电脑重置了,今天想要剪辑一下视频,于是下载了必剪,将视频、音频都调整好,导出,结果15分钟的视频只能导出很短的时长,调整参数最多也只能导出10分钟,My God! 解决 首…...
新人学习笔记之(常量)
一、什么是常量 1.常量:在程序的执行过程中,其值不能发生改变的数据 二、常量的分类 常量类型说明举例整型常量整数、负数、0123 456实型常量所有带小数点的数字1.93 18.2字符常量单引号引起来的字母、数字、英文符号S B字符串常量双引号引起来的&…...
Lua解释器裁剪
本文目录 1、引言2、文件功能3、选择需要初始化的库4、结论 文章对应视频教程: 已更新。见下方 点击图片或链接访问我的B站主页~~~ Lua解释器裁剪,很简单~ 1、引言 在嵌入式中使用lua解释器,很多时候会面临资源紧张的情况。 同时,…...
web前端设计nav:深入探索导航栏设计的艺术与技术
web前端设计nav:深入探索导航栏设计的艺术与技术 在web前端设计中,导航栏(nav)扮演着至关重要的角色,它不仅是用户浏览网站的指引,更是网站整体设计的点睛之笔。本文将从四个方面、五个方面、六个方面和七…...
分析解读NCCL_SHM_Disable与NCCL_P2P_Disable
在NVIDIA的NCCL(NVIDIA Collective Communications Library)库中,NCCL_SHM_Disable 和 NCCL_P2P_Disable 是两个重要的环境变量,它们控制着NCCL在多GPU通信中的行为和使用的通信机制。下面是对这两个环境变量的详细解读࿱…...
使用 Python 进行测试(6)Fake it...
总结 如果我有: # my_life_work.py def transform(param):return param * 2def check(param):return "bad" not in paramdef calculate(param):return len(param)def main(param, option):if option:param transform(param)if not check(param):raise ValueError(…...
Flink Watermark详解
Flink Watermark详解 一、概述 Flink Watermark是Apache Flink框架中为了处理乱序和延迟事件时间数据而引入的一种机制。在流处理中,由于数据可能不是按照事件产生的时间顺序到达的,Watermark被用来告知系统在该时间戳之前的数据已经全部到达ÿ…...
LeetCode538.把二叉搜索树转换为累加树
class Solution { public:int sum 0; TreeNode* convertBST(TreeNode* root) { if (root){convertBST(root->right);sum root->val;root->val sum;convertBST(root->left);}return root;}};...
关于编程思想
面向过程思想 面向过程就是分析出解决问题所需要的步骤,然后用函数把这些步骤一步一步实现,使用的时候再一个一个的依次调用就可以了 JS就是典型的面向过程的编程语言 优点: 性能比面向对象编程高,适合跟硬件联系很紧密的东西…...
521. 最长特殊序列 Ⅰ(Rust单百解法-脑筋急转弯)
题目 给你两个字符串 a 和 b,请返回 这两个字符串中 最长的特殊序列 的长度。如果不存在,则返回 -1 。 「最长特殊序列」 定义如下:该序列为 某字符串独有的最长 子序列 (即不能是其他字符串的子序列) 。 字符串 s …...
【YashanDB知识库】PHP使用OCI接口使用数据库绑定参数功能异常
【问题分类】驱动使用 【关键字】OCI、驱动使用、PHP 【问题描述】 PHP使用OCI8连接yashan数据库,使用绑定参数获取数据时,出现报错 如果使用PDO_OCI接口连接数据库,未弹出异常,但是无法正确获取数据 【问题原因分析】 开启O…...
深入分析 Android BroadcastReceiver (三)
文章目录 深入分析 Android BroadcastReceiver (三)1. 广播消息的优缺点及使用场景1.1 优点1.2 缺点 2. 广播的使用场景及代码示例2.1. 系统广播示例:监听网络状态变化 2.2. 自定义广播示例:发送自定义广播 2.3. 有序广播示例:有序广播 2.4. …...
在java中使用Reactor 项目中的一个类Mono,用于表示异步单值操作
Mono 是 Reactor 项目中的一个类,用于表示异步单值操作。Reactor 是一个响应式编程库,广泛应用于 Java 中的异步编程和非阻塞 I/O 操作。Mono 可以类比为一个可能(或将来)包含零个或一个值的异步计算结果。与 Flux(另一…...
网站建设项目的预表/快速优化系统
导读: ActiveSync应用层程序协议分析-RAPI的握手过程 转载时请注明出处和作者联系方式作者联系方式:李先静 ActiveSync与Window Mobile之间的通信协议并不复杂,在RNDISUSBNET之上运行TCP/IP,而TCP/IP之上的应用层协议包括RAPI和RR…...
某个网站做拍卖预展的好处/站长之家音效
作为技术人员,已经有蛮长一段时间没有把自己的开发经验做一次总结了,可能是因为太忙和太懒吧,所以这次决定把自己这两三年来作为创业团队的成员在技术方面的心得和技巧做一个总结,也包括简单提及一下和之前在大网站工作的时候一些…...
泊头市做网站/如何推广自己产品
第1关:求图中边或弧的数目 任务描述 本关任务:求给定图中的边(或弧)的数目。 相关知识 实验目的 掌握图的基本概念; 掌握图的存储结构的设计与实现,基本运算的实现; 熟练掌握图的两种遍历算法、遍历生成树及遍历算法的应用。 实验任务 说明:为使实验程序简洁直观,下…...
安卓开发技术/seo站长工具综合查询
一、数据类型1、列表:# 列表中的每个元素都是可变的# 列表的元素是有序的,# 列表用中括号表示ab [ ]# ab.insert(‘位置’,‘元素‘) ## 在指定位置插入某个元素# ab.append() # 在末尾增加元素# ab.remove(1) # 删除‘1‘这个元素# ab.po…...
想开一个网站开发的公司/班级优化大师怎么用
免费开通大数据服务:https://www.aliyun.com/product/odps “用户每天产生的日志量大约在2TB。我们需要将这些海量的数据导入云端,然后分天、分小时的展开数据分析作业,分析结果再导入数据库和报表系统,最终展示在运营人员面前。”…...
免费看各大网站的软件/网络营销专业的就业方向
经过Python测试交流群的小伙伴群策群力,teprunner添加了一个重要功能,把PyCharm中的代码,通过Git同步到测试平台中,生成测试用例。这样,teprunner就成了一个名副其实的pytest脚本在线管理平台。 效果展示 项目添加Git仓…...