Cyber Weekly #18
赛博·新闻
1、Google 狂卷小模型,2B 参数 Gemma 2 赶超 GPT-3.5
Google本周发布了开源的轻量级、高性能模型 Gemma 2 2B。它拥有 20 亿参数,是从更大规模的模型中提炼而来的,在 LMSYS 大模型竞技场的得分超越了 GPT-3.5 和 Mixtral 8x7B。该模型适合在多种硬件环境下运行,包括边缘设备、笔记本电脑以及基于云的部署环境,适用于数据中心、本地工作站和边缘 AI 应用。除了性能优势,Gemma 2 2B 还配备了 ShieldGemma 安全分类器和 Gemma Scope 工具。

2、谷歌推出的Gemini 1.5 Pro Experimental 0801
本周Google也发布了Gemini 1.5 Pro Experimental 0801,Gemini 1.5 Pro 0801在LLM竞技场的综合排名超过了GPT-4o mini变成了第一位。谷歌说这是一个实验版本还不算正式版本,所以只在AI Studio中提供。但是从测试来看Gemini 1.5Pro 0801的多模态能力非常强大,基本超过了GPT-40和Claude 3.5,而且它支持音频以及视频。

3、OpenAI 推出 ChatGPT 高级语音模式
OpenAI 于2024年7月30日推出了面向ChatGPT Plus用户Alpha版本的高级语音模式,该模式允许用户体验GPT-4o的超逼真语音交互。GPT-4o是一个多模态模型,能独立完成语音到文本和文本到语音的转换,降低对话延迟。Alpha版本不包括春季更新的视频和屏幕共享功能,这些将在后续推出。此外,GPT-4o能感知情绪语调,但目前无法模仿特定声音,且有新的版权保护措施。

4、Character.AI创始团队被谷歌「收购」,只要人不要公司
8 月 3 日,Character.ai 内部表示,Google 将以 25 亿美元的估值收购其投资者股票(每股 88 美元),高于此前 10 亿美元的估值,但仍低于去年该公司与早期投资者谈判的 50 亿美元。Google 对 Character.ai “收购”方式,同微软& Inflection 以及亚马逊& Adept 的合作方式,Character.ai 联合创始人 Noam Shazeer 以及总裁 Daniel De Freitas 将重返 Google,加入 DeepMind 研究团队。

5、Kimi联合AIPPT推出PPT助手
Kimi上线PPT助手智能体,可以结合上传的文档和提示词快速生成PPT,体验了下还不错,可以满足一些简单的学习工作汇报。

6、Midjourney v6.1 正式上线,细节更丰富
本周,Midjourney 上线了新版本 v6.1,不少网友直呼和摄影已经几乎没有区别了。此次版本升级如下:
- 更强一致性(比如手臂、腿、身体、动植物等)
- 图像质量更好(减少伪影、增强纹理等)
- 更详细、更精确理解小图像特征(比如眼睛、小的脸等)
- 更好图像/纹理质量
- 更快生成速度,标准图像提升 25%
- 提高文本准确性
- 全新个性化模型
- 个性化代码版本控制:可以将之前版本的代码用在新版本中
- 一个新的-q2模式,可以增加更多纹理,但是需要更长时间(增加 25%),一致性也会下降

7、Meta 推出 AI Studio 工具,用户可创建定制 AI 角色
Meta 公司本周推出了 AI 工具 AI Studio,允许用户创建、定制和分享自己的 AI 角色,目前仅在美国地区提供。据悉,AI Studio 可以创建「创作者 AI(Creator AI)」和「AI 角色(AI character)」两种 AI 角色,前者为基于自己构建的 AI 延伸,可以代替自己和其他用户交流;后者则是用户自己自定义、虚构的 AI 角色。目前该功能已经集成在 Instagram、Messenger、WhatsApp 等 Meta 旗下社交平台之中。

赛博·洞见
1、马斯克最新6万字访谈!8.5小时详解脑机接口、机器人、外星人,以及AI与人类的未来(一)
Elon Musk在与Lex Fridman的8.5小时播客中,深入讨论了Neuralink脑机接口技术、人工智能、人形机器人Optimus、外星生命探索以及人类与AI的未来关系。Musk分享了Neuralink的进展、人类意志的本质、人工智能的安全性、火星殖民的重要性以及对人口问题的担忧。他强调了提高人脑与AI通信速度的重要性,以及通过技术实现人类增强和多星球生存的愿景。

2、万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(下)
Perplexity AI的CEO Aravind Srinivas在与Lex Fridman的深入对话中分享了他对人工智能未来的看法,特别是Perplexity作为知识发现引擎的创新之处。他强调了Perplexity与谷歌的不同之处,以及它如何通过提供更深入的答案来激发人们的好奇心和探索精神。Aravind还讨论了AI在提高用户界面和体验方面的作用,以及AI的伦理问题,包括确保信息的准确性和可靠性。他提出了一个以知识为中心的公司愿景,旨在引导用户发现新知识和深入理解复杂问题。上周分享了了上篇:万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(上)。

3、黄仁勋对谈扎克伯格:Llama 4或将摆脱聊天机器人形态|甲子光年
在第50届SIGGRAPH图形大会上,英伟达CEO黄仁勋与Meta CEO马克·扎克伯格讨论了人工智能的最新进展,包括Meta的开源模型Llama 3.1、AI Studio工具的发布,以及人工智能在虚拟世界中的应用。扎克伯格强调了生成式人工智能在内容推荐中的重要性,并展望了未来人工智能将如何从聊天机器人进化为更复杂的任务执行者。黄仁勋则对Meta的开源哲学表示赞赏,并讨论了人工智能在工业应用中的潜力。

4、AI 打开我们未曾想象的新世界
作者AI炼金术,本文探讨了人工智能在创作和内容生成中的应用,提出了将创造过程分为“提取”和“重新组合”两个步骤,以及利用AI的“多”而非“强”来创造优质内容。文章还讨论了AI在思维模型替代、识别隐藏连接、自我表达和创造需求、以及不同维度抽象和编码的重要性。

5、斯坦福大学赵轩:心理疗愈Agent
斯坦福大学心理学系研究科学家赵轩博士开发了人工智能心理疗愈Agent Sunnie,它基于大语言模型,具备多轮自然对话能力,推荐个性化活动,旨在提升心理健康和幸福感。Sunnie通过结构化交互和反馈循环,提供个性化幸福辅导和活动推荐,已在用户研究中显示出积极效果。赵博士强调了积极心理学在Sunnie设计中的重要性,并展望了其在心理健康领域的应用潜力。

6、LLM经典论文速读版,看完感觉自己通透了
作者皇子,本文为读者提供了31篇关于大型语言模型(LLM)的精选论文速读版,旨在帮助AI爱好者和研究者快速把握LLM领域的核心技术和最新进展。文章涵盖了模型架构、预训练、微调、提示词等多个方面,同时提供了高效阅读中文翻译版原文的方法和一些阅读技巧。

7、27岁,只做toB,估值55亿,不追AGI
加拿大AI大模型公司Cohere完成5亿美元D轮融资,估值达55亿美元,专注于ToB市场,提供定制化AI服务和产品。Cohere由《Attention Is All You Need》论文作者之一Aidan Gomez联合创立,其业务模式以解决企业实际问题为核心,不追求AGI,通过技术创新和资本效率,致力于提升企业运营效率,同时注重数据隐私和安全性。

8、两款头部产品流量下滑50%+,刚找到的AI流量密码失效了?
本文分析了当前AI插件产品流量下滑的现象,指出了Chrome Extensions产品如Liner和Eightify等在经历流量高峰后出现显著下降的问题。文章探讨了流量下滑的原因,包括SEO策略的反噬、产品功能同质化以及用户需求的精准度不足。同时,文章也讨论了Chrome插件开发的优势与限制,并预测了插件产品未来的发展方向。

9、入口之战:AI 时代的「二维码」,在哪里?
作者赛博禅心,本文探讨了AI时代可能的“二维码”——即新的信息交互入口,并分析了二维码在移动互联网时代的成功原因。文章指出,在AI时代,信息处理方式发生了变化,AI能够根据用户输入提供个性化结果。作者通过个人实践和对行业趋势的观察,提出AI应用应更自然地融入用户生活,以实现人与AI的共生。

10、OpenAI投资,前苹果设计师开发的AI应用,拥有超强记忆力成为最懂你的“人”!
本文介绍了由前苹果设计师Jason Yuan开发的AI聊天应用Dot,该应用凭借其超强记忆力和个性化服务获得了OpenAI的投资。文章通过作者的深度体验,展示了Dot在话题引导、记忆能力、情绪价值提供等方面的优势,同时也指出了其在隐私安全方面的争议。

11、十问网红多模态AI应用:胃之书
本文深入分析了一款名为“胃之书”的AI应用,它在过去两个月内迅速走红但面临增长和用户留存挑战。文章从产品设计、创新点、用户增长、数据表现、用户需求、媒体关注、个人体验、产品定位、新产品研发等方面进行了全面探讨,指出了胃之书在满足用户深层次需求和产品持续创新上的不足,并提出了对AI应用发展的思考。

12、3个月成为 AI 魔法师,还是永远当个麻瓜?关键在这里
作者MQ老师,本文探讨了如何成为AI时代的魔法师,即能够有效利用AI技术提升个人能力的人。文章指出,关键在于能够清晰表达隐性经验,并通过与AI的大量交互,将其转化为可操作的步骤或提示词,从而提高思维能力和专业技能。作者认为,终身学习者和大模型的创造者将是这场AI革命的最大受益者。

赛博·工具
1、Luvvoice: 文本转语音
免费的在线文本转语音服务,提供各种语言的超过200种语音。

2、Diffree:图像编辑工具
一个在线图像编辑工具,通过文字指令添加新元素到图片中,比如文字输入"为天空增加几片云"。

3、0v0.ai:图片背景移除工具
一款免费的图片背景移除工具。

4、Apparate:让图片变成说话视频
Proteus 0.1,实时视频生成为您的 AI 注入活力。Proteus 可以大笑、说唱、唱歌、眨眼、微笑、说话等等。只需一张图片。

赛博·资源
1、grammar-club:语法俱乐部书籍
旋元佑老师的语法俱乐部书籍电子版。

2、生成式AI商业落地白皮书(关注公众号【产品老A】回复【生成式AI商业落地白皮书】下载)
本白皮书是一份为企业决策者(CXO)准备的AI转型战术指南,由RollingAI联合InfoQ研究中心撰写。白皮书深入探讨了生成式人工智能(AI)技术在商业领域的应用现状、挑战、应对策略以及未来趋势,并提供了丰富的行业应用案例和实施建议。白皮书强调,生成式AI技术为企业提供了新的生产力和竞争力,企业需要拥抱变革,积极探索AI技术在业务中的应用,重塑组织能力和商业模式。通过构建知识库、优化工作流程和采用新技术,企业可以在AI时代中获得竞争优势。

3、AI视频生成研究报告(关注公众号【产品老A】回复【AI视频生成研究报告】下载)
本报告由量子位智库撰写,深入分析了AI视频生成技术的现状、发展趋势、市场潜力以及行业内主要企业的布局。该研究报告综合考察了AI视频生成技术的发展背景、关键技术、应用场景以及面临的挑战和机遇。报告首先介绍了AI视频生成技术的基本原理和发展历程,随后分析了技术在不同行业中的应用实例,如娱乐、教育、医疗等。此外,报告还探讨了技术发展的驱动因素,包括硬件进步、算法创新以及数据量的增加。最后,报告对AI视频生成技术的市场前景进行了预测,并提出了行业发展的建议。

【推广时间】
欢迎大家关注我的个人公众号【产品老A】。
公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。
老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。
相关文章:
Cyber Weekly #18
赛博新闻 1、Google 狂卷小模型,2B 参数 Gemma 2 赶超 GPT-3.5 Google本周发布了开源的轻量级、高性能模型 Gemma 2 2B。它拥有 20 亿参数,是从更大规模的模型中提炼而来的,在 LMSYS 大模型竞技场的得分超越了 GPT-3.5 和 Mixtral 8x7B。该…...
Open Interpreter - 开放解释器
文章目录 一、关于演示它是如何工作的?与 ChatGPT 的代码解释器比较 二、快速开始三、更多操作1、互动聊天2、程序化聊天3、开始新的聊天4、保存和恢复聊天5、自定义系统消息6、更改模型7、在本地运行 Open Interpreter终端Python上下文窗口,最大令牌 8、…...
“八股文”:程序员的福音还是梦魇?
——一场关于面试题的“代码战争” 在程序员的世界里,“八股文”这个词儿可谓是“如雷贯耳”。不,咱们可不是说古代科举考试中的那种八股文,而是指程序员面试中的那些固定套路的题目。如今,各大中小企业在招聘程序员时࿰…...
数据结构第2天作业 8月3日
单向链表 typedef int datatype; //由于有效数据不一定是正数,所以将数据重命名。typedef struct lklst{ //不能是无名结构体了,因为定义指针域的时候需要使用union{int len; //头结点时候使用;datatype data; …...
设计界的新宠:5款热门UI在线设计软件评测
随着用户界面设计行业的蓬勃发展,越来越多的设计师进入用户界面设计。选择一个方便的用户界面设计工具尤为重要!除了传统的用户界面设计工具,在线用户界面设计工具也受到越来越多设计师的青睐。这种不受时间、地点、计算机配置限制的工作方法…...
github添加ssh密钥,通过ssh方式推送代码
左手编程,右手年华。大家好,我是一点,关注我,带你走入编程的世界。 公众号:一点sir,关注领取python编程资料 很多人在使用github的时候,如果还是使用https的方式推送代码的话,可能会…...
Python设计模式 - 抽象工厂模式
定义 抽象工厂模式是一种创建型设计模式,它提供了一种创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类。 产品等级结构与产品族 为了更好地理解抽象工厂模式,先引入两个概念: 产品等级结构:就是产品的…...
【JavaEE初阶】懒汉模式与饿汉模式及指令重排序问题
目录 📕 单例模式 🌳 饿汉模式 🚩 线程安全 🎍 懒汉模式 🚩 懒汉模式-单线程版 🚩 懒汉模式-多线程版 🎄 指令重排序 📕 单例模式 单例模式是一种经典的设计模式,…...
Vue3使用Cascader 级联选择器如何获取值并提交信息
我写了一个用户对象,有address地址字段,我怎么将用户选择的级联数据selectedValue值传给address,并将对象返回给后端,核心代码实现了该问题。 <script> 核心代码: //获取住址并更新给addresslet selectedValue…...
Python面试整理-第三方库
Python社区提供了大量的第三方库,这些库扩展了Python的功能,覆盖了从数据科学到网络应用开发等多个领域。以下是一些非常流行和广泛使用的第三方库: 1. NumPy ● 用途:数值计算。 ● 特点:提供了一个强大的N维数组对象和大量用于数学运算的函数。 ● 应用场景:科学计算、…...
电脑添加虚拟网卡与ensp互联,互访
一、按照过程 1、打开设备管理器 2、点击网络适配器,点击左上角操作,点击“添加过时硬件” 3、下一页 4、选择“安装我手动从列表选择的硬件”,下一页 5、下拉,选择“网络适配器”,下一页 6、厂商选择“Microsoft”&…...
悬而未决:奇怪的不允许跨域CORS policy的问题
我在本地HBuilderX中进行预览写好的前端网页,它里面用了ajax访问了远程服务器的后端API网址,不出意外地报不允许跨域访问的错了:Access to XMLHttpRequest at ‘http://xxx.com/MemberUser/login’ from origin ‘http://mh.com’ has been b…...
索引优化秘籍:SQL Server数据库填充因子的调优艺术
索引优化秘籍:SQL Server数据库填充因子的调优艺术 在SQL Server的性能优化中,索引起着至关重要的作用。而索引填充因子(Fill Factor)则是控制索引页填充程度的重要参数,它直接影响索引的存储效率和查询性能。本文将深…...
ffmpeg 的内存分配架构
------------------------------------------------------------ author: hjjdebug date: 2024年 08月 01日 星期四 18:00:47 CST descripton: ffmpeg 的内存分配架构1 ------------------------------------------------------------ ffmpeg 的内配分配搞的人晕菜&#…...
Vue+live2d实现虚拟人物互动(一次体验叙述)
目录 故事的开头: 最终的实现效果: 实现步骤: 第一步:下载重要文件 第二步:创建vue项目文件,将刚下载文件拷贝到public目录下 第三步:在index.html文件中引入js 第四步:使用&…...
内联函数的概念和用途以及区别
内联函数(Inline Function)是C(以及C99之后的C语言)中的一个特性,旨在通过减少函数调用的开销来提高程序的执行效率。在正常情况下,当程序调用一个函数时,会发生一系列的操作,包括保…...
rust 桌面 sip 软电话(基于tauri 、pjsip库)
本文尝试下rust 的tauri 桌面运用 原因在于体积小 1、pjsip 提供了rust 接口官方的 rust demo 没编译出来 在git找了个sip-phone-rs-master https://github.com/Charles-Schleich/sip-phone-rs 可以自己编译下pjsip lib库替换该项目的lib 2、创建一个tauri demo 引用 [depe…...
Linux 进程优先级、程序地址空间、进程控制
个人主页:仍有未知等待探索-CSDN博客 专题分栏: Linux 目录 一、进程优先级 1、什么是进程优先级? 2、为什么要有优先级? 3、Linux的优先级特点、查看方式 4、命令行参数和环境变量 1.命令行参数 2.环境变量 获取环境变量的…...
学习笔记一
vector 在创建时指定初始大小和初始值: vector<int> a(5, 1) // 包含 5 个整数的 vector,每个值都为 1 可以使用 push_back 方法向 vector 中添加元素: a.push_back(7) // 将整数 7 添加到 vector 的末尾 可以使用 size(…...
Linux中信号的发送及信号的自定义捕捉方法
预备知识: 信号产生时进程早已知道该信号如何处理。 信号产生时进程可能并不能立即处理信号而是等到合适的时候处理。 信号其他相关常见概念 实际执行信号的处理动作称为信号递达(Delivery) 信号从产生到递达之间的状态,称为信号未决(Pending)。 进程可以选择阻…...
Psychopy音频的使用
Psychopy音频的使用 本文主要解决以下问题: 指定音频引擎与设备;播放音频文件 本文所使用的环境: Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...
多模态大语言模型arxiv论文略读(108)
CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题:CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者:Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...
VM虚拟机网络配置(ubuntu24桥接模式):配置静态IP
编辑-虚拟网络编辑器-更改设置 选择桥接模式,然后找到相应的网卡(可以查看自己本机的网络连接) windows连接的网络点击查看属性 编辑虚拟机设置更改网络配置,选择刚才配置的桥接模式 静态ip设置: 我用的ubuntu24桌…...
【C++特殊工具与技术】优化内存分配(一):C++中的内存分配
目录 一、C 内存的基本概念 1.1 内存的物理与逻辑结构 1.2 C 程序的内存区域划分 二、栈内存分配 2.1 栈内存的特点 2.2 栈内存分配示例 三、堆内存分配 3.1 new和delete操作符 4.2 内存泄漏与悬空指针问题 4.3 new和delete的重载 四、智能指针…...
push [特殊字符] present
push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示 前言 在 iOS 开发中,push 和 present 是两种不同的视图控制器切换方式,它们有着显著的区别。 present和dismiss 特点 在当前控制器上方新建视图层级需要手动调用…...
Android写一个捕获全局异常的工具类
项目开发和实际运行过程中难免会遇到异常发生,系统提供了一个可以捕获全局异常的工具Uncaughtexceptionhandler,它是Thread的子类(就是package java.lang;里线程的Thread)。本文将利用它将设备信息、报错信息以及错误的发生时间都…...
轻量级Docker管理工具Docker Switchboard
简介 什么是 Docker Switchboard ? Docker Switchboard 是一个轻量级的 Web 应用程序,用于管理 Docker 容器。它提供了一个干净、用户友好的界面来启动、停止和监控主机上运行的容器,使其成为本地开发、家庭实验室或小型服务器设置的理想选择…...
手动给中文分词和 直接用神经网络RNN做有什么区别
手动分词和基于神经网络(如 RNN)的自动分词在原理、实现方式和效果上有显著差异,以下是核心对比: 1. 实现原理对比 对比维度手动分词(规则 / 词典驱动)神经网络 RNN 分词(数据驱动)…...
第22节 Node.js JXcore 打包
Node.js是一个开放源代码、跨平台的、用于服务器端和网络应用的运行环境。 JXcore是一个支持多线程的 Node.js 发行版本,基本不需要对你现有的代码做任何改动就可以直接线程安全地以多线程运行。 本文主要介绍JXcore的打包功能。 JXcore 安装 下载JXcore安装包&a…...
智警杯备赛--excel模块
数据透视与图表制作 创建步骤 创建 1.在Excel的插入或者数据标签页下找到数据透视表的按钮 2.将数据放进“请选择单元格区域“中,点击确定 这是最终结果,但是由于环境启不了,这里用的是自己的excel,真实的环境中的excel根据实训…...
