当前位置: 首页 > news >正文

绝区伍--2024年AI发展路线图

2024 年将是人工智能具有里程碑意义的一年。随着新模式、融资轮次和进步以惊人的速度出现,很难跟上人工智能世界发生的一切。让我们深入了解 2024 年可能定义人工智能的关键事件、产品发布、研究突破和趋势。

2024 年第一季度

2024 年第一季度将推出一些主要车型并进行改进,有望进一步推动 AI 能力的发展。

双子座超级发射

我们可以预期谷歌将在第一季度推出 Gemini Ultra。得益于宪法提示和自我监督等宪法人工智能技术,他们的新版对话式人工智能助手可能会击败 GPT-4。虽然它可能不会在每个领域都击败 GPT-4,但 Gemini Ultra 的安全性和推理能力应该远远超出 OpenAI 在 GPT-3 和 GPT-3.5 上所展示的水平。

Gemini Ultra 的推出将给 OpenAI 带来巨大压力,迫使其提前发布 GPT-4.5。然而,GPT-4.5 可能要到 2024 年第二季度才会真正推出。

开源微调技术取得进展

随着研究人员分享更多微调技术,我们还应该在 2024 年第一季度看到开源 AI 模型的显著改进。在推理任务和数学/逻辑问题上进行微调的模型可能会在常识和避免虚假声明等领域缩小与 GPT-3 等专有模型的差距。

到第一季度末,一些开源模型甚至可能在复杂的数学/逻辑推理基准测试中达到人类水平(超过 75%)。当然,作弊风险仍然是基准测试的一个隐患,但自然语言任务也应该会取得令人印象深刻的进步。

机器人技术融资增长

随着人工智能软件的快速发展,更多的资金将流入机器人等商业应用。我们应该看到至少两轮数百万美元的融资,这些融资面向专注于将人工智能进步带入现实世界的机器人初创公司。仓库机器人、自动驾驶汽车,甚至家庭/办公室的通用辅助机器人应该会在 2024 年取得重大进展。

小型开源模型的兴起

尽管 OpenAI 等组织宣布了超过 100 万亿参数的巨型模型,但较小的开源模型在许多现实世界的用例中仍将越来越受欢迎。公司发现,针对小众数据集进行微调的 100 到 200 亿个参数模型非常有用,而且训练和部署成本低廉。

即使 GPT-4 等超级模型成为头条新闻,也要寻找这些“微模型”来为更具互动性的演示和基本聊天机器人提供支持。与依赖 GPT-3 等单一模型相比,初创公司会发现使用一组微模型更容易满足用户需求。

2024 年第二季度

随着高调的模型发布、大量用于人工智能安全工作的资金以及这些复杂模型实际工作原理的突破性研究,人工智能炒作周期将在 2024 年第二季度再次达到高峰。

LLama 3 和 GPT 4.5 发布

Meta 预计将于 2024 年第二季度发布其大规模语言模型的第三版 LLama 3。LLama 3 应该能够在推理和为其输出提供证据等领域与 GPT-4 相媲美。一些专家预测它甚至可能在人工评估中超越 GPT-4。

OpenAI 不会甘于落后太久,很可能会在 LLama 3 发布后不久推出 GPT-4.5。与 GPT-4 发布后的不稳定稳定期相比,GPT-4.5 有望更强大、更安全、更可靠。

Mistral 完成一轮大规模融资

Mistral 是一家人工智能初创公司,致力于开放式构建下一代模型、数据集和训练基础设施,凭借爆炸式增长,该公司将在第二季度筹集大量资金。

Mistral 开放生态系统的流行将迫使传统科技巨头重新思考其闭源文化。预计 2024 年将有更多大型语言模型和数据集免费向研究人员发布。

人工智能安全的进步

随着 LLM 变得越来越先进(并且可能很危险),人工智能安全工作将在 2024 年第二季度加大力度。我们应该会看到一些基础论文发表,这些论文破解了大型语言模型的黑匣子,并提高了我们对它们行为的理解。这将使更安全的模型架构和训练实践成为可能。

全球还将齐心协力收集培训数据,以保持大语言模型课程的益处。诸如嵌入价值观一致和尊重规范的教学调整数据集等内容将限制不良行为。

在安全方面,大学和公司将合作系统地记录 LLM 遭受网络攻击的漏洞,并开发新的保护措施。随着模型在更多任务关键型场景中的部署,验证完整性和入侵预防将变得与准确性同样重要。

大语言模型推动科学发现

尽管人们担心大语言模型会取代白领工作,但人工智能模型将继续证明其对增强人类研究人员和工程师的作用。开放科学运动将进一步发展,越来越多的高中生将在人工智能的帮助下做出可验证的贡献。

大语言模型将加速数学领域的发现,解锁证明定理的新技术。神经网络增强的物理模拟将揭示传统研究中无法发现的现象。生物科学将受益于使用人工智能进行蛋白质折叠预测。

预计著名的研究型大学将大力投资专注于将大语言模型学位应用于其领域的中心,同时无缝记录证据和逻辑链以确保学术严谨性。

Grok 取得了显著的进步

Grok 是专注于科学推理能力的 xAI LLM,得益于宪法人工智能技术,它将得到显著提升。通过提供数学证明作为其新颖预测和结论的依据,与仅接受预测目标训练的不太严格的 LLM 相比,Grok 将独树一帜。

许多专家呼吁所有大语言模型的科学主张都应附上一些正式的逻辑论证或数学证明,而不仅仅是引用精选的文献。由于这一推动,致力于理性和推理基准的初创企业将蓬勃发展。

2024 年第三季度

在 2024 年上半年努力应对 LLM 之后,人工智能社区将在第三季度通过严格测试模型声明和量化现实世界的表现而稍微恢复立足点。

GPT 5.0 发布

OpenAI 将于 2024 年第三季度发布 GPT-5,以弥补 GPT-4 动荡推出所造成的声誉损害。与 GPT-3 和 GPT-4 相比,此模型更新最终将不负众望,连贯性、事实准确性和基本常识性均有显著提高。

当然,随着 Anthropic、谷歌和其他公司的竞争模型提高了人们的期望,对“改进”能力的门槛也在不断提高。不过,GPT-5 应该能巩固 OpenAI 目前作为行业领导者的地位。

LLM 绩效验证

2024 年上半年关于模型误导性声明的 LLM 大辩论将在第三季度开启性能验证时代。大学和公司的团队将发布用于量化语言模型输出的全面基准套件。

政策制定者也将参与其中,要求透明地报告在医疗保健、教育和金融等敏感领域部署的模型的连贯性、准确性和偏见等指标。

就像机器一样,LLM 的标准化安全表将列出已知的故障模式。测试机构将在生产环境中(而不仅仅是在受控条件下)审核和验证性能。

改进的开源模型

由于 Mistral 推动人工智能开发的开放性,到 2024 年第三季度,改进的开源模型将达到甚至超过 GPT-4 的原始能力。当然,领先的专有模型仍将在高级认知基准上占据主导地位。但对于许多现实世界的用例来说,开源就足够了。

通过高质量的开放模型生态系统将人工智能商品化将引发一波创新浪潮,因为初创企业和学生可以在这些模型的基础上进行构建,而不是从头开始重新创建基础。

视觉模型变得更加逼真

虽然大语言模型备受追捧,但视觉人工智能也将继续稳步发展。随着研究人员更多地关注元数据和视频一致性,2023 年令人震惊的人工智能生成图像将会消退。

到 2024 年第三季度,得益于模拟数据的进步和偏差测试机制的改进,视觉模型最终将可用于现实世界的产品,而不会出现令人尴尬的失误。在上下文和意图方面仍存在许多未解决的问题,但视觉和语言模型将开始从彼此的进步中受益匪浅。

代码生成大语言模型 (LLM) 课程受到追捧

像 GitHub 的 Copilot 这样的专门生成计算机代码的 LLM 将以代码行的形式为超过 50% 的真实软件项目做出贡献。在用自然语言编写规范和填写必要代码之间进行快速迭代将加速开发。

当然,验证自动生成代码的正确性、安全性和出处仍然存在巨大风险。但其生产力优势如此巨大,以至于几乎每个大型开源项目都会包含一些机器生成的逻辑。软件工程师的角色将永远转向验证和优化,而不是原始的改动。

2024 年第四季度

到 2024 年底,人工智能的炒作可能会开始让位于部署挑战的现实。虽然原始能力呈指数级增长,但融入社会却充满陷阱。引导这些改变世界的技术安全且合乎道德地应用需要社会科学家和政策专家与计算机科学家共同努力。

下一个 Gemini 版本发布

谷歌将于 2024 年第四季度在 Gemini 上发布其下一个版本。在 Sundar Pichai 的新领导议程下,谷歌投入了大量资源来开发宪法人工智能技术,例如自我监督和外部同行反馈。

升级后的 Gemini 在透明度、监督和可靠性方面大大缩小了与行业领导者的差距。谷歌希望这些严格的要求将有助于缓解北美和欧洲政策制定者的反垄断担忧。

当然,有些人认为,对于一家长期被指控窃取用户数据以牟利的公司来说,这为时已晚。但随着谷歌率先在无需大规模数据收集的情况下开发强大人工智能的方法,行业情绪开始转变。

开源模型获得合法性

到第四季度,开源 AI 模型将成为大型企业的可靠选择。Mistral 的持续进步加上模型验证标准的提高有助于大型银行、保险公司和其他受监管行业适应开放生态系统。

当然,国防和情报领域最敏感的应用仍将利用基于机密数据训练的闭源模型。但开放性已达到合法性的新高度,而不仅仅是学术界可以玩弄的东西。

标准小组围绕开放模型的测试、报告和合规性而成立。专注于部署工具的领先 MLOps 初创公司迅速更新其产品,以支持开放生态系统作为一流的集成目标,而不仅仅是专有模型。

ChatGPT 竞争对手不断增多

ChatGPT 在 2022 年底席卷全球。到 2024 年第四季度,随着争夺这一市场的竞争日趋垂直化,用户将被众多竞争对手所淹没。微软推出了一款与 Teams 和 Outlook 集成的下一代聊天机器人。谷歌推出了搜索中的 AI 助手门户 Bard。Meta 通过 Facebook、Instagram 和 WhatsApp 的对话助手加入竞争。

由于 ChatGPT 的火爆,对话式人工智能初创公司的风险投资也一路飙升。在心理健康、辅导伙伴和无障碍等垂直领域,专注的参与者承诺提供比一般领域聊天机器人更具定制化的体验。与这些华而不实的初创公司相比,Cohere、Hugging Face、Anthropic 等现有公司似乎非常简单。

监管机构承诺在创新与负责任的发展之间取得平衡,以避免另一个人工智能寒冬到来。但由于尚未有任何平台确立明确的主导地位,他们大多采取观望态度。

人工智能生成媒体的激增

从 2022/2023 年开始,文本、图像、视频和音频生成方面的进步将最终惠及专业内容创作者。媒体初创公司推出由 LLM 提供支持的服务,这些服务可创建模板、草稿、粗剪和模板,以加速构思和制作。文案、平面设计师和视频编辑乐于接受人工智能的帮助,以释放他们的创造力,而不是取代它。

当然,偏见、准确性和抄袭风险仍然是人们关注的焦点。但早该出现的工具可以归纳灵感来源并标记机器贡献,这使得安全地整合人工智能成为可能。可信的媒体机构在透明度方面形成了道德准则。但病毒式娱乐平台继续推出可疑的人工智能内容,进一步削弱了公众的信任。

令人吃惊的 AI 代理研究

出人意料的是,使用宪法人工智能等技术训练的人工智能系统中出现了代理机制。

通过强调监督和同行反馈渠道而不是纯粹的预测准确性,研究人员表现出去中心化身份和动机的早期迹象。这引发了整个人工智能社区对人机协作的长期愿景的反思。

与非营利机构和大型科技公司不同,小众研究团队推动了过去看似遥不可及的通用人工智能领域的进步。越来越多的人呼吁增加资助,并强调道德、哲学和治理,同时继续推动机器学习本身的发展。

宏观经济影响显现

2024 年,人工智能前所未有的发展速度开始暴露出宏观经济层面的漏洞,而这些漏洞从未被科技传播者考虑过。由于整个行业都因担心技术性失业而陷入混乱,各国政府纷纷采取数十年来未见的紧缩性货币政策,以稳定自由落体的劳动力市场。

结论

2024 年无疑标志着人工智能发展和部署的另一个转折点。但与以往繁荣与萧条周期的预测相反,即使公众舆论暂时冷却,这一趋势线仍保持其指数轨迹。随着人工智能的变革性质在未来十年继续在行业和学术界显现,任务绩效、安全和道德等支柱方面的持续进步将引领商业努力。

创作不易,觉得不错的话,点个赞吧!!!

 

相关文章:

绝区伍--2024年AI发展路线图

2024 年将是人工智能具有里程碑意义的一年。随着新模式、融资轮次和进步以惊人的速度出现,很难跟上人工智能世界发生的一切。让我们深入了解 2024 年可能定义人工智能的关键事件、产品发布、研究突破和趋势。 2024 年第一季度 2024 年第一季度将推出一些主要车型并…...

C++:.front()函数作用

在C中,.front() 函数是容器(如 std::vector、std::deque、std::list 的某些实现等)的成员函数,用于访问容器中的第一个元素。这个函数返回对容器中第一个元素的引用(对于非const容器)或const引用&#xff0…...

Linux系统备份工具TimeShift

Linux系统备份 Linux系统备份工具TimeShift Linux系统备份工具TimeShift 0. 前言1. 安装2. 启动3. 使用法一、图形界面操作(方便)法二、终端命令操作(高端) Linux系统备份工具TimeShift Linux系统备份工具TimeShift 0. 前言 Time…...

Google重大更新--解读Android Auto认证4.3

Google在今年五月更新了Android Auto 4.2.2版本,而在2024年7月他们推出了Android Auto 4.3版本,这是自2023年9月以来对Android Auto 4.2版本的一次重大更新。 为了确保合规性和顺利认证,OEM和Tire1必须确保PDK组件版本与正在认证的主机的Rece…...

scala基础

scala基础: hello world: 写scala可运行文件的注意事项1、如果一个scala文件要运行,class要改成object2、如果是class,就仅单纯代表一个类,如果是object代表的是单例对象3、scala语法中,一句话结束不需要加分号4、scal…...

小红书选品中心商家采集 小红书商家电话采集软件

可采集名称销量评分联系方式等 需要有1000粉丝以上已实名认证过的小红书达人才可以使用 以下是一个示例程序,可以用于批量获取小红书选品中心商家的信息: import requestsdef get_merchants(page_num):url f"https://www.xiaohongshu.com/selec…...

JavaScript基础: JavaScript 数字类型

JavaScript 中的数字类型是用来表示数值的数据类型。JavaScript 的数字类型是基于 IEEE 754 标准的双精度浮点数格式,这意味着它可以表示非常大和非常小的数值,以及小数。 数字字面量 在 JavaScript 中,数字可以直接以字面量的形式书写&…...

【网络安全】漏洞挖掘之Spring Cloud注入漏洞

漏洞描述 Spring框架为现代基于java的企业应用程序(在任何类型的部署平台上)提供了一个全面的编程和配置模型。 Spring Cloud 中的 serveless框架 Spring Cloud Function 中的 RoutingFunction 类的 apply 方法将请求头中的“spring.cloud.function.routing-expression”参数…...

面试官:MySQL死锁是什么,如何解决?

MySQL死锁概述 定义:多个操作相互等待对方释放资源,导致无法继续执行的情况。场景:通常发生在多个事务同时试图锁定对方已锁定的资源时。 MySQL锁的分类 粒度分类: 表级锁:锁定整个表,简单但并发能力低。…...

CSS原子化

目录 一、定义 二、原子化工具 2.1、tailwind 2.1.1、以PostCss插件形式安装 2.1.2、不依赖PostCss安装 2.1.3、修改原始配置 2.2、unocss 三、优缺点 3.1、优点 3.2、缺点 一、定义 定义:使用一系列的助记词,利用类名来代表样式。 二、原子化…...

【Python的pip配置、程序运行、生成exe文件】

Python的pip配置、程序运行、生成exe文件 一、安装Python 通过官网下载对应的版本,安装即可。 下载地址:https://www.python.org/downloads/ Python标准库查看(Python自带库) Python 标准库文档 安装Python的时候&#xff0c…...

神经网络习题

不具有权重共享的网络是: **多层感知机(Multilayer Perceptron,MLP): ** 特点:每一层的每一个神经元都与上一层的每一个神经元全连接,权重独立于每个连接,不存在权重共享。 权重共享…...

deepstream段错误

😐 错误: 探针中由于使用了pyds.get_nvds_buf_surface(hash(gst_buffer), frame_meta.batch_id)导致的段错误(segmentation fault)。 解决方式:...

《梦醒蝶飞:释放Excel函数与公式的力量》10.1.1函数简介

10.1.1函数简介 BIN2DEC函数是Excel中用于将二进制数转换为十进制数的函数。它在处理二进制数时非常有用,尤其是在电子工程、计算机科学等领域。 10.1.2函数语法: BIN2DEC(number) number:这是要转换的二进制数,必须是以字符串…...

Bert 变种, T5模型

NLP-预训练模型-2019-NLU:DistilBERT【 BERT模型压缩】【模型大小减小了40%(66M),推断速度提升了60%,但性能只降低了约3%】_distillbert-CSDN博客 https://zhuanlan.zhihu.com/p/673535548 大语言模型系列-T5_t5模型…...

技术赋能政务服务:VR导视与AI客服在政务大厅的创新应用

在数字化转型的浪潮中,政务大厅作为服务民众的前沿阵地,其服务效率和质量直接影响着政府形象和民众满意度。然而,许多政务大厅仍面临着缺乏智能化导航系统的挑战,这不仅增加了群众的办事难度,也降低了服务效率。维小帮…...

大模型备案全网最详细流程【附附件】

本文要点:大模型备案最详细说明,大模型备案条件有哪些,《算法安全自评估报告》模板,大模型算法备案,大模型上线备案,生成式人工智能(大语言模型)安全评估要点,网信办大模型备案。 大模型备案安…...

0090__【Git系列】merge和rebase的区别

【Git系列】merge和rebase的区别_rebase和merge的区别-CSDN博客 git中rebase和merge的区别是什么-git-PHP中文网 https://blog.51cto.com/qzcsbj/9444199...

谈面向任务的多轮对话系统(TOD)

面向任务对话系统(Task-Oriented Dialogue (TOD) Systems)主要是为解决特定任务的,比如订票任务(订机票,电影票等),预定饭店等。这种对话往往需要多轮对话才能够完成。 多轮对话的例子 客户预定一个餐厅的…...

汇凯金业:如何判断黄金的买入时机

黄金,作为全球公认的避险资产,其价格波动受到多种因素的影响,包括经济数据、货币政策、地缘政治风险等。对于投资者而言,把握黄金的最佳买入点是实现投资收益最大化的关键。本文将探讨影响黄金价格的主要因素,并提供一…...

tomcat 项目迁移,无法将项目作为服务service启动

背景 测试服务器需要迁移到正式服务器上,为了方便省事,将测试服务器上的一些文件直接复制到正式服务器 问题 使用startup启动项目之后,可以直接使用使用tomcat9w启动,或者作为服务service启动的时候,显示无法访问到资源…...

java中 使用数组实现需求小案例(二)

Date: 2024.07.09 16:43:47 author: lijianzhan 需求实现: 设计一个java类,java方法,使用Random函数,根据实现用户输入随机数生成一个打乱的数组。 package com.lin.java.test;import java.util.Arrays; import java.util.Rando…...

【删库跑路】一次删除pip下载的所有第三方库方法

进入命令行,先list看下库存 pip list导出所有的第三方库至一文件列表 pip freeze >requirements.txt按照列表卸载所有库 pip uninstall -r requirements.txt -y再list看下,可见库存已清空...

Java面试八股之MySQL索引B+树、全文索引、哈希索引

MySQL索引B树、全文索引、哈希索引 注意:B树中B不是代表二叉树(binary),而是代表平衡(balance),因为B树是从最早的平衡二叉树演化而来,但是B树不是一个二叉树。 B树的高度一般在2~…...

解决 Docker 容器镜像拉取难题:全面指南

一、引言 在使用 Docker 容器的过程中,经常会遇到镜像拉取慢甚至无法下载的问题,这给开发和部署工作带来了不小的困扰。本文将深入探讨这一问题的原因,并提供多种有效的解决方案。 二、问题原因分析 网络限制 本地网络带宽不足或存在网络拥…...

python基础语法笔记(有C语言基础之后)

input()用于输入,其有返回值(即用户输入的值),默认返回字符串。括号里可放提示语句 一行代码若想分为多行来写,需要在每一行的末尾加上“\” 单个“/”表示数学中的除法,不会取整。“//”才会向下取整。 …...

【面试八股总结】线程基本概念,线程、进程和协程区别,线程实现

一、什么是线程? 线程是“轻量级进程”,是进程中的⼀个实体,是程序执⾏的最小单元,也是被系统独立调度和分配的基本单位。 线程是进程当中的⼀条执行流程,同⼀个进程内多个线程之间可以共享代码段、数据段、打开的文件…...

Java核心技术【二十】Java泛型的基本概念和原理详解

Java泛型的基本概念和原理详解 一、泛型的基本概念 Java泛型(Generics)是Java SE 1.5(JDK 5)引入的一个新特性,它提供了一种在编译时期进行类型检查的方式,允许程序员在定义类、接口和方法时指定类型参数…...

Android Studio Download Gradle 时慢问题解决

1.腾讯gradle 下载:后面拼接版本(gradle-8.0-bin.zip) https://mirrors.cloud.tencent.com/gradle/gradle-8.0-bin.zip 2.Android Studio 配置:setting-->gradle-->Use Gradle from 选择本地文件夹(解压后的bi…...

【Qt5】入门Qt开发教程,一篇文章就够了(详解含qt源码)

目录 一、Qt概述 1.1 什么是Qt 1.2 Qt的发展史 1.3 Qt的优势 1.4 Qt版本 1.5 成功案例 二、创建Qt项目 2.1 使用向导创建 2.2 一个最简单的Qt应用程序 2.2.1 main函数中 2.2.2 类头文件 2.3 .pro文件 2.4 命名规范 2.5 QtCreator常用快捷键 三、Qt按钮小程序 …...