当前位置: 首页 > news >正文

大模型“诸神之战”,落地才是赛点

ChatGPT 诞生已经快一年,你还在与它对话吗?

有的人用来写报告、改代码,让它成为得力帮手;有的人却只是“调戏”个两三回,让它创作诗歌或故事,便不再“宠幸”。

根据网站分析工具 SimilarWeb 的数据,后者情况似乎更多。目前 ChatGPT 的月活数据已经连续三个月下滑,浏览量从四月的 17.6 亿下滑至八月的 14.3 亿,似乎开始有些过气。

一边是 ChatGPT 这样的通用大模型在退烧,一边是行业大模型研发热度只增不减。

国产大模型正在掀起一场“诸神之战”,然而不少企业都被卡在关键一步,那就是落地。

技术仅是门槛,落地才是赛点

和当年互联网“百团大战”比起来,这一回正在上演的“百模大战”要更内卷,也更烧钱。赛迪顾问数据显示,截至 2023 年 7 月,中国已累计有 130 个大模型问世 [1]。

《中国人工智能模型大地图研究报告》也指出,全国正有 14 个省(市)开展大模型研发。研发主体里,既有国内大学、科研机构,也有包括互联网巨头在内的企业,大佬们纷纷披甲上阵,准备迎接狂热的未来 [2]。

比起专业性弱的通用大模型,国内偏爱的行业大模型,基于各行业数据训练,结合专有知识和经验,更适用于具体场景的工作,能真正服务好千行万业。

但如果将大模型的问世比喻成研发的阶段性毕业,如今的现实情况是,没几个行业大模型能成功“上岗”。大模型能重塑行业,听起来似乎还是“空中楼阁”。

这其中最大的拦路石便是“落地难”。因为像“吞金兽”一样的 AI 大模型,训练成本真不是一般的高。没有雄厚的资金做支撑,很难商业落地。

由斯坦福大学发布的 2023 AI Index 年度报告,基于已有大模型披露的硬件和训练时间,对其训练成本进行了估算。

图片

2019 年发布的 GPT-2,被认为是第一个大型语言模型,拥有 15 亿个参数,估计需要五万美元的训练费用 [3]。

仅仅三年时间,2022 年推出的旗舰大型语言模型之一的 PaLM 拥有 5400 亿个参数,估计成本在 800 万美元。它比 GPT-2 大了约 360 倍,成本也高出了 160 倍 [3]。大模型规模变得越来越庞大,但也愈发昂贵。

落地难的原因除了成本高昂,还有 AI 发展的基础“燃料”算力比较有限。

如果把大模型比较一辆车,那它能走多远,正是取决于算力这个引擎。训练大模型,需要将数据集进行重复多轮计算处理,算力大小就代表着数据处理能力的强弱。

面对大模型数量成倍的增长,这几年中国智能算力规模也正在经历井喷式高速增长。

根据 IDC 发布的《2022-2023 中国人工智能计算力发展评估报告》,2023 年中国智能算力规模已达到 427 每秒百亿亿次浮点运算。预计到 2026 年,智能算力规模将进入每秒十万亿亿次浮点运算级别 [4]。

图片

早在今年 4 月 5 日,OpenAI 就以需求量过大为由,暂时关闭了 ChatGPT Plus 的付费渠道,这意味着仅发布几个月,OpenAI 就开始面临算力缺口 [5]。

大模型这场豪华游戏,能留在牌桌的玩家,注定只是少数。

所以别看大模型喧嚣盛极一时,但当面对成本、算力等现实问题时,国内外市场也正在出现更多理智思考——无法落地商用的通用大模型只能是玩具,成为企业应用的行业大模型才有产业价值 [6]。

AI 深入行业,

知识计算是关键

在国内,从华为云盘古大模型、阿里通义千问,再到 360 智慧大脑、智谱 AI ChatGLM 等,AI 大模型层出不穷。

不少人开始好奇《流浪地球》里不断学习,变得无所不能的最高人工智能莫斯是不是要走进现实了?

也有人担心有朝一日自己的饭碗会不会被 AI 抢走?但从麦肯锡全球研究院调研数据看,下此定论为时尚早。在 2020 年的人工智能全球调研中,AI 在不同行业的平均渗透率为 12.8%,处于较低水平 [7]。

更关键的是,AI 大模型和打工人并非互相取代的关系。而是大模型带来的新机会,能够提升工作效率、释放员工做更多高价值的事情。

图片

为何现阶段的 AI 深入行业程度还不够?

原因是不同行业都有自己数十上百年的专业积累,却缺乏高效利用的方法。解决这个难题的关键,在知识计算。

所谓知识计算,华为云认为就是把各种形态的知识,通过 AI 技术进行抽取、表达后,协同大量数据进行计算,进而产生更为精准的 AI 模型,从而提高行业效率。

为了能提供满足行业场景的多项技能,华为云团队使用 40TB 的文本数据,包含大量通用知识与行业经验,训练盘古自然语言大模型,为行业大模型打下坚实基础。

下一个问题接踵而至——行业专家与 AI 专家合作时,双方如何互相听得懂?华为云的做法是派 200 个博士深入客户现场,“走田头、跑工地、下矿井、进车间”,抓住 AI 技术创新与业务需求的结合点,解决行业难题。

图片

图片

200 多个博士深入行业现场,抓住 Al 技术创新与业务需求的结合点

像汽车领域,为了找到盘古大模型和自动驾驶行业的切入点,华为云深入一线交流请教,梳理行业业务和技术痛点。

现有自动驾驶技术能应对 95% 的常见驾驶场景,剩余 5% 是各类不常见却不断出现的“长尾问题”,阻碍更高智能化的自动驾驶落地。

盘古汽车大模型基于超车线路构建不同的光照、天气、建筑,快速生成近百个样本,生成灵活编辑的虚拟空间,重塑自动驾驶的训练,让模型更好学习应对“长尾问题”。现在学习一个新的复杂场景,时间能从两周以上缩短到两天内。

图片

除了汽车行业,华为云已陆续推出矿山、药物分子、电力、气象、海浪、铁路、政务、金融、制造等大模型,贡献先进的算法和解决方案,在行业内大展身手。

今年夏天,台风“泰利”“杜苏芮”“苏拉”“海葵”先后接棒登陆沿海地区,路径复杂,影响范围广,致灾程度高。如果能精准预测台风路径、级别和经过的地方,就能提早做准备。

但气象预测一直是科研领域的重难点。而盘古气象大模型,不仅将预测时间从 4-5 小时缩短到十秒内,而且在精度上超过传统数值预报方法。

可以说,AI 预报的出现,给天气预报带来了全新可能。

大模型落地,

盘古还使哪些力

前面提到,训练大模型一天也离不开海量的算力。有人形容算力就像我们日常用的水和电一样,要“一点接入、即取即用”。

大模型热潮下,面对企业算力需求的爆发式增长,“算力饥渴”成为了亟待解决的问题。

华为云基于系统性的创新,升级现有数据中心架构,突破单台服务器部件的限制,拆解和重新组合原来以 CPU 为中心的主从架构,升级为各种资源对等的全互联架构——分布式 QingTian 架构。

分布式 QingTian 架构打破了算力、存储和网络的边界,不仅实现高性能 AI 算力,轻松应对万亿级大模型训练,还将助力各行各业直接上云,一步到位搭建业务,更快更稳更高效。

图片

图片

QingTian 架构是基于高速网络协议的分布式对等全互联架构

得益于这一 AI 算力基础设施 ,企业使用华为云昇腾 AI 云服务时,只需要通过一根光纤,便能直接在云上获取算力,随取随用,让大模型算力触手可及。

今年七月,华为云海宣布在乌兰察布和贵安上线昇腾 AI 云服务,提供更长稳的 AI 算力服务;还发布了乌兰察布汽车专区,为自动驾驶开发提供澎湃算力。

开放性是昇腾 AI 云服务的重要优势之一,除了支持盘古大模型,更适配业界主流的近一百个开源大模型。

例如,美图仅用一个月就将 70 个模型迁移到了华为云昇腾 AI 云服务,同时华为云和美图团队一起进行了算子的优化,AI 性能提升了 30%。

图片

如何将大模型应用到行业具体业务和场景中?除了自己做落地,华为还希望构建起一个繁荣的生态。

大模型的创新,从来都不仅仅是模型自身的创新以及各项 AI 根技术的创新,在算力、算法、平台、应用、服务等方面都需要全链条生态伙伴和客户的参与。

打个比方,盘古大模型就像是各个行业通用的“轮子”,加入生态的伙伴都可以在车上找到自己的位置,共同助力,让这辆车跑得更快,行得更远。

为此,华为云开放了全方位的生态合作路径,希望团结伙伴加入盘古大模型全域协同生态体系,真正让 AI 重塑千行万业。

图片

一直以来,华为云践行的就是做实事、做最难的事。

一方面深耕算力,打造强有力的算力底座,支撑人工智能事业发展;另一方面结合大模型,从通用大模型到行业大模型的研究创新,来让人工智能真正服务好千行万业。

9 月 20-22 日,华为全联接大会在上海举办,大会以“加速行业智能化”为主题,汇聚业界思想领袖、商业精英、技术大咖、先锋企业、运营商、生态伙伴以及开发者等产业伙伴,共同探讨智能化技术的发展方向和未来机遇,加速行业智能化。

华为云认为,人工智能的发展,关键要“走深向实”,赋能产业升级,服务好千行万业、服务好科学研究,唯有这样,才能共赢人工智能新时代。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

相关文章:

大模型“诸神之战”,落地才是赛点

ChatGPT 诞生已经快一年,你还在与它对话吗? 有的人用来写报告、改代码,让它成为得力帮手;有的人却只是“调戏”个两三回,让它创作诗歌或故事,便不再“宠幸”。 根据网站分析工具 SimilarWeb 的数据&#…...

接口重放攻击

如何保证接口安全,做到防篡改防重放?_接口防止串改-CSDN博客 接口安全设计之防篡改和防重放_接口防篡改机制-CSDN博客 基于nonce timestamp 的方案 nonce的意思是仅一次有效的随机字符串,要求每次请求时该参数要保证不同。实际使用用户信息…...

MySQL学习笔记-进阶篇-SQL优化

SQL优化 插入数据 insert优化 1)批量插入 insert into tb_user values(1,Tom),(2,Cat),(3,Jerry); 2)手动提交事务 mysql 默认是自动提交事务,这样会导致频繁的开启和提交事务,影响性能 start transaction insert into tb_us…...

【机器学习】第2章 线性回归及最大熵模型

一、概念 1.回归就是用一条曲线对数据点进行拟合,该曲线称为最佳拟合曲线,这个拟合过程称为回归。 2.一个自变量 叫 一元线性回归,大于一个自变量 叫 多元线性回归。 (1)多元回归:两个x,一个…...

科技创新对农业发展的影响

科技创新对农业发展的影响深远且广泛,主要体现在以下几个方面: 一、提高农业生产效率 引入先进的农业机械设备:新型农业机械设备如无人机、机器人等的应用,显著减轻了农民的劳动强度,提高了农作物的种植效率。利用精…...

Linux 常用命令 - rm 【删除文件或目录】

简介 rm 命令源于英文单词 “remove”,它用于删除文件或目录。rm 是 Linux 系统中最基本的命令之一,用于删除指定的文件或目录。默认情况下,rm 不会删除目录,但可以通过递归删除选项来实现。 使用方式 rm [选项]... [文件]...常…...

一血c++

题目描述 每一个竞赛选手都无法拒绝拿一血 "一血"其实就是同学们在榜单上看到的深绿色的标记,代表着某道题目,他是第一个通过的。 叶苡朋老师是一名资深信奥选手,在大学多次获奖,也是一个资深抢一血爱好者&#xff0…...

无问芯穹Qllm-Eval:制作多模型、多参数、多维度的量化方案

前言 近年来,大语言模型(Large Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种语言生成任务上的出色表现,大语言模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。然而…...

2024-05-31T08:36:09.000+00:00 转换 YYYY-MM-DD HH-MM-SS

function formatDate(date) {// 处理ISO 8601字符串if (typeof date string) {date new Date(date);}// 处理时间戳else if (typeof date number) {date new Date(date * 1000); // 假设后端时间戳为秒,需要乘以1000转换为毫秒}// 自定义格式化,例如…...

reason: the Java file contained parse errors

今天用Maven打包项目时发生一个错误: file: D:\workspace\echoo2.0-xxx-xxx-portal\src\main\java\com\echoo\service\impl\DecDataServiceImpl.java; reason: the Java file contained parse errors 打包报错显示这个类解析错误 在IDEA中没有任何错误提示 问题所…...

使用密钥对登录服务器

目录 1、使用密钥文件登录服务器 2、登录成功画面: 3、如若出现以下状况,则说明密钥文件登录失败 1、使用密钥文件登录服务器 首先需要上传pem文件 2、登录成功画面: 3、如若出现以下状况,则说明密钥文件登录失败 解决方法&…...

面试_多线程

线程池 线程池的参数有哪些 线程池七大参数分别是corePoolSize、maximumPoolSize、keepAliveTime、unit、workQueue、threadFactory、handler corePoolSize:线程池中常驻核心线程数maximumPoolSize:线程池能够容纳同时执行的最大线程数keepAliveTime&…...

跨境电商必备?揭秘原生IP的作用

一、什么是原生IP? 原生IP(Native IP)是指由互联网服务提供商(ISP)或服务器提供商直接分配给用户的IP地址,这种IP地址直接与用户设备或网络相连,也就是指这个IP的注册地址和服务器机房所在的国…...

mysql竖表变横表不含聚合

文章目录 前言一、vertical_table二、转换1.要将其转换为横表形式,例如:2.sql 总结 前言 在MySQL中将竖表转换为横表(也称为行转列操作),不涉及聚合函数,通常可以通过使用条件判断和自连接来实现。假设有一…...

application/x-www-form-urlencoded和json的区别

application/x-www-form-urlencoded 和 application/json 是两种不同的数据格式,常用于HTTP请求中传递数据。 它们各自的特点和使用场景如下: 1. application/x-www-form-urlencoded •特点:这是一种传统的表单提交时采用的编码类型&#x…...

oracle数据库日常保养或巡检语句实践整理汇总

目录 1.目的 2.操作工具 3.实践说明 1.检查Oracle实例状态 2.检查Oracle在线日志状态 3.检查Oracle表空间状态 4.检查Oracle所有数据文件状态 5.检查Oracle数据库连接情况 6.检查Oracle表容量占用大小 7.检查Oracle备份 8.检查数据库表空间的使用情况 4.总结 1.目的 …...

Elasticsearch 第一期:基础的基础概念

前言 Elasticsearch(弹性搜索) ,简称为ES, 它是一个开源的高扩展的分布式全文检索引擎,它提供的功能主要分为:实时存储,实时分析搜索;本身扩展性很好,可以扩展到上百台服…...

MySQL数据库笔记(二)

第一章 单行函数 1.1 什么是函数 函数的作用是把我们经常使用的代码封装起来,需要的时候直接调用即可。这样既提高了代码效率,又提高了可维护性。在SQL中使用函数,极大地提高了用户对数据库的管理效率。 1.2 定义 操作数据对象。 接受参数返回一个结果。 只对一行进行…...

谷歌邮箱:2024年最全使用指南及技巧

注册谷歌邮箱时遇到麻烦了吗?收件箱乱得让人头疼,找不到提升效率的方法?或者是在处理多个谷歌邮箱账户时感到手忙脚乱? 掌握Gmail邮箱的使用技巧是每个外贸人员都必须学会的,本文将提供一个实用的谷歌邮箱注册和使用指…...

工业设计初学者手册——第四部分:制造工艺

工业设计初学者手册 文章目录 工业设计初学者手册第四部分:制造工艺7. 常见制造工艺介绍7.1 传统制造工艺7.2 现代制造工艺 8. 材料选择与应用8.1 材料的基本分类与特性8.2 材料选择的原则8.3 环保材料的应用 总结 第四部分:制造工艺 7. 常见制造工艺介…...

Scala语言:大数据开发的未来之星 - 零基础到精通入门指南

前言 随着大数据时代的到来,数据量的急剧增长为软件开发带来了新的挑战和机遇。Scala语言因其函数式编程和面向对象的特性,以及与Apache Spark的完美协作,在大数据开发领域迅速崛起,成为该领域的新兴宠儿。本篇将从零基础开始&…...

Springboot整合Zookeeper分布式组件实例

一、Zookeeper概述 1.1 Zookeeper的定义 Zookeeper是一个开源的分布式协调服务,主要用于分布式应用程序中的协调管理。它由Apache软件基金会维护,是Hadoop生态系统中的重要成员。Zookeeper提供了一个高效且可靠的分布式锁服务,以及群集管理…...

Python | 使用Matplotlib生成子图的示例

数据可视化在分析和解释数据的过程中起着举足轻重的作用。Python中的Matplotlib库提供了一个强大的工具包,用于制作各种图表和图表。一个突出的功能是它能够在单个图中生成子图,为以组织良好和结构化的方式呈现数据提供了有价值的工具。使用子图可以同时…...

云原生巡检监控报告

一、巡检概述 本次云原生巡检工作主要围绕云原生平台的稳定性、安全性以及性能进行,通过对平台资源的监控、日志分析以及安全扫描,发现了一些潜在的问题和隐患。巡检工作采用了自动化工具和人工分析相结合的方式,确保了巡检结果的准确性和全…...

Linux系统编程——部分内容补充

回顾 进程 内核相关数据结构 代码和数据,一个可执行程序加载到内存变成进程,不仅仅是把代码和数据加载进去就完事了,得“先描述,再组织”,每个进程都有内核数据结构,地址空间,进程相关页表&a…...

数学建模基础:非线性模型

目录 前言 一、非线性方程组 二、非线性规划 三、微分方程模型 四、非线性模型的应用 五、实例示范:传染病传播模型 实例总结 五、总结 前言 非线性模型用于描述变量之间的非线性关系,相比线性模型,其数学形式更为复杂,但…...

Kotlin 语言基础学习

什么是Kotlin ? Kotiln翻译为中文是:靠他灵。它是由JetBrains 这家公司开发的,JetBrains 是一家编译器软件起家的,例如常用的WebStorm、IntelliJ IDEA等软件。 Kotlin官网 JetBrains 官网 Kotlin 语言目前的现状: 目前Android 已将Kotlin 作为官方开发语言。 Spring 框…...

Kafka 之 KRaft —— 配置、存储工具、部署注意事项、缺失的特性

目录 一. 前言 二. 配置(Configuration) 2.1. 处理者角色(Process Roles) 2.2. 控制器(controller) 2.3. 存储工具(Storage Tool) 2.4. 调试(Debugging&#xff09…...

专业和学校到底怎么选,兴趣和知名度到底哪个重要?

前言 2024高考已经落下帷幕,再过不久就到了激动人心的查分和填报志愿的时刻,在那天到来,小伙伴们就要根据自己的分数选取院校和专业,接下来我就以参加22年(破防年)河南高考的大二生来讲述一下我自己对于如何选取院校和专业的看法以…...

【MySQL】数据库

数据库概述 【MySQL】数据库概述-CSDN博客 数据库基本操作 【MySQL】数据库基本操作-CSDN博客 数据表基本操作 【MySQL】数据表基本操作-CSDN博客 约束 【MySQL】约束-CSDN博客 基本增删改查 【MySQL】基本增删改查-CSDN博客 多表操作 【MySQL】多表操作-CSDN博客 视图 …...

中国苹果手机官方网站序列号查询/推广网站推广

近期移动端项目用到了很多时间轴。纵向的。开始可以实现,但是不利于维护。整理下, 以作为备份留存学习参考。子元素的 标签的 :before实现圆点,:after实现边线border纵向时间轴,单一右边内容:padding-left即可实现;如果时间轴边线…...

深圳教育科技网站建设/香港旺道旺国际集团

电子科大ACM团队,在学校教务处、学工部和团委等部门的大力支持下,在去年第34届ACM-ICPC国际大学生程序设计竞赛亚洲区域赛中,数学科学学院负责并组织六支队伍出战了六个赛区的比赛,最终获得四金、四银、四铜的辉煌战绩&#xff0c…...

最早做网站的那批人/百度推广计划

Description N个政党要组成一个联合内阁,每个党都有自己的席位数. 现在希望你找出一种方案,你选中的党的席位数要大于总数的一半,并且联合内阁的席位数越多越好. 对于一个联合内阁,如果某个政党退出后,其它党的席位仍大…...

揭阳网站开发/baidu百度首页

1、在源监视器中查看剪辑要在源监视器中查看剪辑,可以将其从“项目”面板拖到“源监视器”中,或双击要查看的剪辑。音频片段将显示为波形,如下所示。如果要在“源监视器”中包含多个剪辑,只需将它们从“项目”面板中拖动即可。在源…...

北京十大网站建设公司/百度新闻app

第一, 你那么run 是肯定不行的好歹 加个 -cp 把对应的配置文件 jar都加进去列如java -cp /test.jar test ...第二,一般Linux 默认的一些路径 希望对你有样linux 系统下有etc目录是放置配置文件的dev是设备文件home是家目录/ 根目录│├boot/ 启动文件。所…...

南头专业企业网站建设公司/cpa推广联盟平台

在本地使用git与服务器进行pull、push操作时,每次都要输入密码,比较麻烦,我们可以用ssh密钥来进行验证。这样git使用过程中ssh就会自动登录而无需输入密码。方法如下: 首先用自己账号登录到server上,输入ssh-keygen -t…...