科技云报道:AI大模型背后,竟是惊人的碳排放
科技云报道原创。
自从ChatGPT这样的大型语言模型在全球引起轰动以来,很少有人注意到,训练和运行大型语言模型正在产生惊人的碳排放量。
虽然OpenAI和谷歌都没有说过他们各自产品的计算成本是多少,但据第三方研究人员分析,ChatGPT部分训练消耗了1287兆瓦时,并导致了超过550吨的二氧化碳排放量,这相当于一个人在纽约和旧金山之间往返550次。
事实上,这只是训练时的排放量,当AI大模型运行时还将排出更多的二氧化碳。
加拿大数据中心公司QScale联合创始人Martin Bouchard认为,微软和谷歌为了满足搜索引擎用户日益增长的需求,在搜索中加入ChatGPT这类生成式AI,会导致每次搜索至少增加4到5倍的计算量。
如果还要经常重新训练模型,并添加更多的参数,计算量的规模就完全不同了。
根据国际能源署(International Energy Agency)的数据,数据中心的温室气体排放量已经占到全球温室气体排放量的1%左右。
随着AI大模型和对云计算需求的增长,这一数字预计还会上升。
AI大模型,正在成为碳排放的一个重要来源。
降低AI大模型的碳排放
AI模型的训练和运营过程需要消耗大量能源,但关键问题是,如何知道及测算单个机器学习实验正在产生多少温室气体排放,以及可以减少多少?
目前数据科学家们仍无法简单可靠地获取该领域的测量结果,这也妨碍着进一步制定可行的应对策略。
针对这一问题,谷歌发表了一项研究,详细介绍了最先进的语言模型的能源成本,包括早期和更大版本的LaMDA。
研究结果表明,将高效的模型、处理器和数据中心与清洁能源相结合,可以将机器学习系统的碳足迹减少1000倍。
该团队提出了四种基本方法,可显着减少机器学习工作负载的碳(和能源)足迹,这些方法目前在Google中使用,任何使用Google Cloud服务的人都可以使用。
Google能源和碳足迹减少最佳实践(4Ms)如下:
模型:研究人员表示,选择高效的ML模型架构至关重要,因为它有可能提高ML质量,同时将计算时间缩短一半。
机器:与通用处理器相比,使用专门用于ML训练的处理器和系统可以将性能和能效提高2倍至5倍。
机械化:大多数情况下,本地数据中心更老、更小。因此,新的节能冷却和配电系统的费用无法摊销。
基于云的数据中心是全新的、定制设计的仓库,具有可容纳50000台服务器的能效特性。它们提供异常高效的电源利用率 (PUE)。
因此,在云端而不是在本地进行计算,可以节省1.4-2倍的能源并减少污染。
优化:云允许客户选择具有最清洁能源的区域,从而将总碳足迹减少5到10倍。基于4Ms改进的模型、特定于机器学习的硬件和高效的数据中心,大大抵消了这种负载增加。
谷歌的数据表明,机器学习训练和推理在过去三年中仅占谷歌整体能源使用量的10%至15%,其中每年有35%用于推理,25%用于训练。
为了找到改进的机器学习模型,谷歌采用了神经架构搜索 (NAS)。
每个问题域/搜索空间组合通常只执行一次NAS,然后可以将生成的模型重复用于数百个应用程序,NAS的一次性成本通常被持续使用的减排量所抵消。
研究人员进行了一项研究来训练Transformer模型。
为此,他们在典型的数据中心中使用了Nvidia P100 GPU,其能源组合与全球平均水平相似,而使用TPUv4等新一代ML硬件,性能比P100提升了14倍。
同时,高效的云数据中心比普通数据中心节省1.4倍的能源,从而使总能耗降低83倍。
此外,由低碳能源驱动的数据中心可以将碳排放量再减少9倍,从而在四年内总共减少747倍。
谷歌团队认为,在信息技术领域,制造各种类型和规模的计算设备的生命周期成本,比机器学习的运营成本要高得多。
排放估算的制造成本包括制造所有相关组件(从芯片到数据中心建筑)所排放的嵌入碳。
当然,除了使用4Ms方法,服务提供商和用户还可以采取简单的措施来提高他们的碳足迹绩效,例如:
客户应通过让数据中心提供商报告数据中心效率和每个位置的能源供应清洁度,来分析和减少他们的能源使用和碳足迹。
工程师应该在最环保的数据中心中最快的处理器上训练模型,这些数据中心越来越多地在云上。
机器学习的研究人员应该专注于设计更有效的模型,如:利用稀疏性或包括检索来减少模型。
此外,他们应该报告他们的能源消耗和碳影响。这不仅会鼓励超越模型质量的竞争,而且还可以确保对他们的工作进行正确的核算。
AI助力降低碳排放
尽管AI大模型是碳排放大户,但以AI为代表的前沿科技也正在为降碳减排做出贡献。
百度与咨询机构IDC(International Data Corporation)联合进行的研究显示:与AI相关的技术减碳贡献占比会逐年提升,到2060年将至少达到70%,减碳总量预计超过350亿吨。
以交通行业为例,2020年中国交通行业的碳排放估测量为10.4亿吨,占全国总体排放的9%。
而在驱动交通行业降碳减排过程中,使用以智能信控为主的缓堵型智能交通技术,可以有效提升城市主要道路交叉口的通行效率,千万级人口城市因此每年可至少减碳4.16万吨——这相当于1.4万辆私家车行驶一年的碳排量。
从目前的实践来看,理解和实现减排的关键是对减排的效果进行预测和监控,而AI在节能减排中具有预测排放、监测排放、减少排放三个关键应用。
据《碳中和产业发展白皮书》显示,在预测排放方面,AI 能够根据当前减排工作和需求,预测未来的碳排放量,同时为碳排放定下排放量指引。
在监测排放方面,AI 能实时跟踪碳足迹数据,从采购、生产、销售、运维、物流等全环节收集数据,提升监测准确性。
在减少排放方面,AI 收集各环节数据后,能够以全局视角对各环节工作流程做出优化调整。
事实上,在AI助力碳减排方面,目前国内多个领域已有应用。
在新能源领域,突出问题在于其具有波动性、随机性、间歇性特点。
通过AI技术结合仿真计算,对风光电的不稳定情况做场景预测,如:结合风速、风向、光照强度等自然气象特征对未来的发电量进行合理的预测,向电网输出更精准的发电计划,将新能源的不确定性、不稳定屏蔽在技术层之下。
再比如,水务集团的管辖范围包括原水、制水、供水、排水、污水、节水等。
以居民供水为例,水压过大,所需能耗大,管网漏损率高,可能会引起爆管事件;而水压过小,可能会造成居民用水不便。
为了解决这一问题,水务集团在地下部署硬件传感器监测水压、建设水务大脑,在保证安全、稳定供水的前提下,通过AI技术可以实现智能化调压控制、能耗优化。
不仅如此,AI降碳技术也应用在电厂、园区、数据中心等能源消耗较高的业务场景中,对其生产用电需求进行精确预测和控制,进行耗电设备、碳足迹的优化。
结语
AI技术的进步给人类带来了诸多便利,但也必须在发展中关注环境问题。
未来AI如何实现可持续发展,以及AI如何更好地支撑双碳领域的变革,仍是亟需各行业共同解决的问题。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:
科技云报道:AI大模型背后,竟是惊人的碳排放
科技云报道原创。 自从ChatGPT这样的大型语言模型在全球引起轰动以来,很少有人注意到,训练和运行大型语言模型正在产生惊人的碳排放量。 虽然OpenAI和谷歌都没有说过他们各自产品的计算成本是多少,但据第三方研究人员分析,ChatG…...
如何根据实际需求选择合适的三维实景建模方式?
随着实景三维中国建设的推进,对三维实景建模的数字化需求大幅增加。由于三维实景建模具有采集速度快、计算精度高等建模优势,引起了各个行业的高度关注。三维实景建模是一种应用数码相机或者激光扫描仪对现有场景进行多角度环视拍摄,然后利用…...
CENTO OS上的网络安全工具(十八)ClickHouse及编程环境部署
这篇其实去年就写好了,孰知就在12月31日那一天打进决赛圈,一躺,二过年,三休假,四加班,居然到了三个月以后,才有机会将它发出来…… 一年也就四个季度不是,实在是光阴荏苒,…...
Java中class文件的格式
常见的class文件格式如下图所示,下面我将对一下格式一一作出解释。 一、magic 该部分主要是对语言类型的规范,只有magic这个部分是CAFEBABE时才能被检测为Java语言,否则则不是。 二、minor version和major version minor version主要表示了…...
C++排序算法
排序算法复习 冒泡排序 链接:https://www.runoob.com/w3cnote/bubble-sort.html 每次循环对比【相邻】两个元素,将最大的元素放到数组最后 void bubbleSort(int* arr, int n){//每次确认一个元素的最终位置,循环n-1次即可确认全部元素的最…...
JAVA后端部署项目三步走
1. JAVA部署项目三步走 1.1 查看 运行的端口 lsof -i:8804 (8804 为端口) 发现端口25111被监听 1.2 杀死进程,终止程序 pid 为进程号 kill -9 pid 1.3 后台运行jar包 nohup java -jar -Xms128M -Xmx256M -XX:MetaspaceSize128M -XX:MaxM…...
php使用zookeeper实现分布式锁
介绍 一、zookeeper和redis实现分布式锁的对比 1、redis 分布式场景应用比较广泛,redis分布式锁,其实需要自己不断去尝试获取锁,比较消耗性能;zk分布式锁,获取不到锁,注册个监听器即可,不需要不…...
力扣-可回收且低脂的产品
大家好,我是空空star,本篇带大家了解一道超级超级超级简单的力扣sql练习题。 文章目录前言一、题目:1757. 可回收且低脂的产品二、解题1.正确示范①提交SQL运行结果2.正确示范②提交SQL运行结果3.正确示范③提交SQL运行结果4.正确示范④提交S…...
代码随想录刷题-数组-二分查找
文章目录写在前面原理习题题目1思路和代码题目-2写在前面 这个专栏是记录我刷代码随想录过程中的随想和总结。每一小节都是根据自己的理解撰写的,文章比较短,主要是为了记录和督促自己。刷完一章后,我会再单独整理一篇文章来总结和分享。 本…...
HCIA复习1
HCIA复习 抽象语言---->编码 编码---->二进制 二进制--->电信号 处理电信号 OSI参考模型----OSI/RM 应用层 表示层 会话层 传输层 端口号:0-65535;1-1023是注明端口 网络层 IP地址 数据链路层 物理层 ARP协议 正向ARP---通过IP地址获取目的MAC地…...
Kotlin中的destructuring解构声明
开发中有时只是想分解一个包含多个字段的对象来初始化几个单独的变量。要实现这一点,可以使用Kotlin的解构声明。本文主要了解:“1、如何使用解构声明这种特性 2、底层是如何实现的 3、如何在你自己的类中实现它1、解构声明的使用解构声明&a…...
Kubernetes Pod 水平自动伸缩(HPA)
Pod 自动扩缩容 之前提到过通过手工执行kubectl scale命令和在Dashboard上操作可以实现Pod的扩缩容,但是这样毕竟需要每次去手工操作一次,而且指不定什么时候业务请求量就很大了,所以如果不能做到自动化的去扩缩容的话,这也是一个…...
钉钉、企业微信和飞书向“钱”看
在急剧变革的时候,不管黑猫白猫,要抓到老鼠才算好猫。如今,各互联网企业早已进入降本增效的新阶段。勒紧裤腰带过日子之下,能不能盈利、商业化空间有多大,就成为各个业务极为重要的考核指标。在各业务板块中࿰…...
网上购物网站的设计
技术:Java、JSP等摘要:本文介绍了JSP和JAVA等相关技术,针对网上购物系统的实际需求,设计开发了一个基于JSP的小型电子商务网站也就是网上购物系统,。在设计开发中,采用的是SSH框架(strutsspring…...
【Java学习笔记】8.Java 运算符
Java 运算符 计算机的最基本用途之一就是执行数学运算,作为一门计算机语言,Java也提供了一套丰富的运算符来操纵变量。我们可以把运算符分成以下几组: 算术运算符关系运算符位运算符逻辑运算符赋值运算符其他运算符 算术运算符 算术运算符…...
RHCSA-使用命令管理文件(3.6)
硬链接与软链接基本操作: 创建软硬连接的命令:ln 硬链接:ln 源文件(已经存在的文件) 链接文件名(新建) 软连接:ln -s 源文件(已存在的文件) 快捷方式文件名…...
socket聊天室--socket的建立
socket聊天室–socket实现 文章目录 socket聊天室--socket实现socket()bind()listen()accept()connect()发送接收read()函数recv()函数write()函数send()函数close()关闭套接字IP 地址格式转换函数socket() #include <sys/types...
Raft图文详解
Raft图文详解 refer to: Raft lecture (Raft user study) - YouTube Raft PDF Raft算法详解 - 知乎 (zhihu.com) 今天来详细介绍一下Raft协议 Raft是来解决公式问题的协议,那么什么是共识呢? 在分布式系统里面,consensus指的是多个节点对…...
春季出游,学会这些功能,让你旅途更舒心
春意盎然,万物复苏,春天正是旅游观光的好时节,相信不少小伙伴已经做好了出游的准备。想拥有好的心情,除了美食美景,好的出游神器也必不可少,好的出游神器能让我们的旅途更舒心,一起来看看是哪些…...
【华为OD机试真题java、python、c++、jsNode】简单的自动曝光【2022 Q4 100分】(100%通过)
代码请进行一定修改后使用,本代码保证100%通过率。本文章提供java、python、c++、jsNode四种代码 题目描述 一个图像有n个像素点,存储在一个长度为n的数组img里,每个像素点的取值范围[0,255]的正整数。 请你给图像每个像素点值加上一个整数k(可以是负数),得到新图newImg…...
未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?
编辑:陈萍萍的公主一点人工一点智能 未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战,在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...
19c补丁后oracle属主变化,导致不能识别磁盘组
补丁后服务器重启,数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后,存在与用户组权限相关的问题。具体表现为,Oracle 实例的运行用户(oracle)和集…...
linux之kylin系统nginx的安装
一、nginx的作用 1.可做高性能的web服务器 直接处理静态资源(HTML/CSS/图片等),响应速度远超传统服务器类似apache支持高并发连接 2.反向代理服务器 隐藏后端服务器IP地址,提高安全性 3.负载均衡服务器 支持多种策略分发流量…...
React hook之useRef
React useRef 详解 useRef 是 React 提供的一个 Hook,用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途,下面我将全面详细地介绍它的特性和用法。 基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...
基于Flask实现的医疗保险欺诈识别监测模型
基于Flask实现的医疗保险欺诈识别监测模型 项目截图 项目简介 社会医疗保险是国家通过立法形式强制实施,由雇主和个人按一定比例缴纳保险费,建立社会医疗保险基金,支付雇员医疗费用的一种医疗保险制度, 它是促进社会文明和进步的…...
在四层代理中还原真实客户端ngx_stream_realip_module
一、模块原理与价值 PROXY Protocol 回溯 第三方负载均衡(如 HAProxy、AWS NLB、阿里 SLB)发起上游连接时,将真实客户端 IP/Port 写入 PROXY Protocol v1/v2 头。Stream 层接收到头部后,ngx_stream_realip_module 从中提取原始信息…...
CMake 从 GitHub 下载第三方库并使用
有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...
Redis的发布订阅模式与专业的 MQ(如 Kafka, RabbitMQ)相比,优缺点是什么?适用于哪些场景?
Redis 的发布订阅(Pub/Sub)模式与专业的 MQ(Message Queue)如 Kafka、RabbitMQ 进行比较,核心的权衡点在于:简单与速度 vs. 可靠与功能。 下面我们详细展开对比。 Redis Pub/Sub 的核心特点 它是一个发后…...
【Redis】笔记|第8节|大厂高并发缓存架构实战与优化
缓存架构 代码结构 代码详情 功能点: 多级缓存,先查本地缓存,再查Redis,最后才查数据库热点数据重建逻辑使用分布式锁,二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...
Webpack性能优化:构建速度与体积优化策略
一、构建速度优化 1、升级Webpack和Node.js 优化效果:Webpack 4比Webpack 3构建时间降低60%-98%。原因: V8引擎优化(for of替代forEach、Map/Set替代Object)。默认使用更快的md4哈希算法。AST直接从Loa…...
