当前位置: 首页 > news >正文

张钹院士:大模型时代的企业AI发展趋势

在当今技术迅速发展的时代,生成式人工智能与大模型正成为推动产业变革的重要力量。随着AI技术的不断成熟与普及,它的应用已从个人领域扩展至企业层面,广泛覆盖各行各业。

那么,新技术究竟会给产业带来哪些积极地影响?它又将如何平稳落地到场景?近日,在用友主办的“2024全球商业创新大会”上,中国科学院院士、清华大学人工智能研究院名誉院长张钹发表了主题为《生成式人工智能时代的产业》的演讲。

会上,张钹院士从能力、应用、架构、趋势等几个维度,详尽阐述了学术界关于大模型的洞察与思考,全面剖析了大模型的演进路径,就该技术的应用前景、挑战及其在不同领域的实际应用展开了深入探讨。在这里插入图片描述

01

大语言模型“三大能力”

与“一大缺陷”不容忽视

张钹院士进一步探讨了生成式人工智能的核心优势及其可能带来的挑战。目前,在大模型发展的进程中,已呈现出“三大能力”和“一大缺陷”。

其中,生成式人工智能具备三大核心能力为:

01

第一,强大的语言生成能力,即在开领域生成多样性的、语义连贯的、类似人类的文本。这是大语言模型区别于其他计算机生成语言的灵魂和优势所在;

02

第二,强大的自然语言对话能力,即在开领域实现人机自然语言对话;

03

第三,强大的迁移能力,即在代理任务上训练一个模型,只需要少量数据和微调,就可以适配到下游任务中,从而凸显出大模型可举一反三的能力。

除了上述优势外,大模型也呈现了一大缺陷,那就是大模型的幻觉。换句话说,在多样性输出的过程中,大模型也会犯错,这与它的创造性同时产生。

事实上,这种幻觉是外部信息驱动下产生的,因为大模型与人类生成的语言只是行为上相似,而内在机制完全不同。更深一步讲,这也揭示出了基础模型的局限性。一方面,它输出的结果不一定正确,且质量不可控;另一方面,大模型不可信任;还有一方面,大模型对提示词的依赖性强,鲁棒性较差。

“正因具备上述优势与缺陷,产业在落地大模型应用时必须格外重视这些因素。”

——张钹院士

02

基础模型的三种落地方向

目前,在生成式AI的众多应用场景中,高阶应用如设计、规划,低阶应用如服务、营销是相对容易实现的。例如,券商可依托大模型打造新一代AI中台大脑,帮助企业实现智能化的开户、客服、AI选股等服务场景。

与之相反,涉及企业关键业务领域的大模型应用场景则是较难实现的,如自动驾驶或制造行业的定制化生产、质量控制等。因为这些核心业务对于技术的容错率较低,而可靠性、准确性要求更高。

那么,大模型的应用场景该如何落地到核心业务领域?技术提供商、产业界的机会在哪里?

张钹院士提出了落地通用基础模型的三种方向。

第一,面向各个行业的垂类大模型;

第二,在大模型的基础上打造产业应用;

第三,让大模型与其他技术、工具相结合,创造产业应用。

03

大模型的六种架构模式

找到了大模型的落地方向,那么让大模型真正落地,同时还能使其用起来安全、可信、可控,这是产业和企业普遍关注的话题。为此,张钹院士提出了基于大模型的六种架构模式。

第一,提示工程

在很多大模型设计的过程中,都会增加这一至关重要的中间环节。它可以提升模型的理解和响应能力,输出一个更令人满意的结果。

比如,当问及大模型9.11和9.9哪一个数大时,它会给出错误的答案。但是,当用户在提示了有小数点存在的情况后,大模型便会给出正确的结果。因此,提示工程是影响生成结果的关键因素。提示的质量直接决定了输出结果的准确性和质量。在实际应用中,如何优化提示内容成为提升生成式人工智能应用效果的重要手段。

第二,检索增强生成(RAG)

对于事实性的问题,为了提高生成内容的确定性,生成式人工智能需要结合检索功能,通过触发外部知识库检索机制,辅助大模型生成更加准确、详尽且具有针对性的答案。

第三,微调

在加入了领域知识和私有数据后,通过在特定领域进行微调,可以显著提高生成式人工智能的输出质量,使其更符合特定领域的需求。比如,大模型在进行了医疗专业知识训练后,它就可以完成执业医师资格考试,准确率可达90%以上。而且,在诊断推理的过程中,大模型也对结果做出合理的解释。

第四,知识图谱与向量数据库

将知识图谱与向量数据库结合使用,能够帮助生成式人工智能更好地理解和处理文本中的语义信息,可解决模型缺乏事实知识、幻觉和可解释性等诸多问题。在企业部署大模型时,通过建立向量数据库,并让它与文档数据库协同工作,从而提高生成结果的准确性。

第五,内部监测与控制

在加以人类控制后,大模型可检测出数据偏差和漂移,也可处理异常情况。同时,通过引入智能体强化学习,可以让大模型自我反应,帮助它完成感知、动作、学习的一体化,从而减少错误的发生。

第六,安全与治理

随着大模型的发展,安全、误用与滥用已经成为普遍问题,这里涉及政治标准、道德与伦理等问题。只有建立多层次的安全保障,推动治理体系落地,才能够确保大模型健康可持续性发展。目前,这是一个迫在眉睫的问题。

04

坚持大模型自主发展之路

推动应用创新与产业化进程

随着生成式人工智能的快速发展,业界也对其未来前景提出了质疑。针对这一业界普遍关注的问题,张钹院士解释道,生成式AI是人类发展史上的一次重大技术突破。为此,人类花费了几十年时间解决了人工智能领域中的三个关键技术问题——文本的语义向量表示、生成式预训练转换器、自监督学习。

其中,最关键的技术创新就在于文本的语义向量表示,它实现了从信息形式的处理到信息内容处理的跨越。

“这项技术真正意义在于它将语言问题转变为一个数学问题。原来,文本仅代表了一个个符号,符号是存在于离散空间的,这些很难用数学工具去解析。而现在,语言被翻译为向量,计算机根据向量就可以解析成语义,对信息的内容加以处理,从而帮助人类真正进入到人工智能时代!”

——张钹院士

基于对大模型原理的深入理解,张钹院士对第三代人工智能技术的发展抱有十足的信心。就目前来看,问题的关键点仍在于如何让它落地。

张钹院士认为,第三代人工智能的发展方向重点在于:第一,构建具备可解释与鲁棒(稳健)的AI理论与方法,消除人们心里产生的恐慌。其次,开发安全、可控、可信、可靠且可扩展的技术,从而驱动人工智能产业的繁荣发展。第三,推动AI的创新应用与产业化。这表明,AI技术的研究与开发不仅仅是学术上的突破,还需要与产业需求紧密结合,将技术创新转化为现实应用,从而带来经济效益和社会进步。

同时,他还提出了“知识驱动 + 数据驱动”的理念,通过整合知识、数据、算法和算力这四大要素,确保AI技术不仅具备强大的智能能力,还能够在多样化的应用场景中发挥稳定且长效的作用。

张钹院士强调,坚持中国自主发展之路,必须认识到知识驱动与数据驱动在第三代人工智能中的核心作用,充分结合和利用知识、数据、算法、算力等要素,从而驱动中国人工智能产业的繁荣发展。

在人工智能技术突飞猛进的今天,大模型正在各行各业中展现出巨大的潜力。同时,在这条充满挑战的征途上,只有通过不断提升大模型的安全性、可靠性和可控性,才能真正实现其广泛应用。

未来,我们不仅要关注技术本身的突破,更要思考如何将其与产业实际深度结合。唯有如此,每一家企业才能通过探索与挖掘,为自身的未来发展创造关键变量,让大模型为人类社会创造出更多的价值和机遇,迎接智能时代的全面到来。

相关文章:

张钹院士:大模型时代的企业AI发展趋势

在当今技术迅速发展的时代,生成式人工智能与大模型正成为推动产业变革的重要力量。随着AI技术的不断成熟与普及,它的应用已从个人领域扩展至企业层面,广泛覆盖各行各业。 那么,新技术究竟会给产业带来哪些积极地影响?…...

php连接sphinx的长连接事宜以及sphinx的排除查询以及关于sphinx里使用SetSelect进行复杂的条件过滤或复杂查询

一、php连接sphinx的长连接事宜以及sphinx的排除查询 在使用php连接sphinx时,默认的sphinx连接非长连接,于是在想php连接sphinx能否进行一些优化 publish:January 9, 2018 -Tuesday: 方法:public bool SphinxClient::open ( void ) — 建立到…...

抓包分析排查利器TCPdump

tcpdump命令介绍与常规用法。 基础命令介绍 # 固定语法 -i 指定网卡名称 -nn 显示IP地址 -w 指定输出的文件名称 tcpdump -i eth0 -nn -w test.cap-nn 不把主机的网络地址与协议转换成名字 -w 把数据包数据写入指定的文件 and 连接参数 host 指明主机 port 指明端口 src 源IP…...

八种排序算法的复杂度(C语言)

归并排序(递归与非递归实现,C语言)-CSDN博客 快速排序(三种方法,非递归快排,C语言)-CSDN博客 堆排序(C语言)-CSDN博客 选择排序(C语言)以及选择排序优化-CSDN博客 冒泡排序(C语言)-CSDN博客 直接插入排序(C语言)-CSDN博客 希尔排序( 缩小增量排序 )(C语言)-CSDN博客 计数…...

docker compose部署rabbitmq集群,并使用haproxy负载均衡

一、创建rabbitmq的data目录 mkdir data mkdir data/rabbit1 mkdir data/rabbit2 mkdir data/rabbit3 二、创建.erlang.cookie文件(集群cookie用) echo "secretcookie" > .erlang.cookie 三、创建haproxy.cfg配置文件 global log stdout fo…...

git强制推送代码教程

git强制推送代码教程 首先说明情况,我的代码remote了两个git库,现在想要推送到其中一个,但是版本不对,被拒绝,因此下面将进行强制推送 首先检查远程库都有哪些 git remote -v2. 检查当前的分支 git branch当前分支前…...

windows C++-高级并发和异步(三)

深入了解 winrt::resume_foreground(下) 调用 winrt::resume_foreground 时会始终先排队,然后展开堆栈。 也可选择设置恢复优先级。 winrt::fire_and_forget RunAsync(DispatcherQueue queue) {...co_await winrt::resume_foreground(queue, DispatcherQueuePrior…...

河北移动:核心系统数据库成功完成整体迁移 ,实现全栈国产|OceanBase案例

本文作者:移动通信集团河北有限公司架构规划专家,房瑞 项目背景: 中国移动通信集团河北有限公司一直在积极响应国家及集团的号召,以磐舟&磐基云原生为底座,结合国产浏览器、中间件、数据库、操作系统和服务器等&a…...

ZKRollup

目录 ZKRollup 基本概念 运作原理 特点与优势 应用场景 典型项目 ZKRollup ZKRollup,全称为Zero-Knowledge Rollup,是一种基于零知识证明的二层扩容方案(Layer 2)。它旨在通过提高交易处理效率和降低交易成本来扩展区块链网络的能力,尤其是在以太坊等区块链平台上得…...

letcode 分类练习 树的遍历

letcode 分类练习 树的遍历 树的构建递归遍历前序遍历中序遍历后序遍历 迭代遍历前序遍历中序遍历后序遍历 层序遍历层序遍历可以解决的问题107. 二叉树的层序遍历 II199. 二叉树的右视图637. 二叉树的层平均值429. N 叉树的层序遍历515.在每个树行中找最大值116.填充每个节点的…...

redisssion分布式锁

分布式锁的问题 基于setnx的分布式锁实现起来并不复杂,不过却存在一些问题。 锁误删问题 第一个问题就是锁误删问题,目前释放锁的操作是基于DEL,但是在极端情况下会出现问题。 例如,有线程1获取锁成功,并且执行完任…...

嘎嘎嘎拿到去年想要的包

一年多了 继续,把项目收尾吧 好好学前端,外企!react!从0开始,紧迫!加油!...

前奏编曲:如何编写二段式前奏

选好音源 Pianoteq 6 STAGE比较明亮些,适合做前奏的音源 确定和弦进行 比如4536251,每个小节2和弦,每个小节的和弦弹一下 优化和弦进行衔接和织体 二段式不用对和弦进行就近解决的处理,因为前奏前后要形成对比。 前半部分往…...

征服云端:Kubernetes如何让微服务与云原生技术如虎添翼

引言 在这个数字化转型的时代,微服务架构已经成为构建现代应用程序的首选方式。它不仅提高了开发效率,还增强了系统的可扩展性和灵活性。而随着云计算技术的迅猛发展,云原生的概念逐渐深入人心,它代表了一种全新的软件开发方法论…...

开源AI智能名片系统与高级机器学习技术的融合应用:重塑商务交流的未来

摘要:在数字化浪潮的推动下,人工智能(AI)技术,尤其是机器学习领域的快速发展,正深刻改变着各行各业的面貌。开源AI智能名片系统作为这一变革的先锋,通过集成并优化多种高级机器学习技术&#xf…...

Java中synchronized的偏向锁是如何减少锁开销的

偏向锁(Biased Locking)是一种优化 Java synchronized 锁的机制,旨在减少在无竞争情况下的锁开销。它通过将锁偏向于单个线程来优化锁的性能。以下是偏向锁减少锁开销的具体方式和原理: 偏向锁的工作原理 锁的初始状态: 当一个对…...

react18 + ts 使用video.js 直播.m3u8格式的视频流

一、安装依赖 我使用的video.js版本是8.17.3,从 Video.js 7.x 开始,HLS 支持被内置到了 Video.js 中所以不需要安装其他依赖 npm i video.js 二、创建VideoPlayer组件 import React, { useEffect, useRef } from react import videojs from video.js …...

使用 onBeforeRouteLeave 组合式函数提升应用的用户体验

title: 使用 onBeforeRouteLeave 组合式函数提升应用的用户体验 date: 2024/8/14 updated: 2024/8/14 author: cmdragon excerpt: 摘要:本文介绍了在Nuxtjs中使用onBeforeRouteLeave组合式函数来提升应用用户体验的方法。onBeforeRouteLeave允许在组件离开当前路…...

uni-app 吸顶方案总结

效果 页面级 uni.pageScrollTo 官方文档&#xff1a;https://uniapp.dcloud.net.cn/api/ui/scroll.html#pagescrollto 原生头部导航 uni.pageScrollTo({selector: #tabs,duration: 300 });(推荐)需要兼容自定义头部导航 <template><view id"demo1" :styl…...

【C#】知识汇总

目录 1 概述1.1 GC&#xff08;Garbage Collection&#xff09;1.1.1 为什么需要GC&#xff1f;1.1.2 GC的工作原理工作原理什么是Root&#xff1f;GC算法&#xff1a;Mark-Compact 标记压缩算法GC优化&#xff1a;Generational 分代算法 1.1.3 GC的触发时间1.1.4 如何减少垃圾…...

1、Unity【基础】3D数学

3D数学 文章目录 3D数学1、数学计算公共类Mathf1、Mathf和Math2、区别3、Mathf中的常用方法&#xff08;一般计算一次&#xff09;4、Mathf中的常用方法&#xff08;一般不停计算&#xff09;练习 A物体跟随B物体移动 2、三角函数1、角度和弧度2、三角函数3、反三角函数练习 物…...

虚拟机ubuntu22的扩容记录

这里lsblk命令能看到&#xff0c; ubuntu逻辑分区只有29G&#xff0c; 但总分区60G&#xff0c;还有接近30G未使用。 rootx:/home/x# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS loop0 7:0 0 63.9M 1 loop /snap/core2…...

Docker 常用配置

Docker 常用配置 1. 配置方法 修改下面位置&#xff1a; Linux&#xff1a;vim /etc/docker/daemon.jsonmacOS&#xff1a;菜单栏图标->Settings->Docker Engine 注意&#xff1a;修改完需要重启Docker Linux&#xff1a;systemctl restart dockermacOS&#xff1a;…...

通过示例了解 .NET Core 中的依赖注入

依赖注入 (DI) 是一种用于实现 IoC&#xff08;控制反转&#xff09;的设计模式&#xff0c;可以更好地解耦应用程序内的依赖关系并更轻松地管理它们。.NET Core 内置了对依赖注入的支持&#xff0c;提供了一种有效管理依赖关系的强大方法。 一.什么是依赖注入&#xff1f; 依…...

fetch、FormData上传多张图片

利用fetch方法和FormData对象上传多张图片 formdata()对象可以序列化多张图片 <html><head><meta http-equiv"content-type" content"text/html;charsetUTF-8"/><title>测试fetch和formdata上传多张图片</title></head&…...

C++STL详解(五)——list类的具体实现

一.本次所需实现的三个类及其成员函数接口 链表首先要有结点&#xff0c;因此我们需要实现一个结点类。 链表要有管理结点的结构&#xff0c;因此我们要有list类来管理结点。 链表中还要有迭代器&#xff0c;而迭代器的底层其实是指针。但是我们现有的结点类无法完成迭代器的…...

鸿蒙(API 12 Beta3版)【使用投播组件】案例应用

华为视频接入播控中心和投播能力概述** 华为视频在进入影片详情页播放时&#xff0c;支持在控制中心查看当前播放的视频信息&#xff0c;并进行快进、快退、拖动进度、播放暂停、下一集、调节音量等操作&#xff0c;方便用户通过控制中心来操作当前播放的视频。 当用户希望通…...

【STM32项目】在FreeRtos背景下的实战项目的实现过程(一)

个人主页~ 这篇文章是我亲身经历的&#xff0c;在做完一个项目之后总结的经验&#xff0c;虽然我没有将整个项目给放出来&#xff0c;因为这项目确实也是花了米让导师指导的&#xff0c;但是这个过程对于STM32的实战项目开发都是非常好用的&#xff0c;可以说按照这个过程&…...

C#垃圾处理机制相关笔记

C#编程中的垃圾处理机制主要通过垃圾回收器&#xff08;Garbage Collector&#xff0c;GC&#xff09;实现自动内存管理。C#作为一种托管语言&#xff0c;其垃圾处理机制显著减轻了程序员的内存管理负担&#xff0c;与C语言等非托管语言形成鲜明对比。具体介绍如下&#xff1a;…...

C语言memcmp函数

目录 开头1.什么是memcmp函数?2.memcmp函数的内部程序流程图 3.memcmp函数的实际应用比较整型数组比较短整型二维数组比较结构体变量…… 结尾 开头 大家好&#xff0c;我叫这是我58。今天&#xff0c;我们要学一下关于C语言里的memcmp函数的一些知识。 1.什么是memcmp函数?…...

wordpress排队加载/百度爱企查电话人工服务总部

随机数在编程中非常重要&#xff0c;有些场合不得不使用随机数&#xff0c;如创建1000个满足0~1正太分布的随机数&#xff1b;有些场合可以避开使用随机数&#xff0c;但人为设置的数字显得呆板&#xff0c;最后还是选择随机数。 1、创建1000个满足0~1正太分布的随机数&#xf…...

温州手机网站建设/网络营销渠道可分为

os 模块&#xff1a; 和操作系统打交道的模块 os模块是与操作系统交互的一个接口 os.makedirs(dirname1/dirname2) 可生成多层递归目录 os.removedirs(dirname1) 若目录为空&#xff0c;则删除&#xff0c;并递归到上一级目录&#xff0c;如若也为空&#xff0c;则删除&a…...

企业网站创建的步骤/乔拓云智能建站系统

MySQL 8.0.11 innodb cluster 运维管理手册之四-msyqlbackup备份 作者 方连超 Mysqlbackup 介绍 mysqlbackup是一个热备份工具、也就是说它不像mysqldump那样给表上一个全局锁&#xff0c;由于mysqldump上了这个锁&#xff0c;所以就造成客户端只能对数据库进行读操作不能写&am…...

icp备案网站接入信息ip地址段/云南seo

[信息系统安全实验] 实验2.软件安全 格式化字符串漏洞 prog1 prog1.c 代码: /* prog1.c */ #include <stdio.h>void fmtstr() {char input[100];int var 0x11223344; /* print out information for experiment purpose */printf("Target a…...

微信服务号菜单链接网站怎么做/银川网页设计公司

JQMYSQL实现省市区联动JQ部分 ps&#xff1a;本人亲测&#xff0c;阿里云2核4G5M的服务器性价比很高&#xff0c;新用户一块多一天&#xff0c;老用户三块多一天&#xff0c;最高可以买三年&#xff0c;感兴趣的可以戳一下&#xff1a;阿里云折扣服务器 1、PHP代码 相关函数&…...

莆田做网站建设/优化设计方法

jsp初学者必备知识一、bs模式&#xff0c;cs模式的概念&#xff1a;二、web应用程序是什么三、如何将开发的web项目部署到服务器总结前言 ##刚开始学习jsp应该有点困难吧&#xff0c;掌握这几个基础知识就会好了很多哦&#xff1a;bs模式&#xff0c;cs模式的概念&#xff0c…...