金融和大模型的“两层皮”问题
几年前,我采访一位产业专家,他提到了一个高科技到产业落地的主要困惑:两层皮。
一些特别牛的技术成果在论文上发表了,这是一层皮。企业的技术人员,将这些成果产品化、商品化的时候,可能出于工程化的原因,会做一些简化,这是另一层皮。
两层皮之间,是有gap的,就像卖家秀和买家秀一样,并不是融合且一致的。
而往往是那些有技术人才、研发能力、转化意愿的企业,会先碰到“两层皮”的问题,产生对技术有效性、ROI回报率不明确的疑虑。
在冲入大模型热潮的各路人马中,金融机构可能是率先遭遇“两层皮”挑战的。
我们知道,金融产业一贯是新技术的早期采用者,在AI方面的尝试很早就开始了,可以说是产业AI化的“优等生”,更是有着良好的信息化、数字化基础。金融机构的前中后台各个场景中,都有被大模型降本增效的空间。因此,金融也被认为是大模型落地的首选场景。
作为大模型落地的先行者,金融领域如果解决不了“两层皮”的问题,意味着大模型在实际应用中还是存在卖家秀和买家秀的差距。
本文希望说清楚,究竟是哪些问题拉开了金融和大模型之间的gap?
问题一:以谁为主?
既然是做大模型,当然是由OpenAI/BAT这样的科技企业和技术公司为主导了,而这也是金融机构不想看到的事。
有个金融领域的专家告诉我们,这波大模型的热度起来之后,金融机构都特别焦虑,有一种FOMO(Fear of Missing Out害怕错过)情绪。
因为上一波技术浪潮,智能手机和移动互联网崛起,导致传统银行、券商的很多业务,被互联网金融公司分走了。在业内人看来,这种“史诗级的悲剧”绝不能重演。
在技术焦虑的驱动下,金融机构非常积极想跟上大模型的风口,几乎不需要科技厂商做太多市场教育,整个行业在接纳大模型这件事上表现极其良好。
同时,金融机构也非常重视将金融大模型的“核心筹码”牢牢掌握自己手里,强调“以我为主”。有银行业人士提出:只有适应银行的大模型,才是真正可以深度应用到场景里、业务流程中的大模型。具体怎么做呢?
一类是硬筹码。
对金融机构来说,数据安全隐私合规,是没有妥协的硬指标,有非常严格的要求。这也就导致,大模型落地金融更加需要本地化的搭建和私有化部署、运行。
本地部署的要求,对大模型厂商来说有利有弊。有利的地方是,相比其他行业直接调用API接口的MaaS模式,本地部署的客单价高、利润大,商业价值更高。不利的地方在于,私有部署需要在云化方案、数据处理、存储、模型训练、提示工程、运维服务等多方面,形成一套完整的解决方案,竞争焦点不仅是基座模型本身,这就增加了技术服务商的成本和难度。
另一类是软筹码。
金融大模型要表现良好,需要专有数据的精调、领域知识的引入、基于场景的反馈,而银行业本身的数字化基础非常好,数据积累深厚,这便成了掌握在手中的软筹码。
摩根斯坦利公司在研发生成式AI产品中,就结合超过10万份财务报告、内部资料和金融文献等,对OpenAI的基础模型进行微调。据透露,我国农业银行业也沉淀了2.6TB的高质量训练数据,用于大模型的训练。此外,基础大模型虽然通识能力很强,但“专业课”能力不足,缺少金融专业知识,加上金融场景业务复杂,初出茅庐的大模型,要形成高质量的服务能力,成为优秀的“AI副驾驶”,并不容易。
这就要求,大模型厂商和技术公司,改变“技术为中心”“我是来赋能/颠覆你的”的惯有思路,增强服务意识,与金融客户合作,以金融客户为主。
大模型落地金融绝不是,也不能是又一次“技术颠覆行业”。无论是通用大模型厂商还是ISV服务商集成商,都要在“客户为主”这条baseline(基线)上跳舞。
问题二:融合为什么难?
以金融机构为主,那科技公司岂不是成了“大模型施工队”,只能收点辛苦费,发挥不了技术创新性了?
大no特no。
一来,金融AI不是新事物。
金融机构,并不是大家想的那样,面对AI一窍不通。事实上,在所有行业里,金融领域的“含AI量”绝对是排名前列的。几年前我采访国内某985高校人工智能学院的院长,对方直言,AI方向的学生毕业后不去BAT、不去创业公司,去的是招商银行这类金融机构下面的信息中心/技术中心,搞金融的人工智能。
所以,金融AI的趋势其实早在几年前,就已经大幅开展了,这也是为什么今年大模型热度刚起,国內工行、平安、农行、招商银行、中信银行等一大波银行,能很快组建了自己的GPT大模型专项研究团队。银行能及时行动,靠的就是几年来投入AI的积累。所以,以金融机构为主,也做得好金融大模型。
二来,大模型是个新事物。
大模型究竟比这些“传统AI”强在哪里,能干什么?这是一个完全空白的新问题。
理论上讲,大模型可以贯穿银行全产业链的各个环节,每条业务线、每个智能都能找到LLM的应用场景。但现实中,全环节全面上马大模型,怎么跟业务结合都不清楚,意味着会有大量探索是失败的、浪费的。
要加速探索、减少成本、降低风险就必须金融机构和科技公司一起,让金融专家、算法科学家、工程师、测试员等坐在一起,一点一点地共同探索,深入洞察场景,对需求“去伪存真”。
有金融机构的负责人直言,今天金融业能够获取的智能化应用非常丰富,翻开AI企业的金融产品推介手册,可以看到上百个细分能力,但如何选取最合适的整合到自家机构的业务中,这个过程中会有大量的试错。
目前来看,业内基本已经达成共识,金融大模型,必须优选场景。有几个关键词:
1.高频次。在一些重点场景、重点应用上,尽快让大模型可以上岗解决问题,降低应用的门槛。比如智能客服、智能投顾等原本的劳动密集型岗位,可以很快带来显著的降本增效成果。
2.高价值。对于一些有社会价值、商业价值的领域,率先开始探索。比如普惠金融,就是目前从政府到民间都非常看中的金融服务,需要精准的数据洞察、更低成本、高可及性的服务能力,去综合降低中小微企业/商家的金融成本。其中,大模型的多模态表达能力、强大的理解分析能力都可以发挥很好的作用。
3.易部署。不少金融从业者,听到大模型的第一反应是,这事儿小模型能干吗?大模型对硬件基础设施的算力、稳定性等都提出了更高的要求,金融机构又在加速推进国产化硬件,各个业务线都部署大模型,带来的性能压力、成本压力、部署压力都是非常大的。所以,大模型压缩优化后或者同样效果的小模型,可以落地的业务场景,比如大模型生成银行理财产品推荐建议,大模型作为券商机构的研究助理,对这些已经在应用的传统AI,用大模型进行升级,不会增加过高的算力成本和工程量,是更易落地的渐进式场景。
正因为大模型是一层皮,实际应用是另一层皮,两层皮怎么融合,在哪些场景优先融合,是一条无人走过的路。金融机构和科技企业,都不能独行,唯有紧密配合,才能寻找到金融场景与大模型之间的最佳融合之路。
问题三:镣铐怎么这么多?
是不是找到场景,重点攻克,然后规模化复制,金融大模型就能突飞猛进了?
我们说金融机构“人多、钱多、技术多”,只是相对其他行业而言。现实中,金融机构也不可能拿出无限的预算、投入无限的人力、开放无限的场景,供大模型随意大显身手。而且,金融领域还存在大量的中小银行、券商,能负担的技术创新成本也是有限的。
一位银行从业者提到AIGC就说:竞争是加剧的,人员是有限的,人才是缺乏的,费用是紧张的。
可以说,带着镣铐跳舞,正是金融和大模型“两层皮”“卖家秀和买家秀”的关键原因。
比如算力的问题。国产化替代进程中,金融大模型要打破训练昂贵、算力成本高的桎梏,对模型厂商的硬件基础、自研能力、生态兼容能力、软件协同优化,提出了综合的考验。
目前,头部云厂商都下大力气在自研硬件上,比如百度的昆仑、阿里的倚天、华为的昇腾,以及配套的软件、生态,没有这些很难真正拿下金融大模型。
还有技术本身的限制。坦率来说,大模型技术本身还存在不少问题,尤其是在金融领域落地,必须解决幻觉问题,胡说八道对严谨的金融业务是不可接受的。模型黑箱性会导致AI智能决策不可信、不敢信,无法真正用于金融投顾、市场分析决策。
另外,金融机构也会衡量ROI投入产出比。但因为金融场景中,已经沉淀了大量的传统AI,比如智能客服,大家可能都接过机器人打来的产品推销电话、账单催收电话。
所以引入大模型后,究竟能给客户带来多少收益,回报产出比ROI怎么评估,哪些是大模型带来的提升,这些目前还没有一个明确的衡量标准。
无法量化大模型给业务带来的贡献,显然会导致大模型厂商的无序竞争,或者比拼客户关系,这也成为金融大模型效果不彰的一个隐忧。
消除产业和大模型之间的gap,将会是接下来,大模型赛道的标准动作。
这个过程中,最早遇到“两层皮”问题的金融大模型,或许会提供大量有益的参考和实践,而金融机构也会成为更早挖掘到金矿的第一批大模型淘金者。
相关文章:
金融和大模型的“两层皮”问题
几年前,我采访一位产业专家,他提到了一个高科技到产业落地的主要困惑:两层皮。 一些特别牛的技术成果在论文上发表了,这是一层皮。企业的技术人员,将这些成果产品化、商品化的时候,可能出于工程化的原因&am…...
智能生活从这里开始:数字孪生驱动的社区
数字孪生技术,这个近年来备受瞩目的名词,正迅速渗透到社区发展领域,改变着我们居住的方式、管理的方式以及与周围环境互动的方式。它不仅仅是一种概念,更是一种变革,下面我们将探讨数字孪生技术如何推动社区智能化发展…...
Python计算机二级知识点整理
1.当一个进程在运行过程中释放了系统资源后要调用 唤醒进程原语 唤醒进程原语是把进程从等待队列里移出到就绪队列并设置进程为就绪状态,当一个进程在运行过程中释放了系统资源后进入就绪状态,调用唤醒进程原语。 2. 3. 4.在希尔排序法中&#x…...
双系统ubuntu20.04(neotic版本)从0实现Gazebo仿真slam建图
双系统ubuntu20.04(neotic版本)从0实现Gazebo仿真slam建图 昨晚完成了ROS的多机通讯,还没来得及整理相关操作步骤,在进行实际小车的实验之前,还是先打算在仿真环境中进行测试,熟悉相关的操作步骤,计划通过虚拟机&…...
(JavaEE)(多线程案例)线程池 (简单介绍了工厂模式)(含经典面试题ThreadPoolExector构造方法)
线程诞生的意义,是因为进程的创建/销毁,太重了(比较慢),虽然和进程比,线程更快了,但是如果进一步提高线程创建销毁的频率,线程的开销就不能忽视了。 这时候我们就要找一些其他的办法…...
单播与多播mac地址
MAC 地址(Media Access Control Address)是一个用于识别网络设备的唯一标识符。每个网络设备都有一个独特的 MAC 地址,用于在局域网中进行通信。 单播MAC地址:单播MAC地址用于单播通信,即一对一的通信模式。当设备发送…...
反向动力学Ik学习
参考文章:(非本人原创) 英文原文:Inverse Kinematics Techniques in Computer Graphics: A Survey (andreasaristidou.com) 知乎翻译文章: 【游戏开发】逆向运动学(IK)详解 - 知乎 (zhihu.co…...
基于Levenberg-Marquardt算法的声源定位matlab仿真
目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 .................................................................... %ML if (bML1)varxs…...
vscode的Emmet语法失效
解决方案:设置 -> 搜索Emmet -> 勾选 Emmet:Trigger Expansion On Tab和Emmet: Use Inline Completions -> 重启 注:Emmet语法是vscode自带的语法,可以快速生成HTML结构/CSS样式/格式化语法 Emmet语法 参考:关于vscode使…...
堆排序(大根堆)
堆的定义如下,n个关键字序列[1...n]称为堆,当且仅当满足: a(i)>a(2i)且a(i)>a(2i1) 这个为大根堆 a(i)<a(2i)且a(i)<a(2i 1) 这个为小根堆 通过建堆得到大根堆 大根堆 87,45,78,32,17,65,53,9 可以看成 …...
Mybatis学习笔记3 在Web中应用Mybatis
Mybatis学习笔记2 增删改查及核心配置文件详解_biubiubiu0706的博客-CSDN博客 技术栈:HTMLServletMybatis 学习目标: 掌握mybatis在web应用中如何使用 Mybatis三大对对象的作用域和生命周期 关于Mybatis中三大对象的作用域和生命周期、 官网说明 ThreadLocal原理及使用 巩…...
软件测试之功能测试详解
一、功能测试概述 1)功能测试就是对产品的各功能进行验证,根据功能测试用例,逐项测试,检查产品是否达到用户要求的功能。 2)功能测试,根据产品特性、操作描述和用户方案,测试一个产品的特性和…...
javascript选取元素的范围,可以包含父级,也可以不包含父级
//函数可以选取元素的范围,对于要选取文本的非常方便,或选取特定的子节点 function getRange(element){//判断是否支持range范围选取var supdocument.implementation.hasFeature("Range","2.0");var also(typeof document.createRan…...
QGIS怎么修改源代码?持续更新...
修改配置文件保存位置 修改目的:放着和本地安装的其他QGIS共用一份配置文件 修改文件:core/qgsuserprofilemanager.cpp 修改位置:第37行 return basePath QDir::separator() "my_profiles";修改完毕后,再次生成一下…...
dev board sig技术文章:轻量系统适配ARM架构芯片平台
摘要:本文简单介绍OpenHarmony轻量系统移植,会分多篇 适合群体:想自己动手移植OpenHarmony轻量系统的朋友 开始尝试讲解一下系统的移植,主要是轻量系统,也可能会顺便讲下L1移植。 1.1移植类型 OpenHarmony轻量系统的…...
MyBatis之增删查改功能
文章目录 一、创建各种类二、MyBatis的各种功能 1、查询<select>2、增加<insert>3、修改<update>4、删除<delete>三、总结 前言 在MyBatis项目中编写代码实现对MySql数据库的增删查改 一、创建各种类 1、在Java包的mapper文件下创建一个接口 我创建…...
Leetcode算法入门与数组丨5. 数组二分查找
文章目录 1 二分查找算法2 二分查找细节3 二分查找两种思路3.1 直接法3.2 排除法 1 二分查找算法 二分查找算法是一种常用的查找算法,也被称为折半查找算法。它适用于有序数组的查找,并通过将待查找区间不断缩小一半的方式来快速定位目标值。 算法思想…...
拓扑关系如何管理?
在设备对接涂鸦的云端过程中,一部分设备由于自身资源或硬件配置,无法直接连接云端。而是需要通过网关进行中转,由网关代理实现和云端进行数据交互,间接实现设备接入云端。这样的设备也称为子设备。 要想实现网关代理子设备接入云…...
vue的由来、vue教程和M-V-VM架构思想、vue的使用、nodejs
vue vue的由来 vue教程和M-V-VM架构思想 vue的初步简单使用 nodejs vue的由来 # 1 HTML(5)、CSS(3)、JavaScript(ES5、ES6、ES11):编写一个个的页面 -> 给后端(PHP、Python、Go、Java) -> 后端嵌入模板语法 -> 后端渲染完数据 -> 返回数据给前端 ->…...
课程表 循环依赖 拓扑排序 go语言
学会拓扑排序题目的基本解法 res数组 记录上课顺序g 记录学了课程i 能解锁的课程jindeg 记录每个课程的入度q 记录入度为0的课程 for循环q去解放其他课程 本题来自力扣课程表 func findOrder(numCourses int, prerequisites [][]int) []int {res : []int{}//建一个二维数组记…...
【红包雨接口设计】
一、服务器地址 http://rb.atguigu.cn 二、公共请求头参数 参数名称类型是否必选描述tokenString是用户唯一标识 备注:为了方便我们今天演示,服务端接受所有token。 三、接口 1. 创建红包雨 请求方式:GET请求地址:/api/v1/se…...
SSL证书到期更换证书会影响排名吗?
在现代的数字化时代,网络安全和用户体验成为了网站运营商和开发者们需要高度关注的问题。SSL证书作为一种重要的安全协议,对网站的安全性和用户信任起着至关重要的作用。然而,随着SSL证书的有效期限届满,许多网站运营商面临着更换…...
前端常用库之-JavaScript工具库lodash
文章目录 前端常用库之-JavaScript工具库lodash一、什么是lodash二、安装三、lodash使用Lodash 的 pick() 函数介绍和使用react 实例demo:pick结合...展开运算符(spread operator) 前端常用库之-JavaScript工具库lodash 一、什么是lodash 官网: https:…...
Linux- execve()
execve() 是 Linux/UNIX 中的 exec 函数家族中的一个,它允许进程执行一个新的程序。具体地,execve() 替换当前进程的映像为新的程序映像。 函数原型如下: int execve(const char *pathname, char *const argv[], char *const envp[]);pathn…...
007 数据结构_堆——“C”
前言 本文将会向您介绍关于堆Heap的实现 具体步骤 tips:本文具体步骤的顺序并不是源代码的顺序 typedef int HPDataType; typedef struct Heap {HPDataType* _a;int _size;int _capacity; }Heap;初始化 void HeapCreate(Heap* hp, HPDataType* a, int n) {hp-&…...
zabbix的原理与安装
一、Zabbix介绍 1、zabbix 是什么? zabbix是一个开源的IT基础监控软件,能实时监控网络服务,服务器和网络设备的状态,如网络使用,CPU负载、磁盘空间等,主要是包括数据的收集、报警和通知的可视化界面zabbi…...
ReactNative中升级IOS 17版本Crash解决
ReactNative中升级IOS 17版本Crash解决 ReactNative中升级IOS 17版本Crash解决一、问题描述二、原因分析三、解决方案决策3.1 设置宽高为非零值3.2 使用新的UIGraphicsImageRenderer替换就版本的UIGraphicsBeginImageContext 四、可能使用到该API的三方库4.1 react-native-fast…...
MongoDB详解
一、MongoDB概述 MongoDB 是一个基于 分布式文件存储 的开源 NoSQL 数据库系统,由 C 编写的。MongoDB 提供了 面向文档 的存储方式,操作起来比较简单和容易,支持“无模式”的数据建模,可以存储比较复杂的数据类型,是一…...
【SpringCloud微服务全家桶学习笔记-服务注册zookeeper/consul】
SpringCloud微服务全家桶学习笔记 Eureka服务注册 gitee码云仓库 9.其他服务注册框架 (1)zookeeper安装与使用 zookeeper需安装在虚拟机上,建议使用CentOS,安装地址如下: zookeeper镜像源 选择第一个进入后下载ta…...
【滑动窗口】LCR 016. 无重复字符的最长子串
LCR 016. 无重复字符的最长子串 解题思路 窗口内的字符串就是不重复子串每次遇到新的字符 看看窗口内是否存在该字符 如果存在直接剔除 然后调整窗口左边界不存在 添加窗口内部 右边界 class Solution {public int lengthOfLongestSubstring(String s) {if(s.length() < …...
何为网站开发/seo优化推广流程
1.系统崩溃会让工作中断,有时会中断几个小时各种各样的病毒感染、系统故障、硬盘损坏会导致工作系统崩溃。 不得不中断工作 我们要花费很长时间来恢复系统。 1、如果是重新安装,那可能需要花费几个小时的时间。 2、即使是有系统恢复软件帮助&…...
天津品牌网站建设公司/app怎么推广运营
目录 【JeecgBoot-Vue3】零基础入门 - 首页 一、场景 二、树结构表CRUD Step 1:新增表 Step 2:填写 表名 > 表描述 Step 3:新增字段 > 数据库属性 Step 4:新增字段 > 页面属性 Step 5:保存ÿ…...
做网站的毕设用什么软件/手机百度app安装下载
写在前面:之前已经复习回顾了《JUC》有关知识。接下来就准备下常见的多线程有关的面试题吧。1.并行和并发有什么区别?并发:你有处理多个任务的能力,但并不一定要同时。并行:你有同时处理多个任务的能力。最关键的点就是…...
b2c电子商务网站的收益模式主要有/泉州排名推广
帮助您构建高质量的应用,是我们长期努力的一个方向。为此,我们经常寻找可以在工具和资源上投入精力的领域,这些工具和资源可以使您更加深刻地了解应用的性能。重大更新在 Android 11 上,我们引入了两个新工具——"数据访问审…...
汉南网站建设/最新中国新闻
class Solution { public:vector<int> decode(vector<int>& encoded, int first) {int n encoded.size();vector<int> res(n 1);res[0] first;for(int i 1; i < n; i) {res[i] encoded[i - 1] ^ res[i - 1];}return res;} };...
三站合一 网站建设/深圳关键词优化公司哪家好
玩python的人大都在linux下进行开发,由于长期习惯在windows下开发代码,今天蛋疼尝试在window7下配置python2.7tornado3.3开发环境,必然的中间遇到各种报错,但是最终还是配置成功了,发帖方便网友少走弯路.开工! 前提: p…...