当前位置: 首页 > news >正文

用AI的视角看世界

前言

2024年将是Ai人工智能在各个行业垂直领域发展的元年。

随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。

回顾历史,互联网的兴起、电商的兴起、短视频的兴起,每次时代的变革都将带来很多巨大的机会和红利。

2023年到现在几乎所有大型的互联网公司都在all in人工智能,不仅互联网公司,很多行业里的大型企业也开始布局。

随着去年2023年到现在一年的发展,这个领域更新迭代的速度非常之快,在自然语言处理、图像生成、图像识别、视频生成、文生图、文转3D、特征提取、文子转语音、等等等方面都成长出很多大模型。

一年的时间已经形成了像github这样的,在人工智能领域的开源社区huggingface,在全球开发者和互联网公司的助力下,它发展非常之快,huggingface目前的模型数量已经达到了快60万。

这个领域是充满无限可能和魅力的,虽然很多技术目前还处于成长阶段。

接下来谈一下我对这个领域目前的一个认知和未来发展的一个分析,包括对目前很多的中小型创业公司在经历这次变革有可能存在哪些机会。

在切入正题前先需要对大语言模型(LLM)基础与发展有一个基础的认知。

LLM自然语言模型

LLM(Large Language Model)大语言模型是人工智能领域中一种强大的自然语言处理模型,其发展历史可以追溯到词向量、词嵌入技术的出现,逐步演进到对句子和文本的理解,最终实现了对复杂语境的全面理解和生成。

国内外主要LLM发布时间及特点介绍


​ ​
通过上图可以发现国内的大模型全部都是在2023年爆发,国外最早的也是2019年发布。

这些庞大的大语言模型基座只有大公司才有实力进行研发训练,原因是训练成本非常大,还需要有机器学习、深度学习方面技能人才储备。

公开数据GPT-3.5的成本(481万美元)。

所以企业或者其他公司如果想拥有这样的大模型或者接入这个功能就存在很多限制:

1自己搞一个成本是非常巨大的。
2调用这些巨头科技公司的api接口,是按token收费的,一个字等于2个token。
3还有就是企业数据安全问题,尤其是国企政务方面,很多数据都是私有化,不可能放到公网上面。

到这儿会发现这个语言大模型只是有一定的智能对话能力,只是比搜索引擎能够更快的得答案,用久了还会发现它还存在一些弊端,例如不具备记忆能力,和它沟通它只能记得当前的上下文内容,还有实时信息更新慢,新旧知识难以区分,无法灵活操控外部系统,无法为领域问题提供专业靠谱的答案。

还是没办法像移动互联网时代,像手机和app那样被广泛的应用开。

但是随着2023年5-6月份LLaMA语言模型7B、13B、30B、33B、65B的开源(而且允许商用)。使用这个领域发生了变化,因为它的开源使得大模型的算法壁垒快速消失,而且在极短的时间里经过很多实践和验证,百亿参数(1B=10亿参数)是可以像那些千亿参数的基座大模型一样涌现智能,并且在小模型在经过微调后在某些领域甚至超过那些千亿参数的大模型。

至此,整个AI开源社区开始百花齐放,小参数模型的性能快速崛起,随后一些大的公司也发布并开源了自己百亿参数的模型,想快速建立属于自己的AI模型生态圈。

这就意味着应用开发者和中小型科技公司可以用很小成本去测试、部署、打磨一个私有化的大模型,通过微调+rag它的知识库,变成自己的智能问答助手。

目前已经有很多公司在做产模一体化的应用推进和落地了,只是信息差和市场目前还没有全面打开。这只是快速落地开始,也是大爆发时代来临的前夜,我相信随着ai模型的不断普及和技术的突破,ai模型以后部署的成本会越来越低运用技巧也会越来越成熟。

如果国内可以解决算力(也就是GPU)卡脖子这个问题,将来使用国产的显卡进行训练和推理,成本会更低。这个目前国内已经有了成熟的案例,例如清华和质谱AI退出的chatglm3语言模型就可以使用国产华为昇腾910计算芯片进行推理和训练。

多智能体协同Agent

再聊一下关于模型、业务应用、数据调用、工具之间的一个沟通问题,也就是AI+行业的产品这条路该怎么走,这个目前还处于一个混沌和快速崛起的时候。

因为单自然语言模型是不具备反思、运用工具、规划、多智能体协同(也就是多模型协同)能力,它只能输出它现有知识库的内容,虽然现在通过向量数据库可以很快的更新模型的知识体系,但它也只能应用在智能客服、智能问答库对话形式的这些领域。

怎么可以让智能体像人一样遇到问题遇到失败去反思,通过反思可以去协同其它智能体或者工具或者外部的数据去再次规划然后决策做出行动,最后输出结果或者执行。

其实目前已经有解决这个问题的方向,就是Agent,翻译过来就是代理,首先Agent不是一个技术,它是一个概念。

最近特别火的Devin(AI实现自动写代码)就是Agent的落地产品,要实现类似Devin这样的智能体,就得至少实现大脑、角色定义、工具的使用、标准化流程四项能力。

想象一下现实中如果一个产品应用落地需要什么,老板提出需求、产品经理分析需求指定方案、前端ui设计、最后给到程序员落地为产品,最后进入测试阶段。而且在程序开发过程中还会遇到问题,会给产品经理进行反馈,这就意味着Devin光角色就得定制最少3个(程序员、产品经理、测试),模型还得具有相互反馈修正的功能,可以想象一下里面的逻辑还是有技术壁垒的。所以从技术上讲目前对于大多数科技公司实现这四件事还是有很大难度。这个技术目前是最前沿的,而且还处于时间成长阶段,能够掌握和精通的是极少数一部分人。

技术方面让模型和应用结合的框架目前优选就是AutoGpt、Metagpt、LangChain,由于其架构设计较为先进且具有高度模块化的特点,对于初次接触该框架的开发者来说,理解和掌握如何配置、串联各个组件以达到预期效果可能需要一定的时间投入和学习成本。而且它们目前的文档还不是很完善,没有中文文档,能力有限的开发人员遇到问题缺乏解决渠道,还有就是它们缺乏大型的工业化应用实践,没有经历充分的检验。

但是我相信,Agent也会和2022年11月发布的chatGPT一样,一年的时间里快速崛起,因为这个领域技术的发展太快了,几个月就会冒出一个新东西,拭目以待,以后各个领域的企业和公司,包扩政务以及传统行业都会诞生非常优秀的产模一体化的产品应用,非常有可能就在未来的三年。

变革的机会

产模一体化的关键还是承上启下,上是目前百花齐放的各种语言模型、图像识别、文生图、文生视频等,去做这些东西需要有一定的技术积累和大量研发成本,难度很大,往下就是app+api千行百业学会使用AI怎么运用AI,达到降本增效,这里面呢难度低,机会大,也是大多数科技公司、应用开发、创业公司的突破口。

那么作为企业和创业公司或者个人面对这样的变革应该怎么做呢?

1)    关注人工智能领域最新研究成果、技术动态以及市场报告,深入理解AI技术的发展趋势及其在各行业的应用案例,通过案例分析获取思路,这也是一种快速的学习法,获取目标、拆解、分析、输出、总结。
2)    具备垂直领域百亿参数模型的独立部署和微调能力,最好对模型的深层次有一个基础的了解,涉及数学概率论、统计方法、机器学习、科学计算、神经网络、Transformer模型、训练与优化等等。
3)    用AI的视角看世界,也是这篇文章的核心主题。

我觉着最先受益的应该是那些拥有庞大企业数据以及具备标准化流程的企业,因为它们深耕垂直行业,具备先天优势,除了同行是不具备竞争对手的,而且大多数企业不具备自己的AI技术团队。想象一下,如果可以通过人工智能降低企业的人工成本、流程成本、生产成本,谁落后谁就会渐渐退出舞台。

还有就是在某专业领域具备核心竞争知识库的公司和个人,完全可以打造一个属于他个人的私有化辅助教,解放自己,让智能助手去帮住需要帮助的人。说到这儿可以想象一下,有可能这么多年的教育模式都会发生改变,很多公司很多企业客服这个部门可能只有几个员工甚至没有员工。

转载请注明出处。。。
 

相关文章:

用AI的视角看世界

前言 2024年将是Ai人工智能在各个行业垂直领域发展的元年。 随着2022年11月openai 的大语言模型chatgpt3.5的诞生,已经预示着互联网时代,移动互联网时代即将迎来新的变革,也预示着web3.0和元宇宙更近了一步。 回顾历史,互联网的…...

MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64)

MATLAB 自定义实现点云法向量和曲率计算(详细解读)(64) 一、算法介绍二、算法步骤三、算法实现1.代码 (完整,注释清晰,可直接用)2.结果一、算法介绍 首先说明: ------这里代码手动实现,不调用matlab提供的法向量计算接口,更有助于大家了解法向量和曲率的计算方法,…...

拯救鲨鱼!Helping wireshark!wireshark未响应解决方法

前言 做题的的时候 在用wireshark解密tls秘钥的时候 我的小鲨鱼突然未响应了 然后我多次尝试无果 并且殃及池鱼 我电脑上所有的流量包都打不开了?!!! 于是乎 尝试删了重下 还是未响应 开始怀疑电脑 重启电脑两次 还是打…...

设计模式之责任链讲解

责任链模式适用于需要将请求和处理解耦的场景,同时又需要动态地组织处理逻辑的场景。 通过使用责任链模式,可以实现请求的动态处理、灵活的扩展和简化的代码编写,提高系统的可维护性和可扩展性。 一、责任链入门 以下这是GPT生成的责任链代…...

K8s: 将一个节点移出集群和相关注意事项

前置步骤 在Kubernetes集群中,要移出一个节点,你需要执行以下步骤: 1 )将节点标记为不可调度 首先,你需要将目标节点标记为不可调度,以确保Kubernetes不会在该节点上调度新的Pod这可以通过执行以下命令实…...

Python学习笔记24 - 学生信息管理系统

1. 需求分析 2. 系统设计 3. 系统开发必备 4. 主函数设计 5. 学生信息维护模块设计 a. 录入学生信息 b. 删除学生信息 c. 修改学生信息 d. 查询学生信息 e. 统计学生总人数 f. 显示所有学生信息 g. 排序模块设计 6. 项目打包...

【物联网应用案例】某制造企业电锅炉检测项目

供暖行业在我国的经济发展中占据着重要的地位,然而,长期以来,该行业存在着自动化水平低、管理效率不高等问题,制约了其持续发展。为了解决这些问题,吉林某电锅炉生产厂家进行了一项创新性的尝试。 该厂家通过集成物联…...

设计模式实践

结合设计模式概念和在java/spring/spring boot中的实战,说明下列设计模式。 一、工厂模式 这里只讲简单工厂模式,详细的可以参考Java工厂模式(随笔)-CSDN博客。工厂类会根据不同的参数或条件来决定创建哪种对象,这样…...

嵌入式学习52-ARM1

知识零散: 1.flash: nor flash 可被寻地址 …...

Java(MySQL基础)

数据库相关概念 MySOL数据库 关系型数据库(RDBMS) 概念: 建立在关系模型基础上,由多张相互连接的二维表组成的数据库。特点: 使用表存储数据,格式统一,便于维护使用SQL语言操作,标准统一,使用方便 SQL SOL通用语法…...

预约系统的使用

预约系统的使用 目录概述需求: 设计思路实现思路分析1.用户年规则 在 预约系统中的使用流程 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy,skip hardness,make a better result,wa…...

酷开科技OTT大屏营销:开启新时代的营销革命

随着互联网技术的不断发展和普及,大屏已经成为越来越多家庭选择的娱乐方式。在这个背景下,酷开科技凭借其强大的技术实力和敏锐的市场洞察力,成功地将大屏转化为一种新的营销渠道,为品牌和企业带来了前所未有的商业机会。 酷开科技…...

网络安全(防火墙,IDS,IPS概述)

问题一:什么是防火墙,IDS,IPS? 防火墙是对IP:port的访问进行限制,对访问端口进行制定的策略去允许开放的访问,将不放开的端口进行拒绝访问,从而达到充当防DDOS的设备。主要是拒绝网络流量,阻断所有不希望出现的流程,禁止数据流量流通,达到安全防护的作用。如将一些恶…...

安装IntelliJ IDEA插件教程

安装IntelliJ IDEA插件:一份详细指南 在提升IntelliJ IDEA开发效率的过程中,插件扮演着不可或缺的角色。它们为IDE提供了额外的功能和工具,以满足开发者在特定编程语言、框架、测试、版本控制等方面的个性化需求。本文将为您详细阐述如何在I…...

大厂基础面试题(之四)

Q1:请先进行自我介绍 Q2:说下你学习前端的详细过程 Q3:一个页面从url输入到显示页面的整个过程 1.URL解析 2.DNS解析 3.建立TCP连接 4.发起HTTP请求 5.服务器处理请求 6.返回HTTP响应 7.下载页面资源 8.解析和渲染页面 9.JavaScript执行 10…...

为什么我们应该切换到Rust

What is RUST? 什么是Rust? Rust is a programming language focused on safety, particularly safe concurrency, supporting functional and imperative-procedural paradigms. Rust is syntactically similar to C, but it provides memory safety without usi…...

基于Linux定时任务实现的MySQL周期性备份

1、创建备份目录 sudo mkdir -p /var/backups/mysql/database_name2、创建备份脚本 sudo touch /var/backups/mysql/mysqldump.sh# 用VIM编辑脚本文件,写入备份命令 sudo vim /var/backups/mysql/mysqldump.sh# 内如如下 #!/bin/bash mysqldump -uroot --single-…...

【Altium Designer 20 笔记】隐藏PCB上的信号线(连接线)

使用网络类隐藏特定类型的信号线 如果你想要隐藏特定类型的信号线(例如电源类),你可以首先创建一个网络类。使用快捷键DC调出对象类浏览器,在Net Classes中右击添加类,并重命名(例如为“Power”&#xff0…...

【Git教程】(九)版本标签 —— 创建、查看标签,标签的散列值,将标签添加到日志输出中,判断标签是否包含特定的提交 ~

Git教程 版本标签(tag) 1️⃣ 创建标签2️⃣ 查看存在的标签3️⃣ 标签的散列值4️⃣ 将标签添加到日志输出中5️⃣ 判断tag是否包含特定的提交🌾 总结 大多数项目都是用 1.7.3.2和 “ gingerbread” 这样的数字或名称来标识软件版本的。在 …...

MemberPress配置和使用会员登录页面

目录 隐藏 创建会员登录页面 编辑登录页面 设计您的登录页面 链接到您的登录页面 创建会员登录页面 要创建MemberPress会员登录页面,您需要做的就是导航到 MemberPress > 设置 > 页面选项卡,然后在页面顶部附近的“MemberPress 登录页面”…...

分享一个预测模型web APP的功能模块和界面的设计

一个临床预测模型web APP功能模块与界面设计 随着医疗技术的不断进步,web APP是临床预测模型在医学领域的应用的重要形式。这里分享一个web APP的设计,手里有医学预测模型的可以尝试将其构建成webAPP,进而在临床实践中体验预测模型带来的便利…...

智慧公厕是智慧城市建设中不可或缺的一部分

智慧城市的数字化转型正在取得显著成效,各项基础设施的建设也在迅速发展,其中智慧公厕成为了智慧城市体系中不可或缺的一部分。作为社会生活中必要的设施,公共厕所的信息化、数字化、智慧化升级转型能够实现全区域公共厕所管理的横向打通和纵…...

leetcode热题100.爬楼梯(从二进制到快速幂)

Problem: 70. 爬楼梯 文章目录 题目思路Code复杂度 题目 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢? 示例 1: 输入:n 2 输出:2 解释:有两种方…...

使用Docker定时备份数据

文章目录 一、Docker镜像制作二、MySQL数据备份三、Minio数据备份四、数据跨服务器传输五、Nginx日志分割六、Docker启动七、Docker备份日志 一、Docker镜像制作 镜像制作目录 mc下载地址 - rsyncd.conf # https://download.samba.org/pub/rsync/rsyncd.conf.5port 873 uid …...

conda搭建与管理python环境

conda搭建与管理python环境.md Anaconda下载地址Miniconda下载地址Linux下安装1.执行安装2.查看可安装的python版本3.创建环境4.激活环境5.安装python的工具包5.退出环境6.删除指定的环境7.设置默认的环境 Window下安装1.执行安装2.配置环境变量3.检查是否安装成功4.通过conda配…...

获取当前的年、月、日、时、分、秒,并将这些信息用作保存 Excel 文件的前缀

要获取当前的年、月、日、时、分、秒,并将这些信息用作保存 Excel 文件的前缀,你可以使用 Python 的 datetime 模块来获取当前时间,并格式化时间字符串,然后使用 pandas 库将数据保存为 Excel 文件。示例代码: from d…...

Gitlab全量迁移

Gitlab全量迁移 一、背景1.前提条件 一、背景 公司研发使用的Gitlab由于服务器下架需要迁移到新的Gitlab服务器上。Gitlab官方推荐了先备份然后再恢复的方法。个人采用官方的另外一种方法,就写这篇文章给需要的小伙伴参考。 源Gitlab: http://old.mygitlab.com #地…...

Golang ProtoBuf 初学者完整教程:语法

一、编码规范推荐 1、文件名使用小写下划线的命名风格,例如 lower_snake_case.proto 2、使用 2 个空格缩进 3、包名应该和目录结构对应 4、消息名使用首字母大写驼峰风格(CamelCase),例如message StudentRequest { ... } 5、字段名使用小写下划线的风格…...

使用.cc域名的优势

域名注册越来越难了,很多人选择结尾加123、56、365等等数字,总感觉怪怪的。那么能不能选择其他后缀的域名呢?我感觉可以,大部分用户都不会去看域名,只有做技术的会去关注。 使用.cc域名的优势 很多好域名,…...

存储器管理单元MMU概述

在ARM系统中,存储器管理单元MMU主要完成以下工作: ● 虚拟存储空间到物理存储空间的映射。在ARM中采用了页式虚拟存储管理。它把虚拟地址空间分成一个个固定大小的块,每一块称为一页,把物理内存的地址空间也分成同样大小的页。页…...

手机网站优化指南/优秀营销软文范例300字

C# 中一切都是对象,对于文件操作,主要有两个静态类,分别是:File 和 Directory。 1. File 操作文件,静态类,对文件进行操作。拷贝、删除、剪切;2. Directory 操作目录(文件夹&#…...

banner图片怎么设计网站/百度推广助手电脑版

最近两天在学习GBDT,看了一些资料,了解到GBDT由很多回归树构成,每一棵新回归树都是建立在上一棵回归树的损失函数梯度降低的方向。 以下为自己的理解,以及收集到的觉着特别好的学习资料。 1、GBDT可用于回归任务和分类任务。 GBDT…...

php做动态网站/游戏推广论坛

我有一个数据帧序列看起来像这样-a b r1 43 630 587d b c1 34 30 87我想创建一个新的数据帧,它看起来像-^{pr2}$我用了密码-appended_data pd.concat(appended_data, axis0)其中,附加的“数据”列表包含单个数据帧系列作为元素。以前当我将它与其他数据集…...

真正做新闻网站/站内seo和站外seo区别

1.首先IP地址为:10.20.105.145 方法1: 1.用wps有个双面打印,然后打印完需要把打印完单面的纸给纵向翻转,让有字体的那一面朝上,并且字的朝向为右,最后一步就是把这些纸的最上面的挪到最下面,依…...

大连市网站制作电话/新东方线下培训机构官网

在使用php开发之中大家都习惯使用gb类库来处理图像信息,但是函数很多的gb类库也是很头疼,使用起来要一个个的查询函数和看官方手册,下面将介绍一个很强大的图像处理工具----ImageMagick,这个在liunx下面处理图像信息将会更简洁。先…...

网站的购物车怎么做/全国seo搜索排名优化公司

问题 在序列化枚举字段的时候,出现只序列化一个string的枚举名字。这对于普通java枚举类问题不大的,但是对于稍复杂一点java枚举类,就会出现字段丢失的情况。例如,如下枚举类: import com.fasterxml.jackson.annotati…...