当前位置: 首页 > news >正文

轻松搭建AI应用的三个大模型技术路线

时下聊起AI,想必最热的就是使用AI+的应用(chatGPT,文心一言等)来提升自己工作的效率,比如破局俱乐部,洋哥带领星球2万多人开启大航海,教人使用这一波新起的应用进行赚钱与赋能。

在我的视角来看,当下仍然是前期的红利,现在这趟车就像是凌晨的**“高铁检测车”**,是先行军,估计在2024年才会迎来真正的爆发。

今天的话题,就相当于大模型应用大爆发前的“闪电”,我们将从技术介绍,适用边界,操作步骤应用示例来聊聊三个大模型技术路线,帮助你开阔它背后的秘密:

  1. 指令工程技术
  2. 表示学习和检索技术
  3. fine-tune(微调)技术

01

指令工程技术

谈起指令工程,用过chatGPT,文心一言等等对话式AI应用的你并不陌生,就是通过输入prompt指令,来达到输出你想要的文字,图片或者视频。

更专业的大厂在去年6月爆发式的招收过一批prompt engineer,他们的作用就是不断的调整指令来搭建不同的领域型应用。比如AI心理医生,AI聊天助手等等。

当时我搭建过一个AI苏格拉底,聊起来颇有压力。但聊着聊着就我就发现它不知道自己是谁了,这也是这种技术的限制。

**技术难度:**⭐️⭐️

**适用边界:**适用于可以被简洁指令描述的任务,如内容创作(文章、故事、代码)、问题解答、推理分析等。

**实施步骤:**输入指令词。尽量使用结构化提示词:背景,角色,目标和任务。

应用示例:

**
**

图片

02

表示学习和检索技术

表示学习和检索技术是互相配合的两种技术。

图片

(来源于网络)

表示学习是指将文本、图片等数据转化为数学向量,这些向量能够捕获原始数据背后的语义信息。

检索技术则是利用这些向量化后的数据进行高效查找相似内容的过程。

简单来说,就是我们可以自己“投喂”自己家的知识库进去了,整个运作机制是先检索自己的知识库,通过向量运算来将距离最近的结果返回前给用户。

**技术难度:**⭐️⭐️⭐️⭐️

适用边界:

主要用于搜索、推荐、问答系统等领域,解决模糊查询、相关性匹配等问题。

(构建表示学习和检索系统需要一定的机器学习基础和专业知识,涉及深度学习模型搭建、向量数据库管理和索引算法等方面。)

实施步骤:

第一步:准备知识库

第二步:运用深度学习模型将文本或其他类型的数据转换为向量;

第三步:将这些向量存储在专属的向量数据库中;

第四步,当用户发起查询时,计算查询向量与数据库内所有向量的距离,找出最相近的结果返回结果。

应用示例:

在新闻推荐系统中,系统可以将用户的历史阅读行为和新闻标题转为向量,然后快速找到与用户兴趣相关的最新文章推荐给用户。

03

Fine-tune(微调)技术

Fine-tune俗称 “微调”,就是“借用”预训练模型的强大基础,通过少量额外训练让它掌握更专业、更精细的技能,从而解决实际问题的一种高效策略。

图片

(来源于网络)

打个比方,就像是让你的孩子在已经学会基础数学知识之后,再针对某个专门的数学奥林匹克竞赛进行针对性训练的过程。从而对某一个细分领域有更深的掌握。

**技术难度:**⭐️⭐️⭐️⭐️

适用边界:

适用于各种定制化的自然语言处理任务,包括但不限于情感分析、文本分类、命名实体识别以及特定领域的问答系统等。

(Fine-tune需要具备一定的机器学习实践经验和数据集准备能力,但许多平台提供了便捷的微调工具和教程,降低了入门门槛。)

实施步骤:

第一步:选用一个适合的预训练大模型作为基础;

第二步:收集并整理用于特定任务的数据集;

第三步:在该数据集上对预训练模型进行额外训练(微调),以使模型更适应特定场景;

第四步:评估微调后的模型在验证集上的表现,并根据需求持续优化。

应用示例:

若要创建一个餐厅评论的情感分析工具,可以采用预训练的语言模型并对其进行fine-tune,使其学会准确地判断评论中的情感极性和倾向性。

最后的话

简单做个总结,指令工程是当下最简应用的一个实施路线,但它用的是基于某个大模型的原生知识,并且会受制于token等类型限制,会导致回复前后不一致的情况,不太适合商用。

表示学习与检索技术专注于从大量文本中提取和利用语义表示以支持高效的检索和相似性比较。

微调技术则是在预训练模型的基础上进一步优化模型能力,使其更精准地完成特定的自然语言处理任务。

对比表示学习和检索技术和Fine-tune技术,这两个技术实现的应用则更加灵活,通过知识库就可以调整输出内容的专业度,达到商用目的。应用这两种技术实施的团队至少得3个人:算法,全栈开发和产品。

人好找,技术路线也好定,此时比拼的就是数据的质量和数量了。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

相关文章:

轻松搭建AI应用的三个大模型技术路线

时下聊起AI,想必最热的就是使用AI的应用(chatGPT,文心一言等)来提升自己工作的效率,比如破局俱乐部,洋哥带领星球2万多人开启大航海,教人使用这一波新起的应用进行赚钱与赋能。 在我的视角来看…...

Vue01-vue的简介

一、Vue是什么? 一套用于构建用户界面的渐进式javaScript框架。 构建用户界面: 渐进式: 目前Vue的地位:生态完善,国内前端工程师必备技能。 二、Vue的特点 一个XXX.vue就是一个组件,封装的概念&#xff0c…...

leetcode455.分发饼干、376. 摆动序列、53. 最大子序和

455.分发饼干 为了满足更多的小孩,就不要造成饼干尺寸的浪费 大尺寸的饼干既可以满足胃口大的孩子也可以满足胃口小的孩子,那么就应该优先满足胃口大的 这里的局部最优就是大饼干喂给胃口大的,充分利用饼干尺寸喂饱一个,全局最…...

JVM的内存结构

JVM 内存结构 方法区: 方法区主要用于存储虚拟机加载的类信息、常量、静态变量,以及编译器编译后的代码等数据。 程序计数器 由于在JVM中,多线程是通过线程轮流切换来获得CPU执行时间的,因此,在任一具体时刻,一个CP…...

轻量管理内核复杂级别的项目

在嵌入式开发中,管理大型项目(例如Linux内核)往往是一个复杂的过程。常规的版本控制系统如Git在处理小型项目时非常高效,但面对庞大的代码库时可能会显得笨重且占用大量存储空间。本文将介绍几种轻量级的方法来管理内核级别的项目…...

【wiki知识库】05.分类管理模块--后端SpringBoot模块

📝个人主页:哈__ 期待您的关注 目录 一、🔥今日目标 二、☀SpringBoot代码修改 1.使用逆向工程生成Category表结构 2. 新增CategoryQueryParam 3.新增CategorySaveParam 4.新增CategotyQueryVo 三、🤖新增分类管理的相关接口…...

资源目录与云SSO

1、开启资源目录 2、创建资源文件夹(根据公司业务划分) 3、资源文件夹内创建或邀请成员 4、创建管控策略(类型访问控制权限授权方法,可以授权给指定给资源文件夹或资源文件夹内成员) 5、可信服务-委派管理员账号数量 …...

ChatGPT AI专题资料合集【65GB】

介绍 ChatGPT & AI专题资料合集【65GB】 🎁【七七云享】资源仓库,海量资源,无偿分享√...

Linux 编译安装python

以deepin操作系统安装Python3.8.10为例。 下载 python3.8.10 官网下载 Linux要下载源码,进行编译。 下图tarball即tar包,是压缩包的意思。python官网给出两种压缩格式的tarball,下载哪个都可以。 方式一:直接点击链接下载 方式…...

2025 QS 世界大学排名公布,北大清华跻身全球前20

一年一度,2025 QS 世界大学排名公布! QS(Quacquarelli Symonds)是唯一一个同时将就业能力与可持续发展纳入评价体系的排名。 继去年 2024 QS 排名因为“墨尔本超耶鲁,新南悉尼高清华”而荣登微博热搜之后&#xff0c…...

clickhouse(十五、存储优化实践)

文章目录 背景问题定位优化方式排序键设计写入顺序压缩算法 DoubleDeltaLowCardinality避免使用Nullable 总结 背景 clickhouse集群容量告警,项目中某些表占据大量的存储空间,借此机会对ck的存储优化进行实践学习,并通过多种方式测试验证优化…...

ubuntu下搭建Supervisor

sudo apt update #安装 sudo apt install supervisor#启动 supervisord 服务: sudo systemctl start supervisor#关闭 supervisord 服务 sudo systemctl stop supervisor#重启 supervisord 服务 sudo systemctl restart supervisor#设置 supervisord 开机自启 sudo …...

在HTML和CSS当中运用显示隐藏

1.显示与隐藏 盒子显示:display:block;盒子隐藏: display:none:隐藏该元素并且该元素所占的空间也不存在了。 visibility:hidden:隐藏该元素但是该元素所占的内存空间还存在,即“隐身效果”。 2.圆角边框 在CSS2中添加圆角,我们不得不使用背景图像&am…...

Java基础27,28(多线程,ThreadMethod ,线程安全问题,线程状态,线程池)

目录 一、多线程 1. 概述 2. 进程与线程 2.1 程序 2.2 进程 2.3 线程 2.4 进程与线程的区别 3. 线程基本概念 4.并发与并行 5. 线程的创建方式 方式一:继承Thread类 方式二:实现Runable接口 方式三:实现Callable接口 方式四&…...

C#WPF数字大屏项目实战04--设备运行状态

1、引入Livecharts包 项目中&#xff0c;设备运行状态是用饼状图展示的&#xff0c;因此需要使用livechart控件&#xff0c;该控件提供丰富多彩的图形控件显示效果 窗体使用控件 2、设置饼状图的显示图例 通过<lvc:PieChart.Series>设置环状区域 3、设置饼状图资源样…...

IntelliJ IDEA安装

IntelliJ IDEA 的安装、配置与使用-简化版 一、IntelliJ IDEA 介绍 1.JetBrains 公司介绍 IDEA(https://www.jetbrains.com/idea/)是 JetBrains 公司的产品&#xff0c;公司旗下还有其 它产品&#xff0c;比如&#xff1a; ➢ WebStorm&#xff1a;用于开发 JavaScript、HT…...

铸铁机械5G智能工厂工业物联数字孪生平台,推进制造业数字化转型

铸铁机械5G智能工厂工业物联数字孪生平台&#xff0c;推进制造业数字化转型。工业物联数字孪生平台以5G技术为基础&#xff0c;通过工业物联网连接铸铁机械生产过程中的各个环节&#xff0c;运用数字孪生技术构建虚拟工厂&#xff0c;实现生产过程的实时监测、模拟与优化&#…...

rocketmq No route info of this topic 问题排查

Broker配置项 autoCreateTopicEnable true 如果是单节点(master),注释掉这里的配置 #有三个值&#xff1a;SYNC_MASTER&#xff0c;ASYNC_MASTER&#xff0c;SLAVE&#xff1b;同步和异步表示Master和Slave之间同步数据的机制&#xff1b; #brokerRole SYNC_MASTER Pytho…...

STEEL ——首个利用 LLM 检测假新闻的框架算法解析

1.概述 近年来&#xff0c;假新闻的泛滥确实对政治、经济和整个社会产生了深远的负面影响。为了解决这一问题&#xff0c;人们开发了各种假新闻检测方法&#xff0c;这些方法试图通过分析新闻内容、来源和传播方式来识别虚假信息。 然而&#xff0c;正如你所提到的&#xff0…...

【AREngine BUG 解决方法】无法获取有效的相机图像尺寸

近期拿了一台 华为mate20 Pro的手机&#xff0c;在运行AR示例的过程中出现了黑屏。 问题排查 SDK版本&#xff1a;com.huawei.hms:arenginesdk:3.7.0.3 定位 经排查&#xff0c;发现(ARCamera对象的相机内参) getImageDimensions()返回的图像尺寸的width和height都为0。 这…...

植物大战僵尸杂交版2.0.88最新版+防闪退工具V2+修改工具+高清工具

植物大战僵尸杂交版&#xff0c;不仅继承原作的经典玩法&#xff0c;而且引入了全新的植物融合玩法&#xff0c;将各式各样的植物进行巧妙的杂交&#xff0c;孕育出前所未有、功能各异的全新植物。 创新的杂交合成系统 游戏引入了创新的杂交合成系统&#xff0c;让玩家可以将不…...

面试题:说说你对 JS 中 this 指向的了解

面试题&#xff1a;说说你对 JS 中 this 指向的了解 JS 的代码执行环境分为严格模式和非严格模式&#xff0c;可以通过 use strict 打开严格模式&#xff0c;此时 JS 在语法检查上会更加严格。要讨论 JS 中的 this 指向问题&#xff0c;也要分为严格模式和非严格模式进行讨论。…...

分享一个实用的MySQL一键巡检脚本

今日分享一个实用的MySQL一键巡检脚本&#xff0c;脚本内容还不是很完善&#xff0c;后续会继续进行优化。大家可以先在测试环境执行&#xff0c;确认执行没问题后可以在生产环境进行操作&#xff0c;问题的可以私信我。 MySQL一键巡检脚本的作用主要是帮助数据库管理员快速且…...

【动手学深度学习】卷积神经网络CNN的研究详情

目录 &#x1f30a;1. 研究目的 &#x1f30a;2. 研究准备 &#x1f30a;3. 研究内容 &#x1f30d;3.1 卷积神经网络 &#x1f30d;3.2 练习 &#x1f30a;4. 研究体会 &#x1f30a;1. 研究目的 特征提取和模式识别&#xff1a;CNN 在计算机视觉领域被广泛用于提取图像…...

2024年数字化经济与智慧金融国际会议(ICDESF 2024)

2024 International Conference on Digital Economy and Smart Finance 【1】大会信息 大会时间&#xff1a;2024-07-22 大会地点&#xff1a;中国成都 截稿时间&#xff1a;2024-07-10(以官网为准&#xff09; 审稿通知&#xff1a;投稿后2-3日内通知 会议官网&#xff1a;h…...

kafka-消费者服务搭建配置简单消费(SpringBoot整合Kafka)

文章目录 1、使用efak 创建 主题 my_topic1 并建立6个分区并给每个分区建立3个副本2、创建生产者发送消息3、application.yml配置4、创建消费者监听器5、创建SpringBoot启动类6、屏蔽 kafka debug 日志 logback.xml7、引入spring-kafka依赖 1、使用efak 创建 主题 my_topic1 并…...

C++STL---list常见用法

C STL中的list list是C标准模板库&#xff08;STL&#xff09;中的一个序列容器&#xff0c;它实现了一个双向链表。与vector和deque相比&#xff0c;list支持快速的任意位置插入和删除操作&#xff0c;但不支持快速随机访问。 基本操作 创建和初始化 #include <list> …...

MQTT.FX的使用

背景 在如今物联网的时代下&#xff0c;诞生了许多的物联网产品&#xff0c;这些产品通过BLE、WIFI、4G等各种各样的通信方式讲数据传输到各种各样的平台。 除了各个公司私有的云平台外&#xff0c;更多的初学者会接触到腾讯云、阿里云之类的平台。设备接入方式也有着多种多样…...

SRS、ZLMediakit音视频流媒体服务器

SRS、ZLMediakit都是做为webrtc的SFU&#xff08;selective forward unit&#xff09; WebRTC 开发实践&#xff1a;为什么你需要 SFU 服务器 https://mp.weixin.qq.com/s?__bizMzAxNTc1MjM0Mw&mid2652213442&idx1&sn33f0393a2dbc2b6a39c613bb238ec145&chksm…...

大模型Prompt-Tuning技术进阶

LLM的Prompt-Tuning主流方法 面向超大规模模型的Prompt-Tuning 近两年来&#xff0c;随之Prompt-Tuning技术的发展&#xff0c;有诸多工作发现&#xff0c;对于超过10亿参数量的模型来说&#xff0c;Prompt-Tuning所带来的增益远远高于标准的Fine-tuning&#xff0c;小样本甚至…...

web开发兼职网站开发/如何优化关键词

请用程序实现 输入一个正整数num&#xff0c;计算这个正整数的阶乘&#xff0c;并将计算结果输出。 # 请使用 input() 输入一个正整数 num numint(input()) # 请计算这个正整数的阶乘&#xff0c;并将计算结果输出 count1 for i in range(num,1,-1):countcount*i print(count)…...

广州官网优化/专业优化网站排名

要脱单&#xff0c;你就在公司里这些岗位上下功夫&#xff0c;身边的女生有主了&#xff0c;人家还有闺蜜呢不是&#xff0c;伺候好了说不定哪天就给你介绍一个&#xff0c;接下来不妨从身边的这些女生下手~~~~转载于:https://blog.51cto.com/13457136/2130036...

衡水哪有做网站的/网络运营培训课程

大家好&#xff0c;欢迎来到缠妹财经&#xff01;背驰是缠论动力学的内容&#xff0c;没有背驰&#xff0c;缠论也就基本上没法展开了。 缠中说禅博客原文的背驰&#xff0c;包括线段类盘整背驰、中枢盘整背驰、盘整顶/底背驰和趋势背驰。下面我们了解一下&#xff01;缠中说禅…...

asp网站后台管理系统模板/热搜排行榜今日排名

如今年轻人都是怎么学习的&#xff1f;——看视频&#xff01;随着网络带宽的升级&#xff0c;各种网课、视频教程声容并茂的充斥了年轻人的视野&#xff0c;好像白纸黑字的学习时代已然成为了过去。 我们可以在网上淘到各式各样的视频教程&#xff0c;很多Java培训机构的入门…...

凡科网的网站建设怎么做/免费二级域名分发网站

1.Linux的启动过程 作为一台计算机&#xff0c;启动它的第一步是加电自检&#xff0c;也就是给电脑用电然后按电源按钮开机。加电之后的运行步骤:(1)加载bios&#xff0c;然后检查硬盘信息(2)读取MBR的配置(MBR就是硬盘第一个扇区第一个磁道的第一个磁头的位置)&#xff0c;去找…...

wordpress 修改模板/常见的网络推广方法有哪些

OpenJDK的代码更新很快&#xff0c;贡献源码的人追求的是功能上的酷炫&#xff0c;他们才不考虑软件的可用性。所以有个组织把OpenJDK的代码进行打包和测试&#xff0c;最后形成二进制可执行文件&#xff0c;这个软件就是AdoptOpenJDK。在windows平台下&#xff0c;就是一个.ms…...