当前位置：首页 > news >正文

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(一)

news 2026/2/8 8:34:30

GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？

文章目录

GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？
- - P-Tuning微调训练概述
  - - 1、预训练模型或者是torch模型
    - 2、训练器的超参数
    - 3、数据预处理工具
    - 4、加载数据
    - 5、分词处理
    - 6、数据预处理，如填充，前后缀
    - 7、训练参数配置
    - 8、执行训练
  - 软件依赖
  - 数据处理

P-Tuning v2 将 ChatGLM2-6B 模型需要微调的参数量，减少到原来的 0.1%，再通过模型量化、Gradient Checkpoint 等方法，最低只需要 7GB 显存即可运行。

本文试图分析程序结构和代码，解释序列转换生成模型的微调训练。为了篇幅不要过长，下期解读训练代码。

P-Tuning微调训练概述

训练过程函数分为五个部分：训练参数配置，训练数据预处理，训练数据加载，执行迭代训练，训练评估与测试。

把训练任务参数配置传递给Trainer：

1、预训练模型或者是torch模型

from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")

2、训练器的超参数

TrainingArguments包含可以更改的模型超参数，如学习率、批大小和要训练的epoch数量。如果不指定任何训练参数，则使用默认值：

from transformers import TrainingArguments
training_args = TrainingArguments(output_dir="path/to/save/folder/",learning_rate=2e-5,per_device_train_batch_size=8,per_device_eval_batch_size=8,num_train_epochs=2,
)

3、数据预处理工具

如分词器、图像处理器、特征提取器或处理器：

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")

4、加载数据

from datasets import load_dataset
dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT

5、分词处理

创建一个函数对数据集进行分词，并使用map将其应用到整个数据集上：

def tokenize_dataset(dataset):return tokenizer(dataset["text"])
dataset = dataset.map(tokenize_dataset, batched=True)

6、数据预处理，如填充，前后缀

使用DataCollatorWithPadding从数据集中创建一批示例：

from transformers import DataCollatorWithPadding
data_collator = DataCollatorWithPadding(tokenizer=tokenizer)

7、训练参数配置

在Trainer中使用所有这些类：

from transformers import Trainer
trainer = Trainer(model=model,args=training_args,train_dataset=dataset["train"],eval_dataset=dataset["test"],tokenizer=tokenizer,data_collator=data_collator,
)  # doctest: +SKIP

8、执行训练

调用train()开始训练：

trainer.train()

对于使用序列到序列模型的任务（如翻译或摘要），请使用Seq2SeqTrainer和Seq2SeqTrainingArguments类。

可以通过继承Trainer中的方法来自定义训练循环。允许自定义特性，如损失函数、优化器和调度器（scheduler）。请查看 Trainer参考文档，了解哪些方法可以被子类化。

软件依赖

需要pip安装中文分词器，中文评价指标，数据集管理

pip install rouge_chinese nltk jieba datasets

数据处理

训练数据形式的转换，本训练测试以广告数据集作为样例讲解。

ADGEN数据集任务的数据形式，输入（content），生成输出（summary）

{"content": "类型#上衣*版型#宽松*版型#显瘦*图案#线条*衣样式#衬衫*衣袖型#泡泡袖*衣款式#抽绳","summary": "这件衬衫的款式非常的宽松，利落的线条可以很好的隐藏身材上的小缺点，穿在身上有着很好的显瘦效果。领口装饰了一个可爱的抽绳，漂亮的绳结展现出了十足的个性，配合时尚的泡泡袖型，尽显女性甜美可爱的气息。"
}

End

GPT专栏文章：

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-ChatGLM2模型的微调训练参数解读

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

决策引擎：
Falcon构建轻量级的REST API服务

决策引擎-利用Drools实现简单防火墙策略

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(一)

GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？ 文章目录 GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型？P-Tuning微调训练概述1、预训练模型或者是torch模型2、训练器的超参数3、数据预处理工具4、加载数据5、分词处理6、数据预…...

编程日记 2023/11/18 2:21:47

【Python】爬虫代理IP的使用+建立代理IP池

目录前言一、代理IP 1. 代理IP的获取 2. 代理IP的验证 3. 代理IP的使用二、建立代理IP池 1. 代理IP池的建立 2. 动态维护代理IP池三、完整代码总结前言在进行网络爬虫开发时，我们很容易遭遇反爬虫机制的阻碍。为了规避反爬虫机制，我们…...

编程日记 2023/11/18 2:20:44

1、fruit.js function $(name) {if (name) {//假设name是 #fruit_tblif (name.startsWith("#")) {name name.substring(1); //fruit_tblreturn document.getElementById(name);} else {return document.getElementsByName(name); //返回的是NodeList类型}} }//当…...

编程日记 2023/11/18 2:19:42

mysql 常见操作指令

use k_order – 查看版本 select version(); – 查看所有数据库 show databases; – 查看所有执行引擎 show engines; – 查看当前数据库 select database(); – 查看所有table show tables; – 查看默认存储引擎 SHOW VARIABLES LIKE ‘default_storage_engine’; – 系…...

编程日记 2023/11/18 2:17:40

Vue3 生命周期

如下是Vue3的生命周期函数图： 一、Vue2生命周期和Vue3声明周期的区别 1. Vue2 中，只要创建Vue实例对象而不需要挂载就可以实现beforeCreate 和 created 生命周期函数。 Vue3中必须要将Vue实例对象挂载完成，所有的准备工作做完，…...

编程日记 2023/11/18 2:15:38

rocketmq 安装dashboard1.0.0 mq消息控制台安装 rocketmq控制台安装 rocketmq-dashboard-1.0.0编译安装

1. 官网： 下载 | RocketMQ 2. dashboard安装包位置： 在连接最下面，点击download.zip即可 3. 需要安装maven, 编译命令： mvn clean install -U -Dmaven.test.skiptrue4. 启动jar: java -jar rocketmq-dashboard-1.0.0.jar &…...

编程日记 2023/11/18 2:14:37

常见的数据结构有哪些？

数据结构分为逻辑结构和物理结构。逻辑结构：指数据元素之间逻辑关系的数据结构，这里的逻辑关系是指数据元素之间的前后间关系，与数据在计算机中的存储位置无关。物理结构：指数据的逻辑结构在计算机存储空间中的存放形式称为数据…...

编程日记 2023/11/18 2:13:36

Spring中有哪几种方法获取HttpSession对象

Spring MVC 可以直接作为Controller的参数传入： RequestMapping(value "/test", method RequestMethod.POST, produces "application/json;charsetUTF-8")ResponseBodypublic Map test(HttpSession session, String otherParam) {//TODOre…...

编程日记 2023/11/18 2:12:36

springboot开启Redis缓存支持

开启缓存支持，只需要继承CachingConfigurerSupport 即可。代码如下： import com.fasterxml.jackson.annotation.JsonAutoDetect; import com.fasterxml.jackson.annotation.PropertyAccessor; import com.fasterxml.jackson.databind.ObjectMapper; impo…...

编程日记 2023/11/18 2:10:34

2.4 矩阵的运算法则

矩阵是数字或 “元素” 的矩形阵列。当矩阵 A A A 有 m m m 行 n n n 列，则是一个 m n m\times n mn 的矩阵。如果矩阵的形状相同，则它们可以相加。矩阵也可以乘上任意常数 c c c。以下是 A B AB AB 和 2 A 2A 2A 的例子，它们都是 …...

编程日记 2023/11/18 2:09:33

让文字在盒子中水平居中与垂直居中

简单方法： 1.先用text-align: center;将文字垂直居中。 2.再用line-height: Xpx;将元素的行高设置为与父元素同样的高度。（这里的X代表父元素的高度） 举例： 对于该网页的代码如下： <!DOCTYPE html> <html&…...

编程日记 2023/11/18 2:08:32

聊一聊前端面临的安全威胁与解决对策

前端是用户在使用您的网站或Web应用程序时首先体验到的东西。如果您的Web应用程序的前端受到侵害，它可能会影响整个布局，并造成糟糕的用户体验，可能难以恢复。集成前端安全变得越来越重要，本文将指导您通过可以应用于保护您的Web应…...

编程日记 2023/11/18 2:07:30

【matlab学习】现代控制

文章目录 (1) SISO Modeling(2) MIMO Modeling(3) 状态空间模型(4) 状态空间模型->传递函数(5) 传递函数->状态空间模型(6) 状态空间模型变换(7) 特征值和特征向量(8) 广义特征向量(9) 状态空间模型->约旦型 (1) SISO Modeling y ( k 2 ) 5 y ( k 1 ) 6 y ( k ) …...

编程日记 2023/11/18 2:06:29

Debezium报错处理系列之九十九：ConnectException: Source offset ‘file‘ parameter is missing

Debezium报错处理系列之九十九：ConnectException: Source offset file parameter is missing 一、完整报错二、错误原因三、解决方法研究Debezium技术遇到的各种错误解决方法系列文章传送门： Debezium从入门到精通系列之：百篇系列文章汇总之研究Debezium技术遇到的各种错误的…...

编程日记 2023/11/18 2:05:28

基于深度学习的活体人脸识别检测算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1. 活体人脸识别检测算法概述 4.2. 深度学习在活体人脸识别检测中的应用 4.3. 算法流程 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 MATLAB2022a 3.部分核心程序 …...

编程日记 2023/11/18 2:04:27

Angular 由一个bug说起之二：trackBy的一点注意事项

trackBy是angualr优化项目性能的一种方法, 通过返回一个具有绑定性的唯一值, 比如id，手机号，身份证号之类的，来让angular能够跟踪数组的项目，根据数据的变化来重新生成DOM, 这样就节约了性能。但是如果是使用ngFor循环组件&…...

编程日记 2023/11/18 2:02:25

单片机FLASH下载算法的制作

环境硬件使用正点原子STM32F407探索者V2开发板编程环境使用MDK 下载工具使用JLINK FLASH芯片使用W25Q128 什么是下载算法单片机FLASH的下载算法是一个FLM文件，FLM通过编译链接得到，其内部包含一系列对FLASH的操作，包括初始化、擦除、写…...

编程日记 2023/11/18 2:01:23

[nlp] 损失缩放（Loss Scaling）loss sacle

在深度学习中，由于浮点数的精度限制，当模型参数非常大时，会出现数值溢出的问题，这可能会导致模型训练不稳定。为了解决这个问题，损失缩放（Loss Scaling）技术被引入，它通过缩放损失值来解决这个问题。在深度学习中，损失缩放技术通常是通过将梯度进行缩放来实现的。具…...

编程日记 2023/11/18 2:00:21

Django框架之视图层

【一】三板斧【1】HttpResponse 返回字符串类型【2】render 返回html页面，并且在返回给浏览器之前还可以给html页面传值【3】redirect 重定向页面在视图文件中写视图函数的时候不能没有返回值了，默认返回的是None，页面上就会报错 d…...

编程日记 2023/11/18 1:59:20

商城免费搭建之java商城 java电子商务Spring Cloud+Spring Boot+mybatis+MQ+VR全景+b2b2c

1. 涉及平台平台管理、商家端（PC端、手机端）、买家平台（H5/公众号、小程序、APP端（IOS/Android）、微服务平台（业务服务） 2. 核心架构 Spring Cloud、Spring Boot、Mybatis、Redis 3. 前端框架…...

编程日记 2023/11/18 1:58:18

工业自动化时代的精准装配革新：迁移科技3D视觉系统如何重塑机器人定位装配

AI3D视觉的工业赋能者迁移科技成立于2017年，作为行业领先的3D工业相机及视觉系统供应商，累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成，通过稳定、易用、高回报的AI3D视觉系统，为汽车、新能源、金属制造等行…...

编程新知 2025/11/25 4:59:47

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2026/2/4 17:18:03

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码五、报告文件爬取5.1 提…...

编程新知 2026/2/4 12:52:32

GC1808高性能24位立体声音频ADC芯片解析

1. 芯片概述 GC1808是一款24位立体声音频模数转换器（ADC），支持8kHz~96kHz采样率，集成Δ-Σ调制器、数字抗混叠滤波器和高通滤波器，适用于高保真音频采集场景。 2. 核心特性高精度：24位分辨率&#xff0c…...

编程新知 2026/1/27 4:58:14

给网站添加live2d看板娘

给网站添加live2d看板娘参考文献： stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言网站环境如下，文章也主…...

编程新知 2026/2/1 4:23:19

MFE(微前端) Module Federation：Webpack.config.js文件中每个属性的含义解释

以Module Federation 插件详为例，Webpack.config.js它可能的配置和含义如下： 前言 Module Federation 的Webpack.config.js核心配置包括： name filename（定义应用标识） remotes（引用远程模块&#xff0…...

编程新知 2025/9/20 11:57:48

使用SSE解决获取状态不一致问题

使用SSE解决获取状态不一致问题 1. 问题描述2. SSE介绍2.1 SSE 的工作原理2.2 SSE 的事件格式规范2.3 SSE与其他技术对比2.4 SSE 的优缺点 3. 实战代码 1. 问题描述目前做的一个功能是上传多个文件，这个上传文件是整体功能的一部分，文件在上传的过程中…...

编程新知 2026/1/27 17:00:20

若依登录用户名和密码加密

/*** 获取公钥：前端用来密码加密* return*/GetMapping("/getPublicKey")public RSAUtil.RSAKeyPair getPublicKey() {return RSAUtil.rsaKeyPair();}新建RSAUti.Java package com.ruoyi.common.utils;import org.apache.commons.codec.binary.Base64; im…...

编程新知 2026/1/22 11:27:07

基于开源AI智能名片链动2 + 1模式S2B2C商城小程序的沉浸式体验营销研究

摘要：在消费市场竞争日益激烈的当下，传统体验营销方式存在诸多局限。本文聚焦开源AI智能名片链动2 1模式S2B2C商城小程序，探讨其在沉浸式体验营销中的应用。通过对比传统品鉴、工厂参观等初级体验方式，分析沉浸式体验的优势与价值…...

编程新知 2026/2/2 21:52:42

算法刷题-回溯

今天给大家分享的还是一道关于dfs回溯的问题，对于这类问题大家还是要多刷和总结，总体难度还是偏大。对于回溯问题有几个关键点： 1.首先对于这类回溯可以节点可以随机选择的问题，要做mian函数中循环调用dfs（i&#x…...

编程新知 2025/10/14 10:53:46