当前位置：首页 > news >正文

基于华为昇腾910B，实战InternLM个人小助手认知微调

news 文章来源：https://blog.csdn.net/2402_82411485/article/details/144117646 2025/4/20 6:00:24

本文将带领大家基于华为云 ModelArts，使用 XTuner 单卡微调一个 InternLM 个人小助手。

开源链接：（欢迎 star）

https://github.com/InternLM/InternLM

https://github.com/InternLM/xtuner

XTuner 简介

XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。 常用命令****如下：

查看帮助

xtuner help

查看版本

xtuner version

列出所有预定义配置文件

xtuner list-cfg

列出包含指定名称的预定义配置文件

xtuner list-cfg -p $NAME

xtuner list-cfg 命令用于列出内置的所有配置文件。参数 -p 或 --pattern 表示模式匹配，后面跟着的内容将会在所有的配置文件里进行模糊匹配搜索，然后返回最有可能的内容。

复制配置文件

xtuner copy-cfg $CONFIG $SAVE_PATH

xtuner copy-cfg 命令用于复制一个内置的配置文件。该命令需要两个参数：CONFIG 代表需要复制的配置文件名称，SAVE_PATH 代表复制的目标路径。

执行微调训练

xtuner train $CONFIG

xtuner train 命令用于启动模型微调进程。该命令需要一个参数：CONFIG 用于指定微调配置文件。

将 pth 格式的模型文件转换成 HuggingFace 格式的模型

xtuner convert pth_to_hf $CONFIG $PATH_TO_PTH_MODEL $SAVE_PATH_TO_HF_MODEL

xtuner convert pth_to_hf 命令用于进行模型格式转换。该命令需要三个参数：CONFIG 表示微调的配置文件； PATH_TO_PTH_MODEL 表示微调的模型权重文件路径，即要转换的模型权重；SAVE_PATH_TO_HF_MODEL 表示转换后的 HuggingFace 格式文件的保存路径。

华为云资源选择

模块：【华为云】-【控制台】-【AI开发平台ModelArts】-【开发空间】-【Notebook】

镜像：pytorch_2.1.0-cann_8.0.rc1-py_3.9-euler_2.10.7-aarch64-snt9b
在这里插入图片描述

类型：【Ascend】

规格：【Ascend: 1*ascend-snt9b2|ARM: 24核 192GB】

磁盘规格：按需即可

在这里插入图片描述

安装环境

安装依赖

pip install einops
pip install accelerate
pip install dlinfer-ascend
pip install deepspeed
pip install loguru

安装 XTuner

git clone -b v0.1.23 https://github.com/InternLM/xtuner
git clone -b v0.1.23 https://gitee.com/InternLM/xtuner #github 不行的话用这条
cd xtuner

安装之前修改一个文件，路径：xtuner/tools/model_converters/merge.py

parser.add_argument('--device',default='npu',choices=('cuda', 'cpu', 'auto','npu'),help='Indicate the device')  # choices里面添加一个'npu',也可以把default直接改成npu

然后安装

pip install -e .

模型准备

创建目录

mkdir -p /home/ma-user/work/work_dir/
cd /home/ma-user/work/work_dir/

下载模型

使用 Huggingface-cli 方式下载，设置 hf-mirros 环境变量

export HF_ENDPOINT=https://hf-mirror.com

下载模型

huggingface-cli download --resume-download internlm/internlm2-chat-1_8b --local-dir /home/ma-user/work/model/internlm2-chat-1_8b

微调前的模型对话

cli_demo.py 代码

import torch
from transformers import AutoTokenizer, AutoModelForCausalLMmodel_name_or_path = "/home/ma-user/work/model/internlm2-chat-1_8b"  # 模型所在的本地路径tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='npu')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='npu')
model = model.eval()system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""messages = [(system_prompt, '')]print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")while True:input_text = input("\nUser  >>> ")input_text = input_text.replace(' ', '')if input_text == "exit":breaklength = 0for response, _ in model.stream_chat(tokenizer, input_text, messages):if response is not None:print(response[length:], flush=True, end="")length = len(response)

执行代码

python cli_demo.py

运行结果

在这里插入图片描述

微调

准备数据文件

cd /home/ma-user/work/work_dir/
mkdir -p datas
touch datas/assistant.json

创建一个脚本准备数据（xtuner_generate_assistant.py）

创建准备数据脚本

vim xtuner_generate_assistant.py

脚本内容如下：

import json# 设置用户的名字
name = 'JeffDing同志'
# 设置需要重复添加的数据次数
n = 8000# 初始化数据
data = [{"conversation": [{"input": "请介绍一下你自己", "output": "我是{}的小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦".format(name)}]},{"conversation": [{"input": "你在实战营做什么", "output": "我在这里帮助{}完成XTuner微调个人小助手的任务".format(name)}]}
]# 通过循环，将初始化的对话数据重复添加到data列表中
for i in range(n):data.append(data[0])data.append(data[1])# 将data列表中的数据写入到'datas/assistant.json'文件中
with open('datas/assistant.json', 'w', encoding='utf-8') as f:# 使用json.dump方法将数据以JSON格式写入文件# ensure_ascii=False 确保中文字符正常显示# indent=4 使得文件内容格式化，便于阅读json.dump(data, f, ensure_ascii=False, indent=4)

将对应的 name 进行修改（在第 4 行的位置）

- name = 'JeffDing同志'
+ name = "你自己的名称"

生成微调数据

python xtuner_generate_assistant.py

准备配置文件

列出支持的配置文件

xtuner list-cfg -p internlm2

复制配置文件

xtuner copy-cfg internlm2_chat_1_8b_qlora_alpaca_e3 .

修改配置文件

主要修改地方如下：

########################################################################                          PART 1  Settings                           ########################################################################
- pretrained_model_name_or_path = 'internlm/internlm2-chat-1_8b'
+ pretrained_model_name_or_path = '/home/ma-user/work/model/internlm2-chat-1_8b'- alpaca_en_path = 'tatsu-lab/alpaca'
+ alpaca_en_path = 'datas/assistant.json'evaluation_inputs = [
-    '请给我介绍五个上海的景点', 'Please tell me five scenic spots in Shanghai'
+    '请介绍一下你自己', 'Please introduce yourself']
########################################################################                      PART 3  Dataset & Dataloader                   ########################################################################
alpaca_en = dict(type=process_hf_dataset,
-   dataset=dict(type=load_dataset, path=alpaca_en_path),
+   dataset=dict(type=load_dataset, path='json', data_files=dict(train=alpaca_en_path)),tokenizer=tokenizer,max_length=max_length,
-   dataset_map_fn=alpaca_map_fn,
+   dataset_map_fn=None,template_map_fn=dict(type=template_map_fn_factory, template=prompt_template),remove_unused_columns=True,shuffle_before_pack=True,pack_to_max_length=pack_to_max_length,use_varlen_attn=use_varlen_attn)

注意代码块里前面标+、-号的行，分别代表添加和去除。另外在 NPU上微调还需要去掉以下这段：

#######################################################################
#                      PART 2  Model & Tokenizer                      #
#######################################################################- quantization_config=dict(
-            type=BitsAndBytesConfig,
-            load_in_4bit=True,
-            load_in_8bit=False,
-            llm_int8_threshold=6.0,
-            llm_int8_has_fp16_weight=False,
-            bnb_4bit_compute_dtype=torch.float16,
-            bnb_4bit_use_double_quant=True,
-            bnb_4bit_quant_type='nf4')

需要去掉这一段的原因：使用这段会出现一个情况，量化这个操作好像不支持 NPU，会报错找不到 GPU。

启动微调

xtuner train ./internlm2_chat_1_8b_qlora_alpaca_e3_copy.py

微调启动时 NPU 的使用情况，使用 npu-smi info 命令查看

在这里插入图片描述

模型格式转换

pth_file=`ls -t ./work_dirs/internlm2_chat_1_8b_qlora_alpaca_e3_copy/*.pth | head -n 1`
xtuner convert pth_to_hf ./internlm2_chat_1_8b_qlora_alpaca_e3_copy.py ${pth_file} ./hf

模型合并

xtuner convert merge /home/ma-user/work/model/internlm2-chat-1_8b ./hf ./merged --max-shard-size 2GB --device npu

执行微调后的 demo

修改 cli_demo.py 里面模型路径为 /home/ma-user/work/work_dir/merged

- model_name_or_path = "/home/ma-user/work/model/internlm2-chat-1_8b"  # 模型所在的本地路径
+ model_name_or_path = "/home/ma-user/work/work_dir/merged"  # 模型所在的本地路径

执行代码

python cli_demo.ppy

运行结果

hard-size 2GB --device npu


### 执行微调后的 demo修改 `cli_demo.py` 里面模型路径为 `/home/ma-user/work/work_dir/merged````Python
- model_name_or_path = "/home/ma-user/work/model/internlm2-chat-1_8b"  # 模型所在的本地路径
+ model_name_or_path = "/home/ma-user/work/work_dir/merged"  # 模型所在的本地路径

执行代码

python cli_demo.ppy

运行结果

在这里插入图片描述

基于华为昇腾910B，实战InternLM个人小助手认知微调

本文将带领大家基于华为云 ModelArts，使用 XTuner 单卡微调一个 InternLM 个人小助手。开源链接：（欢迎 star） https://github.com/InternLM/InternLM https://github.com/InternLM/xtuner XTuner 简介 XTuner 是一个高效、灵…...

编程日记 2024/11/29 10:14:43

Electron文件写入、读取（作用：公共全局变量，本地存储）

Electron文件写入、读取（作用：公共全局变量，本地存储） 使用Node.js的fs模块也可以直接使用Node.js的fs模块来实现本地文件的读写操作 // electron/main.jsconst fs require(fs);// 写入文件localhost.txt fs.writeFileSync(lo…...

编程日记 2024/11/29 10:12:38

水体分割检测包含YOLOV，COCO，VOC三种标记的数据集包含 857张图片

说明水体分割检测指的是利用深度学习模型进行水体区域的分割和检测。YOLO（You Only Look Once）是一种流行的实时目标检测算法，其主要特点是速度快，适合于实时场景下的目标检测。在水体分割检测中，可以使用YOLO算法来…...

编程日记 2024/11/29 10:10:32

Harbor安装、HTTPS配置、修改端口后不可访问？

Harbor安装、HTTPS配置、修改端口后不可访问？ 大家好，我是秋意零。今天分享Harbor相关内容，安装部分可完全参考官方文档，写的也比较详细。安装Harbor 官方文档：https://goharbor.io/docs/2.12.0/install-config/ …...

编程日记 2024/11/29 10:07:28

正定矩阵（Positive Definite Matrix）的定义与性质

正定矩阵（Positive Definite Matrix）的定义与性质正定矩阵在优化、机器学习、信号处理等领域中有广泛应用。以下是其定义、几何解释及性质。 1. 定义一个 n n n \times n nn 的实对称矩阵 A A A 是正定矩阵，当且仅当它满足以下等价条…...

编程日记 2024/11/29 10:05:26

React与Ant Design入门指南

创建基于React框架使用Ant Design组件库的技术文档时，我们需要涵盖从安装到使用的各个关键步骤。以下是一份简化的技术文档草稿，它旨在帮助开发者快速上手并开始构建界面。 React与Ant Design入门指南 1. 简介 Ant Design是一个致力于提供企业级UI设计…...

编程日记 2024/11/29 10:04:24

MAC卸载Vmware Fusion后无法再安装解决方案执行脚本 sudo rm -rf /Library/Application Support/VMware/VMware Fusion sudo rm -rf /Library/Application Support/VMware/Usbarb.rules sudo rm -rf /Library/Application Support/VMware Fusion sudo rm -rf /Library/Prefe…...

编程日记 2024/11/29 9:56:15

单点登录深入详解之技术方案总结

技术方案之CAS认证概述 CAS 是耶鲁大学的开源项目，宗旨是为 web 应用系统提供一种可靠的单点登录解决方案。 CAS 从安全性角度来考虑设计，用户在 CAS 输入用户名和密码之后通过ticket进行认证，能够有效防止密码泄露。 CAS 广泛使用于传统应…...

编程日记 2024/11/29 9:54:11

数据库(MySQL黑马)

基础篇 MySQL概述数据库概述数据库相关概念主流的关系型数据库管理系统 MySQL数据库的安装与启动下载：MySQL :: MySQL Community Downloads 安装步骤 MySQL―8.0.40超详细保姆级安装教程_mysql8.0.40安装教程-CSDN博客文章浏览阅读1k次。_mysql8.0.40安装教…...

编程日记 2024/11/29 9:53:09

HTML5+JavaScript实现消消乐游戏

HTML5JavaScript实现消消乐游戏点击两个相邻的方块来交换它们位置。如果交换后形成三个或更多相同图案的方块连成一线，这些方块会被消除。消除后，上方的方块会下落填补空缺，顶部会生成新的方块。每消除一个方块得10分。例如&#xff0…...

编程日记 2024/11/29 9:51:05

sin函数拟合

目录一、目的... 1 二、模型设计... 1 2.1 输入与输出.... 1 2.2 隐藏层设计.... 1 2.3 优化算法与损失函数.... 1 2.4 神经网络结构.... 1 三、训练... 1 3.1 数据生成.... 2 3.2 训练过程.... 2 3.3 训练参数与设置.... 2 四、测试与分析... 2 4.1 选取不同激活函数....…...

编程日记 2024/11/29 9:46:59

设置Mysql5.6允许外网访问

设置mysql用户支持外网访问步骤： 需要使用root权限登录mysql，更新mysql.user表，设置指定用户的Host字段为%，默认一般为127.0.0.1或者localhost。 1.登录数据库 1 mysql -u root -p 输入密码 1 mysql> use mysql; 2.查询hos…...

编程日记 2024/11/29 9:44:57

【随笔】一次JS和python中的MD5加密的记录

// 使用CryptoJS进行MD5加密和Base64编码 const sign CryptoJS.enc.Base64.stringify(CryptoJS.enc.Utf8.parse(CryptoJS.MD5(sign2encrypt).toString()));上面这段JS和下面这个python等价 def hash_and_encode(input_string):sign2encrypt input_string# 使用 hashlib 进行 …...

编程日记 2024/11/29 9:42:54

力扣二叉树的中序遍历

用了递归遍历，关于树的经典例题。题目递归常规做法即递归了，不会写也得背下来。递归可以大致理解方法调用自身，先写中序遍历递归的方法，递归一定要有递归出口，当遍历到节点为空时返回，即已经找到了。…...

编程日记 2024/11/29 9:41:46

uniapp学习（010-3 实现H5和安卓打包上线）

零基础入门uniapp Vue3组合式API版本到咸虾米壁纸项目实战，开发打包微信小程序、抖音小程序、H5、安卓APP客户端等总时长 23:40:00 共116P 此文章包含第114p-116p的内容文章目录 H5配置文件设置开始打包上传代码安卓设置模拟器启动设置基础配置设置图标启动界面…...

编程日记 2024/11/29 9:39:41

基于DHCP，ACL的通信

该问题为华为的学习资料 1.首先把所有的PC机全部设置为DHCP 2.配置地址 3.ospf 4.dhcp 5.acl AR1 dhcp en interface GigabitEthernet0/0/0ip address 192.168.1.254 255.255.255.0 dhcp select global interface GigabitEthernet0/0/1ip address 10.1.12.1 255.255.255.…...

编程日记 2024/11/29 9:37:36

金融租赁系统助力企业升级与风险管理的新篇章

内容概要在当今的商业环境中，“金融租赁系统”可谓是企业成功的秘密武器。简单来说，这个系统就像一位聪明的财务顾问，帮助企业在资金和资源的运用上达到最优化。从设备采购到项目融资，它提供了一种灵活的方式，让企业…...

编程日记 2024/11/29 9:34:33

linux安装部署mysql资料

安装虚拟机等待检查完成选择中文软件选择网络和主机名开始安装设置root密码 ADH-password 创建用户等待安装完成重启接受许可证 Centos 7 64安装完成安装mysql开始 Putty连接指定服务器在 opt目录下新建download目录将mysql文件传到该目录下查看linux服务器的…...

编程日记 2024/11/29 9:30:29

深入理解 MongoDB：一款灵活高效的 NoSQL 数据库

在现代应用程序开发中，数据存储技术已经从传统的关系型数据库（RDBMS）扩展到多样化的 NoSQL 数据库。MongoDB 作为一款广泛使用的文档型数据库，以其灵活性、高性能和易用性成为开发者的首选之一。本篇博文将从 MongoDB 的核心概念、…...

编程日记 2024/11/29 9:29:23

爆改老旧笔记本---将笔记本改造为家用linux服务器

爆改老旧笔记本---将笔记本改造为家用linux服务器 linux启动盘制作镜像文件分区类型:MBR分区和GPT分区的定义MBR分区（Master Boot Record）GPT分区（GUID Partition Table）应用场景和优势MBR的应用场景和优势GPT的应用场景和优势 Li…...

编程日记 2024/11/29 9:24:10

RocketMQ MQTT Windows10 环境启动

RocketMQ MQTT Windows10 环境启动参考环境和软件版本下载资源启动RocketMQ启动RocketMQ MQTT 参考 https://blog.csdn.net/weixin_43114058/article/details/140043257 https://blog.csdn.net/yangxiaovip/article/details/138355443 环境和软件版本操作系统&#xff1a…...

编程日记 2024/11/29 9:23:08

sd webui整合包怎么安装comfyui

环境： sd webui整合包 comfyui 问题描述： sd webui整合包怎么安装comfyui 扩展安装不成功解决方案： 1.直接下载，解压到SD文件夹里（或者git拉一下） 2.ComfyUI模型共享：如果本机部署过Webui，那么ComfyUI可以与WebUI公用一套模型，防止复制大量模型浪费空间将…...

编程日记 2024/11/29 9:21:06

Edify 3D: Scalable High-Quality 3D Asset Generation

Deep Imagination Research | NVIDIA 目录一、Abstract 二、核心内容 1、多视图扩散模型 3、重建模型： 4、数据处理模块： 三、结果 1、文本到 3D 生成结果 2、图像到 3D 生成结果 3、四边形网格拓扑结构一、Abstract NVIDIA 开发的用于高质量…...

编程日记 2024/11/29 9:19:59

鸿蒙HarmonyOS学习笔记（6）

定义扩展组件样式：Extend装饰器在前文的示例中，可以使用Styles用于样式的重用，在Styles的基础上，我们提供了Extend，用于扩展原生组件样式。说明从API version 9开始，该装饰器支持在ArkTS卡片中使用。从…...

编程日记 2024/11/29 9:18:57

蓝桥杯备赛笔记（一）

这里的笔记是关于蓝桥杯关键知识点的记录，有别于基础语法，很多内容只要求会用就行，无需深入掌握。文章目录前言一、编程基础1.1 C基础格式和版本选择1.2 输入输出cin和cout： 1.3 string以下是字符串的一些简介：字符串…...

编程日记 2024/11/29 9:15:52

在Java中使用Apache POI导入导出Excel（二）

本文将继续介绍POI的使用，上接在Java中使用Apache POI导入导出Excel（一） 使用Apache POI组件操作Excel（二） 14、读取和重写工作簿 try (InputStream inp new FileInputStream("workbook.xls")) { //Inpu…...

编程日记 2024/11/29 9:11:47

linux 中后端jar包启动不起来怎么回事 -bash: java: 未找到命令

一、用以下命令检查jdk版本输入：java -version，如果JDK 环境变量没有配置，你会看到如下提示二、配置jdk环境 1.先找到/etc/profile文件，然后在该文件最后面加上以下配置 export JAVA_HOME/usr/local/jdk-21.0.1 export PATH$…...

编程日记 2024/11/29 9:10:43

六大排序算法：插入排序、希尔排序、选择排序、冒泡排序、堆排序、快速排序

本章讲述数据结构中的六大排序算法欢迎大佬们踊跃讨论，感谢大家支持！ 我的博客主页链接六大排序算法一.插入排序1.1 直接插入排序1.2 希尔排序二.选择排序2.1 单向选择排序2.2双向选择排序2.3 堆排序三.交换排序3.1 冒泡排序3.2 快速排序3.2.1 Hoa…...

编程日记 2024/11/29 9:09:42

快速排序（C++实现）

基本思想任取一个元素为中心，所有比它小的元素一律前放，比他大的元素一律后放，形成左右两个子表；对各子表重新选择中心元素并依此规则调整，直到每个子表的元素只剩一个。通过一趟排序，将待排序记录分割成…...

编程日记 2024/11/29 9:05:34

【数据库知识】数据库关系代数表达式

文章目录概述一、关系代数表达式的基本组成部分二、关系代数运算符及其使用样例三、关系代数表达式的优化四、总结概述数据库关系代数表达式是关系数据库系统查询语言的理论基础，它使用一系列符号和运算符来描述从一个或多个关系（即表）中…...

编程日记 2024/11/29 9:03:32

XTuner 简介

华为云资源选择

安装环境

安装依赖

安装 XTuner

模型准备

创建目录

下载模型

微调前的模型对话

微调

准备数据文件

创建一个脚本准备数据（xtuner_generate_assistant.py）

准备配置文件

复制配置文件

修改配置文件

启动微调

模型格式转换

模型合并

执行微调后的 demo

相关文章：