当前位置：首页 > news >正文

【大模型】llama-factory基础学习

news 2026/2/8 13:54:34

前言：LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术，适配市场主流开源模型，形成一个功能丰富，适配性好的训练框架。

1. 前期准备

下载源码：https://github.com/hiyouga/LLaMA-Factory
环境搭建的话参考readme.md:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

2. 原始模型直接推理

只需要配置template和model_name_or_path。
终端运行：

CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat \  --model_name_or_path /media/codingma/LLM/llama3/Meta-Llama-3-8B-Instruct \  --template llama3

运行完可以在本地服务器访问：http://localhost:7860/

3. 自定义数据集

llama-factory支持json格式文件，自定义数据集中每条数据格式如下：

{
“prompt”: “介绍一下苹果”,
“response”: “苹果公司（Apple Inc.），是一家美国跨国科技公司，总部位于加利福尼亚州库比蒂诺。”
}

将文件放到llama factory项目下的data文件夹，然后编辑data_info.json文件，添加数据集映射：

 "demo": {"file_name": "demo.json","file_sha1":dwfewcevrvff"columns": {"prompt": "prompt","response": "response"}

demo是映射后使用的数据集别名，file_name是数据集路径，file_sha1不是必需的，但是可以缓存预处理后的数据集，避免二次训练时重新预处理，sha1的生成可以通过终端运行shasum -a 1 filename（linux命令），columns是json文件中的列名映射

4. 模型训练

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \--stage sft \  --do_train \  --model_name_or_path /media/codingma/LLM/llama3/Meta-Llama-3-8B-Instruct \  --dataset alpaca_gpt4_zh \  --dataset_dir ./data \  --template llama3 \  --finetuning_type lora \  --lora_target q_proj,v_proj \  --output_dir ./saves/LLaMA3-8B/lora/sft \  --overwrite_cache \  --overwrite_output_dir \  --cutoff_len 1024 \  --preprocessing_num_workers 16 \  --per_device_train_batch_size 2 \  --per_device_eval_batch_size 1 \  --gradient_accumulation_steps 8 \  --lr_scheduler_type cosine \  --logging_steps 50 \  --warmup_steps 20 \  --save_steps 100 \  --eval_steps 50 \  --evaluation_strategy steps \  --load_best_model_at_end \  --learning_rate 5e-5 \  --num_train_epochs 5.0 \  --max_samples 1000 \  --val_size 0.1 \  --plot_loss \  --fp16--logging_dir path_to_logging_directory

一些重要参数解读：

stage: 训练方式，pt，sft等
model_name_or_path：基础模型的路径
dataset：数据集名称，data_info.json中的
template：模板，在readme.md中可以找到对应的模型模板
finetuning_type：微调方式，一般选lora
output_dir：存储模型路径
logging_dir：日志路径

5. 模型合并并导出

训练后得到的模型不能直接使用，需要和基础模型合并后导出：

CUDA_VISIBLE_DEVICES=0 python src/export_model.py \--model_name_or_path qwen/Qwen-7B \--adapter_name_or_path /mnt/workspace/llama_factory_demo/qwen/lora/sft/checkpoint-50 \--template qwen \--finetuning_type lora \--export_dir /mnt/workspace/merge_w/qwen \--export_legacy_format False

model_name_or_path: 基础模型路径
adapter_name_or_path：训练后的模型路径
template：模板
finetuning_type：微调方式
export_dir：导出模型路径

【大模型】llama-factory基础学习

前言：LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术，适配市场主流开源模型，形成一个功能丰富，适配性好的训练框架。目录 1. 前期准备2. 原始模型直接推理3. 自定义数据集4. 模型训练5. 模型合并并导出 1. 前期准备 …...

编程日记 2024/8/15 17:06:35

【Java】如何使用jdbc连接并操作MySQL，一文读懂不迷路，小白也能轻松学会

JDBC的原理 JDBC（Java Database Connectivity）是Java提供的用于连接和操作数据库的API。它允许Java应用程序与各种数据库进行交互，以下是JDBC的基本原理： 驱动程序管理：JDBC使用不同的数据库驱动程序来连接不同类型的…...

编程日记 2024/8/15 17:05:33

新手学习VR全景需要知道的几个问题

1.什么是720云 720云是一家专注于VR全景内容制作与展示的技术平台，提供从拍摄、编辑到发布的一站式解决方案。它的核心功能包括全景图像的制作和编辑工具，以及VR全景内容的在线展示和分享服务。720云的技术广泛应用于房地产、旅游、教育、文化展示等多个…...

编程日记 2024/8/15 17:03:31

上海知名泌尿外科专家常态化坐诊黄山新晨医院，让前列腺癌看得更早、更准！

继7月28日上海第四人民医院泌尿外科专家在黄山新晨医院开展义诊之后，8月9日和10日，该团队领头人周铁教授又完成了合作以来的首次坐诊，标志着双方合作从此进入常态化阶段。周铁主任在查看患者的检查报告周铁主任曾任中华医学会泌尿外科分会…...

编程日记 2024/8/15 17:02:29

Elasticsearch: 非结构化的数据搜索

r很多大数据组件在快速原型时期都是Java实现，后来因为GC不可控、内存或者向量化等等各种各样的问题换到了C，比如zookeeper->nuraft(https://www.yuque.com/treblez/qksu6c/hu1fuu71hgwanq8o?singleDoc# 《olap/clickhouse keeper 一致性协调服务》)&…...

编程日记 2024/8/15 17:00:26

44 个 React 前端面试问题

1.你知道哪些React hooks？ useState：用于管理功能组件中的状态。useEffect：用于在功能组件中执行副作用，例如获取数据或订阅事件。useContext：用于访问功能组件内的 React 上下文的值。useRef：用于创建对跨…...

编程日记 2024/8/15 16:58:24

LLMs之Framework：Hugging Face Accelerate后端框架之FSDP和DeepSpeed的对比与分析

LLMs之Framework：Hugging Face Accelerate后端框架之FSDP和DeepSpeed的对比与分析导读：该文章阐述了FSDP和DeepSpeed在实现上的差异，Accelerate如何统一它们的行为，并提供指导帮助用户在两种后端之间切换。同时也讨论了低精度优化…...

编程日记 2024/8/15 16:57:22

HarmonyOS应用开发学习-ArkTs声明式UI描述

ArkTs声明式UI描述 1 创建组件声明式UI描述 ArKTS以声明方式组合和扩展组件来描述应用程序的UI，同时还提供了基本的属性、事件和子组件配置方法，帮助开发者实现应用交互逻辑创建组件根据组件构造方法的不同，创建组件包含有参数和无参…...

编程日记 2024/8/15 16:54:19

Redis20-通信协议

目录 RESP协议概述数据类型模拟Redis客户端 RESP协议概述 Redis是一个CS架构的软件，通信一般分两步（不包括pipeline和PubSub）： 客户端（client）向服务端（server）发送一条命…...

编程日记 2024/8/15 16:53:18

Unity Shader变体优化与故障排除技巧

在 Unity 中编写着色器时，我们可以方便地在一个源文件中包含多个特性、通道和分支逻辑。在构建时，着色器源文件会被编译成着色器程序，这些程序包含一个或多个变体。变体是该着色器在满足一组条件后生成的版本，这通常会导致线性执行…...

编程日记 2024/8/15 16:52:16

数据结构——时间复杂度和空间复杂度

目录时间复杂度什么是时间复杂度常见时间复杂度类型如何计算时间复杂度空间复杂度什么是空间复杂度常见的空间复杂度类型如何计算空间复杂度时间复杂度和空间复杂度是评估算法性能的两个重要指标。时间复杂度什么是时间复杂度时间复杂度描述了算法执行所需…...

编程日记 2024/8/15 16:51:15

(echarts) 饼图设置滚动图例

(echarts) 饼图设置滚动图例效果： 代码： // 图例 legend: {type: scroll,orient: vertical,right: 10,top: 20,bottom: 20,data: data.legendData},参考：官网-可滚动的图例 https://echarts.apache.org/examples/zh/editor.html?cpie-leg…...

编程日记 2024/8/15 16:50:13

Java spring SSM框架--mybatis

一、介绍 Spring 框架是一个资源整合的框架，可以整合一切可以整合的资源（Spring 自身和第三方），是一个庞大的生态，包含很多子框架：Spring Framework、Spring Boot、Spring Data、Spring Cloud…… 其中Spr…...

编程日记 2024/8/15 16:49:11

Python知识点：如何使用Arduino与Python进行物联网项目

Arduino和Python是物联网(IoT)项目中常用的两种技术。Arduino是一个开源的硬件平台，而Python是一种高级编程语言，它们可以结合使用来创建各种智能设备和系统。以下是使用Arduino和Python进行物联网项目的一般步骤： 确定项目需求： …...

编程日记 2024/8/15 16:48:09

论文复现_从 CONAN 中收集 TPL 数据集

1. 概述 CONAN：Conan是一个用于C项目的开源包管理工具。它的主要目标是简化C项目的依赖关系管理过程，使开发人员能够更轻松地集成、构建和分享C库。其中有一些比较独特的功能，例如：版本管理、第三方库管理等。 TPL 数据集&…...

编程日记 2024/8/15 16:46:06

使用Docker将Java项目打包并部署到CentOS服务器的详细教程。

当然，让我们将上述步骤进一步细化，以便更好地理解整个过程。前提条件一个Java项目CentOS服务器，并且已安装DockerJava项目可以正常在本地运行具有服务器访问权限 ———————————————————————————————————…...

编程日记 2024/8/15 16:44:04

嘉立创eda布线宽度

https://prodocs.lceda.cn/cn/pcb/route-routing-width/#%E5%B8%83%E7%BA%BF%E5%AE%BD%E5%BA%A6...

编程日记 2024/8/15 16:41:01

硬件面试经典 100 题(31~50 题)

31、多级放大电路的级间耦合方式有哪几种？哪种耦合方式的电路零点偏移最严重？哪种耦合方式可以实现阻抗变换？ 有三种耦合方式：直接耦合、阻容耦合、变压器耦合。直接耦合的电路零点漂移最严重，变压器耦合的电路可以实现…...

编程日记 2024/8/15 16:40:00

5G：下一代无线通信技术的全面解析

随着科技的不断进步，移动通信技术也在飞速发展。从2G到4G，我们见证了无线网络的巨大变革，而现在，5G已经悄然来临。作为下一代无线通信技术，5G不仅将带来更快的速度和更低的延迟，还将开启全新的应用场景和商…...

编程日记 2024/8/15 16:34:54

关于refresh_token

前文介绍过jwt的一般使用场景，用户登录成功后获得jwt，其中包含用户相关信息，主要是在前端要用到的属性（比如姓名、应用角色[这个前端后都用得着]等）、在后端要用到的属性（比如登录IP、终端唯一标识&#xf…...

编程日记 2024/8/15 16:33:53

日语AI面试高效通关秘籍：专业解读与青柚面试智能助攻

在如今就业市场竞争日益激烈的背景下，越来越多的求职者将目光投向了日本及中日双语岗位。但是，一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧？面对生疏的日语交流环境，即便提前恶补了…...

编程新知 2026/2/8 4:37:01

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2026/2/6 3:59:37

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

HoST框架核心实现方法详解 - 论文深度解读（第二部分）《Learning Humanoid Standing-up Control across Diverse Postures》系列文章：论文深度解读 + 算法与代码分析（二）作者机构：上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学论文主题：人形机器人…...

编程新知 2026/1/20 19:54:35

1.创建ts文件路径：src/utils/timer.ts 完整代码： import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

编程新知 2025/8/9 0:31:20

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别直接训练提示词嵌入向量的核心区别您提到的代码： prompt_embedding = initial_embedding.clone().requires_grad_(True) optimizer = torch.optim.Adam([prompt_embedding...

编程新知 2025/7/4 0:50:01

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包： for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

编程新知 2026/2/4 16:23:56

laravel8+vue3.0+element-plus搭建方法

创建 laravel8 项目 composer create-project --prefer-dist laravel/laravel laravel8 8.* 安装 laravel/ui composer require laravel/ui 修改 package.json 文件 "devDependencies": {"vue/compiler-sfc": "^3.0.7","axios": …...

编程新知 2025/10/15 0:25:46

蓝桥杯冶炼金属

原题目链接 🔧 冶炼金属转换率推测题解 📜 原题描述小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V，是一个正整数，表示每 V V V 个普通金属 O O O 可以冶炼出 …...

编程新知 2026/2/4 10:54:26

CSS | transition 和 transform的用处和区别

省流总结： transform用于变换/变形，transition是动画控制器 transform 用来对元素进行变形，常见的操作如下，它是立即生效的样式变形属性。旋转 rotate(角度deg)、平移 translateX(像素px)、缩放 scale(倍数)、倾斜 skewX(角度…...

编程新知 2025/10/17 20:59:57

【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案

目录使用 erase 返回值继续迭代使用索引进行遍历我们知道类似 vector 的顺序迭代器被删除后，迭代器会失效，因为顺序迭代器在内存中是连续存储的，元素删除后，后续元素会前移。但一些场景中，我们又需要在执行删除操作…...

编程新知 2025/9/30 8:10:20

【大模型】llama-factory基础学习

目录

1. 前期准备

2. 原始模型直接推理

3. 自定义数据集

4. 模型训练

5. 模型合并并导出

相关文章：

【大模型】llama-factory基础学习

【Java】如何使用jdbc连接并操作MySQL，一文读懂不迷路，小白也能轻松学会

新手学习VR全景需要知道的几个问题

上海知名泌尿外科专家常态化坐诊黄山新晨医院，让前列腺癌看得更早、更准！

Elasticsearch: 非结构化的数据搜索

44 个 React 前端面试问题

LLMs之Framework：Hugging Face Accelerate后端框架之FSDP和DeepSpeed的对比与分析

HarmonyOS应用开发学习-ArkTs声明式UI描述

Redis20-通信协议

Unity Shader变体优化与故障排除技巧

数据结构——时间复杂度和空间复杂度

(echarts) 饼图设置滚动图例

Java spring SSM框架--mybatis

Python知识点：如何使用Arduino与Python进行物联网项目

论文复现_从 CONAN 中收集 TPL 数据集

使用Docker将Java项目打包并部署到CentOS服务器的详细教程。

嘉立创eda布线宽度

硬件面试经典 100 题(31~50 题)

5G：下一代无线通信技术的全面解析

关于refresh_token

日语AI面试高效通关秘籍：专业解读与青柚面试智能助攻

Flask RESTful 示例

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

vue3 定时器-定义全局方法 vue+ts

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别

在WSL2的Ubuntu镜像中安装Docker

laravel8+vue3.0+element-plus搭建方法

蓝桥杯冶炼金属

CSS | transition 和 transform的用处和区别

【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案