当前位置：首页 > news >正文

Stable Diffusion：使用自己的数据集微调训练LoRA模型

news 文章来源：https://blog.csdn.net/FriendshipTang/article/details/132395013 2025/4/26 17:52:05

Stable Diffusion：使用自己的数据集微调训练LoRA模型

前言
前提条件
相关介绍
微调训练LoRA模型
- 下载kohya_ss项目
- 安装kohya_ss项目
- 运行kohya_ss项目
- 准备数据集
- 生成关键词
- 模型参数设置
- - 预训练模型设置
  - 文件夹设置
  - 训练参数设置
- 开始训练LoRA模型
- - TensorBoard查看训练情况
- 测试训练的LoRA模型
- - 文字生成图像（txt2img）
参考

在这里插入图片描述

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入YOLO系列专栏、自然语言处理
专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

安装 Python 3.10.6 ：https://www.python.org/downloads/release/python-3106/
安装 git：https://git-scm.com/download/win
安装 Visual Studio 2015, 2017, 2019, and 2022 redistributable：https://aka.ms/vs/17/release/vc_redist.x64.exe

微调训练LoRA模型

下载kohya_ss项目

官方源地址：https://github.com/bmaltais/kohya_ss.git

在这里插入图片描述下载解压后，项目目录，如下图所示。

安装kohya_ss项目

打开终端并导航到所需的安装目录。
进入kohya_ss目录:
```
cd kohya_ss
```
执行如下命令运行setup脚本:
```
.\setup.bat
```

如果没有报错，则安装成功。

运行kohya_ss项目

在Windows上，使用gui.bat脚本并在终端中运行它，命令如下：

gui.bat --listen 127.0.0.1 --server_port 7860 --inbrowser --share

运行成功后，可在浏览器输入http://127.0.0.1:7860/打开，如下图所示。
在这里插入图片描述

注：详细使用教程可查阅此项目中的README.md文件

准备数据集

在kohya_ss项目下，创建一个train目录，具体内容如下：
在这里插入图片描述

image : 图片放在这里。
log：训练记录
model：模型保存路径
image目录还有一个子目录，比如本文这里是100_Freeman，100表示100个steps，会直接影响训练的步数和效果，Freeman表示图片人物名称。
创建好目录，将处理好的图片放在00_Freeman目录，然后就要准备做关键词生成。

生成关键词

具体步骤：Utilities->Captioning->BLIP Captioning

在这里插入图片描述
成功生成，会出现TXT文件，如下图所示。

在这里插入图片描述

模型参数设置

预训练模型设置

在这里插入图片描述

文件夹设置

在这里插入图片描述

训练参数设置

在这里插入图片描述

开始训练LoRA模型

在这里插入图片描述

训练完成后，会在model文件夹里生成一个.safetensors模型文件

TensorBoard查看训练情况

在页面上，点击Start TensorBoard，打开网址http://127.0.0.1:6006，即可查看。
在这里插入图片描述

在这里插入图片描述

测试训练的LoRA模型

测试模型，需要使用到stable-diffusion-webui项目，具体安装方法，可查阅Window下部署使用Stable Diffusion AI开源项目绘图

将kohya_ss/train/Freeman/model目录里的Freeman_bs2_epoch50_fp16.safetensors模型文件分别拷贝到stable-diffusion-webui项目里的stable-diffusion-webui/models/Lora目录和stable-diffusion-webui/models/Stable-diffusion目录下。
在stable-diffusion-webui目录下，使用webui-user.bat脚本并在终端中运行它，命令如下：

webui-user.bat

在这里插入图片描述

运行成功后，可在浏览器输入http://127.0.0.1:7861/打开，如下图所示。
在这里插入图片描述

选择自己训练的LoRA模型

文字生成图像（txt2img）

 <lora:Freeman_bs2_epoch50_fp16:1>Freeman a beautiful woman with glasses and a white dress,modelshoot style,beautiful light,photo realistic game cg

在这里插入图片描述

参考

[1] https://github.com/bmaltais/kohya_ss.git
[2] https://github.com/AUTOMATIC1111/stable-diffusion-webui
[3] https://github.com/camenduru/stable-diffusion-webui
[4] https://www.kaggle.com/code/camenduru/stable-diffusion-webui-kaggle
[5] https://blog.csdn.net/wpgdream/article/details/130607099
[6] https://zhuanlan.zhihu.com/p/620583928

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入YOLO系列专栏、自然语言处理
专栏或我的个人主页查看
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

Stable Diffusion：使用自己的数据集微调训练LoRA模型

Stable Diffusion：使用自己的数据集微调训练LoRA模型前言前提条件相关介绍微调训练LoRA模型下载kohya_ss项目安装kohya_ss项目运行kohya_ss项目准备数据集生成关键词模型参数设置预训练模型设置文件夹设置训练参数设置开始训练LoRA模型TensorBoard查看训练情况测…...

编程日记 2023/8/22 13:00:35

软考高级系统架构设计师系列之：论文典型试题写作要点和写作素材总结系列文章一

软考高级系统架构设计师系列之：论文典型试题写作要点和写作素材总结系列文章一一、论软件体系结构风格及其应用1.论文题目2.写作要点和写作素材二、论开放系统应用的互操作性技术1.论文题目2.写作要点和写作素材三、论多层分布结构系统的开发1.论文题目2.写作要点和写作素材四…...

编程日记 2023/8/22 12:59:33

06 mysql all查询和主键查询和非索引列查询

前言本文主要调试一下 mysql 的如下两种查询语句我们也来深入的看一下, 究竟如下两个普通的查询, mysql 做了什么事情 1. select * from user where id 991; 2. select * from user; 3. select * from user where name jerry991; 环境介绍测试表 user schema 如下…...

编程日记 2023/8/22 12:58:32

黑马点评-项目集成git及redis实现短信验证码登录

目录 IDEA集成git 传统session存在的问题 redis方案业务流程选用的数据结构整体访问流程发送短信验证码获取校验验证码配置登录拦截器拦截器注册配置类拦截器用户状态刷新问题刷新问题解决方案 IDEA集成git 远程仓库采用码云，创建好仓库&…...

编程日记 2023/8/22 12:57:31

mac苹果电脑怎么运行Windows软件？怎么安装Win虚拟机？

近年来，苹果电脑的用户群体不断扩大，许多用户对于苹果电脑是否可以运行Windows软件产生了疑问。苹果电脑和Windows操作系统有着明显的区别，是否能够在苹果电脑上运行Windows软件。下面我们就来看苹果电脑可以运行Windows软件吗，苹…...

编程日记 2023/8/22 12:56:29

Jmeter对websocket进行测试

JMeterWebSocketSampler-1.0.2-SNAPSHOT.jar下载公司使用websocket比较奇怪，需要带认证信息进行长连接，通过websocket插件是请求失败，如下图，后面通过代码实现随再打包jar包完成websocket测试本地实现代码如下： pa…...

编程日记 2023/8/22 12:55:28

从2023年世界机器人大会发现机器人新趋势

机器人零部件为何成2023年世界机器人大会关注热门？ 在原先，机器人的三大核心零部件是控制系统中的控制器、驱动系统中的伺服电机和机械系统中的精密减速器。如今，机器人的主体框架结构已经落实，更多机器人已经开始深入到各类场景中…...

编程日记 2023/8/22 12:54:26

Kafka单节点部署

🎈 作者：互联网-小啊宇 🎈 简介： CSDN 运维领域创作者、阿里云专家博主。目前从事 Kubernetes运维相关工作，擅长Linux系统运维、开源监控软件维护、Kubernetes容器技术、CI/CD持续集成、自动化运维、开源软件部署维护…...

编程日记 2023/8/22 12:53:24

生成式AI和大语言模型 Generative AI LLMs

在“使用大型语言模型(LLMs)的生成性AI”中，您将学习生成性AI的基本工作原理，以及如何在实际应用中部署它。通过参加这门课程，您将学会： 深入了解生成性AI，描述基于LLM的典型生成性AI生命周期中的关键步骤&#xff…...

编程日记 2023/8/22 12:52:23

Obsidian 入门使用手册

文章目录一、Obsidian 入门1.1 什么是 Obsidian1.2 安装 Obsidian 二、Obsidian 配置2.1 创建第一个笔记2.2 设置界面语言使用中文2.3 主题三、小结一、Obsidian 入门 1.1 什么是 Obsidian Obsidian 是一款基于 Markdown 语法编辑的笔记软件。与传统的 Markdown 软件不同的…...

编程日记 2023/8/22 12:51:21

GuLi商城-前端基础Vue指令-单向绑定双向绑定

什么是指令? 指令 (Directives) 是带有 v- 前缀的特殊特性。指令特性的预期值是:单个 JavaScript 表达式。指令的职责是，当表达式的值改变时，将其产生的连带影响，响应式地作用于DOM 例如我们在入门案例中的 v-on，代表绑定事…...

编程日记 2023/8/22 12:50:20

前端（十三）——JavaScript 闭包的奥秘与高级用法探索

😶博主：小猫娃来啦 😶文章核心：深入理解 JavaScript 中的闭包文章目录不理解闭包？这玩意很难？闭包的定义与原理闭包是什么创建一个闭包闭包的应用场景闭包与作用域闭包与作用域之间的关系全局作用域、函…...

编程日记 2023/8/22 12:49:18

面试-快速学习计算机网络-UDP/TCP

1. OSI四层和七层映射区别： 应用层，表示层，会话层合并为了应用层数据链路层和物理层合并为了网络接口层 2. TCP和UDP的区别？ 总结： 1 . TCP 向上层提供面向连接的可靠服务 ，UDP 向上层提供无连接不可靠服…...

编程日记 2023/8/22 12:48:16

爱校对如何帮助企业和博客主提高在线可见性？

在数字化时代，内容质量已经成为增强在线曝光率的关键因素。企业和博客主经常面临挑战，如何制作高质量、无误的内容以吸引更多的在线用户。此文将详细分析“爱校对”如何帮助用户优化内容，从而提高在线可见性。 1.互联网内容的挑战搜索引擎…...

编程日记 2023/8/22 12:47:14

MATLAB中xlsread函数用法

目录语法说明示例将工作表读取到数值矩阵读取元胞的范围读取列请求数值、文本和原始数据对工作表执行函数请求自定义输出局限性 xlsread函数的功能是读取Microsoft Excel 电子表格文件语法 num xlsread(filename) num xlsread(filename,sheet) num x…...

编程日记 2023/8/22 12:46:13

Prisma.js：JavaScript中的基于代码的ORM

Prisma是一种流行的用于服务器端JavaScript和TypeScript的数据映射层（ORM）。它的核心目的是简化和自动化数据在存储和应用程序代码之间的传输方式。Prisma支持各种数据存储，并为数据持久化提供了一个强大而灵活的抽象层。通过这个基于代码的…...

编程日记 2023/8/22 12:45:12

解决问题：在cocos create中如何从b文件调用到a文件里用CC.resource.load动态加载的图集

目录 1.在a文件中定义一个公共的变量存储动态加载的图集 2.在a.js中添加一个静态方法，返回动态加载的图集 3.在b.js中使用a.js中定义的静态方法获取图集，并使用它假设a文件中用CC.resource.load动态加载了一张图集，b文件需要使用这张图集&am…...

编程日记 2023/8/22 12:44:11

分布式 - 消息队列Kafka：Kafka 消费者消费位移的提交方式

文章目录 1. 自动提交消费位移2. 自动提交消费位移存在的问题？3. 手动提交消费位移1. 同步提交消费位移2. 异步提交消费位移3. 同步和异步组合提交消费位移4. 提交特定的消费位移5. 按分区提交消费位移 4. 消费者查找不到消费位移时怎么办？5. 如何从特定…...

编程日记 2023/8/22 12:43:10

如何利用 ChatGPT 进行自动数据清理和预处理

推荐：使用 NSDT场景编辑器助你快速搭建可二次编辑的3D应用场景 ChatGPT 已经成为一把可用于多种应用的瑞士军刀，并且有大量的空间将 ChatGPT 集成到数据科学工作流程中。如果您曾经在真实数据集上训练过机器学习模型，您就会知道数据清理和预…...

编程日记 2023/8/22 12:42:08

PHP“牵手”淘宝商品评论数据采集方法,淘宝API接口申请指南

淘宝天猫商品评论数据接口 API 是开放平台提供的一种 API 接口，它可以帮助开发者获取商品的详细信息，包括商品的标题、描述、图片等信息。在电商平台的开发中，详情接口API是非常常用的 API，因此本文将详细介绍详情接口 API 的使用…...

编程日记 2023/8/22 12:41:05

你更喜欢哪一个：VueJS 还是 ReactJS？

观点列表： 1、如果你想在 HTML 中使用 JS，请使用 Vue； 如果你想在 JS 中使用 HTML，请使用 React。当然，如果您希望在 JS 中使用 HTML，请将 Vue 与 JSX 结合使用。 2、Svelte：我喜欢它&#…...

编程日记 2023/8/22 12:40:04

PyTorch学习笔记（十六）——利用GPU训练

一、方式一网络模型、损失函数、数据（包括输入、标注） 找到以上三种变量，调用它们的.cuda()，再返回即可 if torch.cuda.is_available():mynn mynn.cuda() if torch.cuda.is_available():loss_function loss_function.cuda(…...

编程日记 2023/8/22 12:39:01

【实战】十一、看板页面及任务组页面开发（三） —— React17+React Hook+TS4 最佳实践，仿 Jira 企业级项目（二十五）

文章目录一、项目起航：项目初始化与配置二、React 与 Hook 应用：实现项目列表三、TS 应用：JS神助攻 - 强类型四、JWT、用户认证与异步请求五、CSS 其实很简单 - 用 CSS-in-JS 添加样式六、用户体验优化 - 加载中和错误状态处理七、Hook&…...

编程日记 2023/8/22 12:37:59

金额千位符自定义指令

自定义指令文件 moneyFormat.js /*** v-money 金额千分位转换*/export default {inserted: inputFormatter({// 格式化函数formatter(num, util) {if(num null || num || num undefined || typeof(num) undefined){return }if(util 万元 || util 万){return formatMone…...

编程日记 2023/8/22 12:36:58

请不要用 JSON 作为配置文件，使用JSON做配置文件的缺点

我最近关注到有的项目使用JSON作为配置文件。我觉得这不是个好主意。这不是JSON的设计目的，因此也不是它擅长的。JSON旨在成为一种“轻量级数据交换格式”，并声称它“易于人类读写”和“易于机器解析和生成”。作为一种数据交换格式，JSON是…...

编程日记 2023/8/22 12:35:57

Hadabot：从网络浏览器操作 ROS2 远程控制器

一、说明 Hadabot Hadabot是一个学习ROS2和机器人技术的机器人套件。使用 Hadabot，您将能够以最小的挫败感和恐吓来构建和编程物理 ROS2 机器人。Hadabot套件目前正在开发中。它将仅针对ROS2功能，并强调基于Web的用户界面。随着开发的进展&a…...

编程日记 2023/8/22 12:34:54

Kotlin 协程

Kotlin 协程（Coroutines）是一种轻量级的并发编程解决方案，旨在简化异步操作和多线程编程。它提供了一种顺序和非阻塞的方式来处理并发任务，使得代码可以更加简洁和易于理解。Kotlin 协程通过提供一套高级 API，使并发代…...

编程日记 2023/8/22 12:33:53

maven 从官网下载指定版本

1. 进入官网下载页面 Maven – Download Apache Maven 点击下图所示链接 2. 进入文件页，选择需要的版本 3. 选binaries 4. 选文件，下载即可...

编程日记 2023/8/22 12:32:52

数据结构---串（赋值，求子串，比较，定位）

目录一.初始化顺序表中串的存储串的链式存储二.赋值操作：将str赋值给S 链式表顺序表三.复制操作：将chars复制到str中链式表顺序表四.判空操作链式表顺序表五.清空操作六.串联结链式表顺序表七.求子串链式表顺序表…...

编程日记 2023/8/22 12:31:51

WPF CommunityToolkit.Mvvm

文章目录前言ToolkitNuget安装简单使用SetProperty，通知更新RealyCommandCanExecute 新功能，代码生成器ObservablePropertyNotifyCanExecuteChangedForRelayCommand其他功能对应关系 NotifyPropertyChangedFor 前言 CommunityToolkit.Mvvm（…...

编程日记 2023/8/22 12:30:51

Stable Diffusion：使用自己的数据集微调训练LoRA模型

前言

前提条件

相关介绍

微调训练LoRA模型

下载kohya_ss项目

安装kohya_ss项目

运行kohya_ss项目

准备数据集

生成关键词

模型参数设置

预训练模型设置

文件夹设置

训练参数设置

开始训练LoRA模型

TensorBoard查看训练情况

测试训练的LoRA模型

文字生成图像（txt2img）

参考

相关文章：