当前位置: 首页 > news >正文

【AI辅助设计】没错!训练FLUX LoRA就这么简单!

前言

得益于开源社区的力量,在各位大佬的努力下,现在16G VRAM的家用电脑也可以训练FLUX的LoRA了 👏。
今天我使用fluxgym这个方法,训练LoRA,并记录过程。

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!

CSDN官方AI绘画资料合集,点击这里快速获取!

fluxgym

cocktail peanut 整合开发的一个易用的前端LoRA训练web应用,其背后也是使用Kohya Scripts。有两大优点:

  • 显著降低显存占用。支持12GB、16GB、20GB显卡;
  • 超级简单的用户界面和流程;

但目前仅支持NV的卡,项目地址:https://github.com/cocktailpeanut/fluxgym

得益于其优秀的易用性,X上越来越多的推友,都用这个应用来训练LoRA。

安装fluxgym

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!

CSDN官方AI绘画资料合集,点击这里快速获取!

克隆项目

首先克隆 Fluxgym 和 kohya-ss/sd-scripts:

git clone https://github.com/cocktailpeanut/fluxgym``cd fluxgym``git clone -b sd3 https://github.com/kohya-ss/sd-scripts

您的文件夹结构将如下所示:

/fluxgym`  `app.py`  `requirements.txt`  `/sd-scripts

创建conda环境

官方使用的是venv虚拟环境,我这里就直接使用conda环境来安装了。

conda create -n fluxgym python=3.10
  

激活环境

conda activate fluxgym
  

进入sd-scripts,并安装依赖

cd sd-scripts``pip install -r requirements.txt

然后回到根目录,在安装依赖:

cd ..``pip install -r requirements.txt

最后,安装 pytorch Nightly:

pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121
  

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!

CSDN官方AI绘画资料合集,点击这里快速获取!

下载模型

其实跟fp16的FLUX模型组一样的,如果已经下载过,直接复制相关模型文件到相关目录即可。

首先,在foder下下载以下模型models/clip

  • https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/clip_l.safetensors?download=true

  • https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/t5xxl_fp16.safetensors?download=true

其次,下载文件夹下的以下模型models/vae

  • https://huggingface.co/cocktailpeanut/xulf-dev/resolve/main/ae.sft?download=true

最后下载models/unet文件夹下的以下模型:

  • https://huggingface.co/cocktailpeanut/xulf-dev/resolve/main/flux1-dev.sft?download=true

结果文件结构如下:

/models`  `/clip`    `clip_l.safetensors`    `t5xxl_fp16.safetensors`  `/unet`    `flux1-dev.sft`  `/vae`    `ae.sft``/sd-scripts``/outputs``/env``app.py``requirements.txt``...

运行

返回根fluxgym文件夹,激活 caonda环境,运行:

python app.py  

训练过程

准备数据集

这次的目标是训练一个等距视角的室内模型icon。获取素材的过程,大家可以使用Midjourney,质量可控,方便快捷~😂

生成10到20张图就可以作为素材输入了。

将图片一一下载好,名字没关系,fluxgym后续可以处理。

尺寸就使用Midjourney生成的1024x1024吧,其实可以放大后再保存,这样训练出来的模型,质量更好。
篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!

CSDN官方AI绘画资料合集,点击这里快速获取!

训练信息

这里制作简单演示哈~。按照图片所示,输入基础的训练参数,其他先默认吧:

  1. LoRA名称

  2. 触发词

  3. 上传图片素材

  4. 使用Florence反推打标。这个真的好用,免去了打标的步骤

值得一提的是,Florence打标必须点赞,又方便又好~👍

使用打标时,需要另外下载模型,这里需要等待一段时间。

反推得还是很准确的。

开始训练

一切就绪后,就可以点击开始训练了。

耐心等待中 ☕️

显存去到了接近20GB

最终用时36分钟。

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!

CSDN官方AI绘画资料合集,点击这里快速获取!

LoRA效果

训练好的LoRA模型就在根目录的output文件夹中。时间关系,我就不做xy图了,直接用最后产出的LoRA看看效果。

加上LoRA后,元素和细节更加明显了。使用同样的提示语,右图为加上LoRA的效果。

3d isometric interiors, a living room with a blue background, featuring a sofa with cushions, a table with various objects on it, a chair, a monitor, keyboard, mouse, lamp, and other items on the table, houseplants, windows with curtains, and toys scattered on the floor.
  

更多输出如下:

写在最后

还是那句话,因为开源,所以生气蓬勃! 可以说,这是我目前遇到的最易用的LoRA训练流程,大家赶紧用起来吧~。

篇幅有限,这里就不一一展示了,有需要的朋友可以点击下方的链接进行领取!

CSDN官方AI绘画资料合集,点击这里快速获取!

相关文章:

【AI辅助设计】没错!训练FLUX LoRA就这么简单!

前言 得益于开源社区的力量,在各位大佬的努力下,现在16G VRAM的家用电脑也可以训练FLUX的LoRA了 👏。 今天我使用fluxgym这个方法,训练LoRA,并记录过程。 篇幅有限,这里就不一一展示了,有需要的…...

Mac 下安装FastDFS

首先我们需要下载相对应的安装包: libfastcommonFastDFS 下载完成后我们先将其解压到桌面。 1.安装libfastcommon 我们进入到libfastcommon-master目录中执行./make.sh和sudo ./make.sh install,具体代码如下: 2.安装FastDFS 同安装libfa…...

人工智能的未来:重塑生活与工作的变革者

随着人工智能(AI)技术的快速发展,我们正处于一个前所未有的变革时代。AI不仅在医疗、企业运营和日常生活中发挥着重要作用,而且正在重新定义我们的生活和工作方式。本文将探讨人工智能技术的应用前景以及它如何改变我们的生活和工…...

【微服务】Java 对接飞书多维表格使用详解

目录 一、前言 二、前置操作 2.1 开通企业飞书账户 2.2 确保账户具备多维表操作权限 2.3 创建一张测试用的多维表 2.4 获取飞书开放平台文档 2.5 获取Java SDK 三、应用App相关操作 3.1 创建应用过程 3.2 应用发布过程 3.3 应用添加操作权限 四、多维表应用授权操作…...

学习threejs,使用粒子实现下雪特效

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️THREE.Points简介1.11 ☘️…...

unity3d——Time

在Unity3D中,Time类是一个非常重要的工具类,它提供了一系列与时间相关的属性和方法,帮助开发者在游戏中实现各种时间相关的操作。以下是一些Time类常用的方法及其示例: 一、常用属性 Time.time 含义:表示从游戏开始到…...

天地图实现海量聚合marker--uniapp后端详细实现

本文章详细的讲解了前后端代码来 实现uniapp天地图功能的实现 以及 后端海量数据的聚合查询 和网格算法实现思路。 并对当数据量增加和用户频繁请求接口时可能导致服务器负载过高做了前后端优化。 前端uniapp: 实现了天地图的行政区划边界/地图切换/比例尺/海量数…...

Bug | 项目中数据库查询问题

问题描述 理论上,点击查询后,表头应当显示中文。而不是上面的在数据库中的表头【如上图示】 正常点击查询后,如果没有输入值,应当是查询所有的信息。 原因分析: 这里是直接使用SELECT * 导致的。例如: S…...

C++入门基础知识129—【关于C 库函数 - time()】

成长路上不孤单😊😊😊😊😊😊 【14后😊///C爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】 今日分享关于C 库函数 - time()的相关内容&#xff0…...

大文件秒传,分片上传,断点续传

大文件分片上传 一 功能描述 1.文件通过web端分片多线程上传到服务端,然后web端发起分片合并,完成大文件分片上传功能 2.上传过的大文件,实现秒传 3.上传过程中,服务异常退出,实现断点续传 二 流程图 三 代码运行…...

多生境扩增子探秘:深度溯源与多样性解析

分析微生物组数据的组成结构的一个主要挑战是确定其潜在来源。在微生物来源分析中,随机森林、SourceTracker和FEAST都有较广泛应用。今天,小编就带大家看一篇发表在《iMeta》的文章,使用溯源技术追踪微生物的来源与去向,揭示生物在…...

Selenium4自动化测试常用函数总结,各种场景操作实战

🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 seleninum作为自动化测试的工具,自然是提供了很多自动化操作的函数,下面列举下比较常用的函数,更多可见官方文档:…...

图像生成新范式:智源推出全能视觉生成模型 OmniGen

大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen&am…...

实现RPC接口的demo记录

1.Thrift RPC 接口实现 Demo Service public class DemoServiceImpl implements DemoService.Iface {private static final Logger logger LoggerFactory.getLogger(DemoServiceImpl.class);Overridepublic String sayHello(Context context, String msg) throws TException …...

Python期末题目 | 期末练习题【概念题+代码】

一、前言 Python 是一门功能强大且易于学习的编程语言,在高校中被广泛用作教学语言。Python 的期末考试通常会包含基础知识和编程实践,以考察学生的理解与应用能力。本文整理了一套 Python 期末练习题,包括选择题、填空题、判断题和代码题。…...

OpenCV基本操作(python开发)——(6)视频基本处理

OpenCV——视频基本处理 一、读取摄像头 import numpy as np import cv2cap cv2.VideoCapture(0) # 实例化VideoCapture对象, 0表示第一个摄像头 while cap.isOpened():ret, frame cap.read() # 捕获帧cv2.imshow("frame", frame)c cv2.waitKey(1) # 等待1毫…...

详解Java之Spring MVC篇一

目录 Spring MVC 官方介绍 MVC RequestMapping 传递参数 无参数 单个参数 针对String类型 针对Integer类型 针对int类型 针对自定义类型 多个参数 参数重命名 参数强制一致 参数不强制一致 传递数组 ​编辑传递List ​编辑 传递JSON ​编辑 从路径中获取参…...

ubuntu20.04上使用 Verdaccio 搭建 npm 私有仓库

安装nvm 首先安装必要的工具: apt update apt install curl下载并执行nvm安装脚本: curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.7/install.sh | bash添加环境变量(如果安装脚本没有自动添加)。编辑 ~/.bash…...

Python实现办公自动化的数据可视化与报表生成

在 Python 中,可以利用多个库来实现办公自动化中的数据可视化与报表生成。以下是具体的方法: 一、数据可视化 使用 matplotlib 库 matplotlib 是一个强大的 Python 绘图库,可以创建各种类型的静态、动态和交互式图表。示例代码:i…...

前端知识串联笔记(更新中...)

1.MVVM MVVM 是指 Model - View - ViewModel,Model 是数据与业务逻辑,View 是视图,ViewModel 用于连接 View 和 Model Model ---> View:将数据转化成所看到的页面,实现的方式:Data Bindings -- 数据绑定…...

定时器任务——若依源码分析

分析util包下面的工具类schedule utils: ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类,封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz,先构建任务的 JobD…...

剑指offer20_链表中环的入口节点

链表中环的入口节点 给定一个链表,若其中包含环,则输出环的入口节点。 若其中不包含环,则输出null。 数据范围 节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。 节点 val 值各不相同。 链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

视频字幕质量评估的大规模细粒度基准

大家读完觉得有帮助记得关注和点赞!!! 摘要 视频字幕在文本到视频生成任务中起着至关重要的作用,因为它们的质量直接影响所生成视频的语义连贯性和视觉保真度。尽管大型视觉-语言模型(VLMs)在字幕生成方面…...

Java 加密常用的各种算法及其选择

在数字化时代,数据安全至关重要,Java 作为广泛应用的编程语言,提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景,有助于开发者在不同的业务需求中做出正确的选择。​ 一、对称加密算法…...

TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 (一)概念解析 TRS(Total Return Swap)收益互换是一种金融衍生工具,指交易双方约定在未来一定期限内,基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

EtherNet/IP转DeviceNet协议网关详解

一,设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络,本网关连接到EtherNet/IP总线中做为从站使用,连接到DeviceNet总线中做为从站使用。 在自动…...

实现弹窗随键盘上移居中

实现弹窗随键盘上移的核心思路 在Android中&#xff0c;可以通过监听键盘的显示和隐藏事件&#xff0c;动态调整弹窗的位置。关键点在于获取键盘高度&#xff0c;并计算剩余屏幕空间以重新定位弹窗。 // 在Activity或Fragment中设置键盘监听 val rootView findViewById<V…...

自然语言处理——循环神经网络

自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元&#xff08;GRU&#xff09;长短期记忆神经网络&#xff08;LSTM&#xff09…...

【HarmonyOS 5 开发速记】如何获取用户信息(头像/昵称/手机号)

1.获取 authorizationCode&#xff1a; 2.利用 authorizationCode 获取 accessToken&#xff1a;文档中心 3.获取手机&#xff1a;文档中心 4.获取昵称头像&#xff1a;文档中心 首先创建 request 若要获取手机号&#xff0c;scope必填 phone&#xff0c;permissions 必填 …...

10-Oracle 23 ai Vector Search 概述和参数

一、Oracle AI Vector Search 概述 企业和个人都在尝试各种AI&#xff0c;使用客户端或是内部自己搭建集成大模型的终端&#xff0c;加速与大型语言模型&#xff08;LLM&#xff09;的结合&#xff0c;同时使用检索增强生成&#xff08;Retrieval Augmented Generation &#…...