当前位置: 首页 > news >正文

文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你一些资料如何去找,或者让你能自己写出来,不是一味的复制粘贴。

首先 Stable Diffusion WebUI 的界面如下:
请添加图片描述

接下来我只介绍比较关键的或者能用到的,而且只简单介绍一下,后面会有相关演示:

  • Stable Diffusion checkpoint:这是你选择的模型,位置在stable-diffusion-webui/models/Stable-diffusion
  • Prompt:这个是正向提示词,也就是你想生成什么样的内容。
  • Negative Prompt:这个是反向提示词,也就是你不想生成的内容。
  • Sampling steps:这个是采样率,数值越大,画面细节越多。
  • Width 和 Height:这个是生成画面的宽和高。需要注意,这玩意和画面细节也挂钩,如果小的话生成的细节也少。
  • Batch count:生成的图像批次数。它更高可以降低生成的噪音。
  • Batch size:这个是每次生成几张图,调高需要更大显存,不然速度会慢一些。
  • CFG Scale:这个是遵循 prompt 的严格程度。一般为 7-12,如果你 prompt 写的很细,需要更多的细节,那么可以使用12-16 更高的。当然如果你想让他随机发挥,更低的也行。
  • Seed:这个是“种子”,如果你很满意一张图,那么就保留这个种子,然后修改其他参数进行调整,这样变化就不会那么随机。默认的-1就表示随机生成一个种子。

参数演示

我们首先不演示 Prompt 和 Negative Prompt,先来演示一下其他的参数。因为这两个比较复杂。

下面使用的 Prompt 如下:

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

下面使用的 Prompt 如下:

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

Width 和 Height

前面提到,宽和高是和画面细节挂钩的,比如 512x512 与 1024x1024 的差别如下(Seed 为 3503979678,Sampling steps 为 20,CFG Scale 为 7):

请添加图片描述
请添加图片描述

你可以看到这两张图的细节完全不是一个量级的。

此外,宽高也会影响生成效果。比如 512x1024、1024x1024 与 1024x2048 的差别如下:

请添加图片描述
请添加图片描述

请添加图片描述

需要注意,由于 SD 使用 1024x1024 训练,所以“宽+高”是 1024 的倍数的效果会好一些。一般比例如下:

  • 1:1: 1024x1024, 768x768
  • 3:2: 1152x768
  • 2:3: 768x1152
  • 4:3: 1152x864
  • 3:4: 864x1152
  • 16:9: 1360x768
  • 9:16: 768x1360

Sampling steps

采样率可以提高画面的细节,一般使用 30-40 就足够了。一般宽高有一个不足 1024 的情况下,选择 20 比较合适,1024 往上选择 35 左右。

比如上面同样的参数,Sampling steps 提高为 35,如下:
请添加图片描述
脸部和背景的细节会更多,颜色的层次一也更丰富,你可以放大看头发部分。

Batch count和Batch size

Batch count:生成的图像批次数。Batch size:这个是每次生成几张图。

需要注意:尽管我们设置了种子,到那时 Batch count 和 Batch count 还是会改变种子,比如下面演示的四张图,种子是 3503979678~3503979681。

Batch count 调整为 4,Batch size 为 1,生成图如下。
请添加图片描述

Batch count 调整为 1,Batch size 为 2。可以看到他是一起生成两张图的。
请添加图片描述

生成图如下:

请添加图片描述

Seed

Seed 是种子,也就是“基础”。上面演示 Batch count 和 Batch size 你也看到了,种子的变化会导致画面内容的变化。

这里说明一下如何查看种子。

首先,生成之后,图片下面的内容中有说明:

请添加图片描述

此外,输出位置stable-diffusion-webui/output中的文件名中就记录了种子,这样想找到之前的种子也很方便了。

请添加图片描述

不过还是演示一下生成 4 张图是什么样的:

请添加图片描述

可以看到差别要比种子只差 1 的差别更大。

Prompt 和 Negative Prompt

Prompt 和 Negative Prompt 是最关键的部分了。

首先我们看一下之前的 Prompt 和 Negative Prompt,了解一下常见的一些 prompt。

Prompt

1girl, looking at viewer, wool coat, fur collar,smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

这个参数按顺序是:一个女孩(1girl),看着镜头(looking at viewer),羊毛大衣(wool coat),毛领(fur collar),微笑(smile),站在山坡上(standing on a hillside),下雪中(snowfall),背景是山脉(mountains in the background),杰作(masterpiece),高质量(best quality),非常美观(very aesthetic),1990 年代的风格(1990s style),复古艺术风格(retro artstyle)

可以看到包含人物,姿态,衣服,表情,背景等多种信息。

Negative Prompt

这个 Negative Prompt 是我常用的,很多情况下都很适合。

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

这个参数按顺序是:低分辨率(lower),不好的身体结构(bad anatomy,直翻是不好的解刨学),令人不愉快的(displeasing),丑陋的(ugly),低颜色位数(fewer digit),多手指(extra digit),缺少手指(missing fingers),不好的手(bad hands),模糊的(blurry),(低质量,最差质量1.3)((low quality, worst quality:1.3))。

可以看到主要防止是手不行。其他的就是要画质好点。

艺术家风格

Animagine XL V3.1 里不光可以通过上面的1990s style, retro artstyle,指定风格,也可以通过艺术家风格,方法是在 prompt 中加上(艺术家:1.3)

艺术家列表有个神人做了张图,你可以在 Animagine XL v3.1 - Artists’ Style Sheet. 看到,其中一张如下:

请添加图片描述

好了现在弄一下生成图。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (tinnies:1.3)

生成图如下:

请添加图片描述

再换个艺术家。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (sekina:1.3)

生成如下:

请添加图片描述

授之以渔:Danbooru tags

Danbooru tags是什么

其实你看我之前的用的,会发现都是一个个短语,并不是句子,但是如何知道用哪些短语呢?

有一个网络数据库叫做 Danbooru tags,它里面记录了包括风格、动作、表情、物品等多种信息,当然也包含一些 NSFW 的内容。

请添加图片描述

比如说慌张(flustered),它的介绍界面如下,其中还包含一些示例,让你更直观的看到:

请添加图片描述

如何使用Danbooru tags

下面用表情和背景演示一下:

表情

之前表情用的是微笑(smile),那我们改成慌张(flustered)看看,其实我觉得根据示例这个应该叫娇羞,而不是慌张:

请添加图片描述
请添加图片描述

可以看到表情变成娇羞的样子了。

背景

把背景的山改成城市街道(city street in the background),注意把站在山坡删了:

1girl, looking at viewer, wool coat, fur collar,smile, snowfall, city street in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

生成图如下:
请添加图片描述

如果没删站在山坡:
请添加图片描述

更多的 Prompt 使用你可以看看 Danbooru tags 自己尝试一下。

希望能帮到有需要的人~

相关文章:

文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你…...

快速提取Excel工作簿中所有工作表的名称?

大家好,我是小鱼。 在Excel表格中如何快速提取工作簿中所有工作表的名称?这个问题在日常工作中也经常遇到,比如说经常使用的INDIRECT函数跨工作表汇总或者制作类似于导航的工作表快捷跳转列表,就需要每个工作表的名称。如果工作表…...

【紫光同创PG2L100H开发板】盘古676系列,盘古100Pro+开发板,MES2L676-100HP

本原创文章由深圳市小眼睛科技有限公司创作,版权归本公司所有,如需转载,需授权并注明出处(www.meyesemi.com) 一:开发系统介绍 开发系统概述 MES2L676-100HP开发板采用紫光创 logos2系列 FPGA,型号&#x…...

Node.JS 版本管理工具 Fnm 安装及配置(Windows)

Fnm 安装及配置(Windows) Fnm(Fast Node Manager)?? 一个快速而简单的 Node.js 版本管理工具,使用 Rust 编写。 1 安装 官网:Fnm(镜像网站 )。 下载:Fnm&#xff08…...

labview通过时间计数器来设定采集频率

在刚接触labview的时候,笔者通常用定时里的等待函数来实现指令的收发,但是当用到的收发消息比较多时就出现了卡顿,卡死的情况,这是因为当用队列框架时,程序卡在了其中的一个分支里,等通过相应的延时后才可以…...

汇编JCC条件跳转指令记忆

汇编中的条件跳转指令(JCC): 1. 理解标志寄存器 JCC 指令依赖于标志寄存器(FLAGS)的状态,常见的标志位有: ZF(Zero Flag):结果为0时置1。 CF(Ca…...

HTML排版标签、语义化标签、块级和行内元素详解

目录 前言 一、HTML中的排版标签 1. 文本相关标签 1.1 标题标签 ~ 1.2 段落标签 1.3 强调和加粗 1.4 换行标签 1.5 水平线标签 二、HTML中的语义化标签 2.1 语义化标签概述 2.2 常见的语义化标签 示例(核心代码部分): 三、HTM…...

【回溯+剪枝】单词搜索,你能用递归解决吗?

文章目录 79. 单词搜索解题思路:回溯(深搜) 剪枝 79. 单词搜索 79. 单词搜索 ​ 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。 …...

《深度揭秘LDA:开启人工智能降维与分类优化的大门》

在当今人工智能蓬勃发展的时代,数据成为了驱动技术进步的核心要素。随着数据采集和存储技术的飞速发展,我们所面临的数据量不仅日益庞大,其维度也愈发复杂。高维数据虽然蕴含着丰富的信息,但却给机器学习算法带来了一系列严峻的挑…...

Linux(CentOS)安装 MySQL

CentOS版本:CentOS 7 三种安装方式: 一、通过 yum 安装,最简单,一键安装,全程无忧。 二、通过 rpm 包安装,需具备基础概念及常规操作。 三、通过 gz 包安装,需具备配置相关操作。 --------…...

C++ 使用CURL开源库实现Http/Https的get/post请求进行字串和文件传输

CURL开源库介绍 CURL 是一个功能强大的开源库,用于在各种平台上进行网络数据传输。它支持众多的网络协议,像 HTTP、HTTPS、FTP、SMTP 等,能让开发者方便地在程序里实现与远程服务器的通信。 CURL 可以在 Windows、Linux、macOS 等多种操作系…...

面试题-SpringCloud的启动流程

关键词 prepareEnvironmentBootstrapApplicationListenerBootStrap Context(启动应用上下文)Environment中bootstrap属性 面试回答 引入SpringCloud相关组件后,均会引入一个spring-cloud-context的依赖包,这个项目的META-INF/s…...

MySQL基础知识

目录 一.什么是MySQL 二.分布式系统中的身份转换 三.MySQL是如何存储数据的 四.什么是数据库的命令 一.什么是MySQL MySQL是一个“客户端(client) - 服务器(server)”结构的软件(数据库软件)。 客户端&am…...

nas-群晖docker查询注册表失败解决办法(平替:使用SSH命令拉取ddns-go)

目录 前言必读 一、遇到问题 二、操作步骤 (一)打开群晖系统的SSH服务? (二)Windows电脑本地下载安装putty? 输入登录账号密码 开启root权限 例子:使用命令行下载ddns-go? 前言必读 读者手册(必…...

GSMA SGP.31 eSIM IoT 架构与需求笔记

GSMA SGP.31 eSIM IoT 架构与需求笔记 (版本 1.2,2024 年 4 月 26 日) 一、 概述 1. 文档目的: 本文件旨在为网络受限和/或用户界面 (UI) 受限的物联网 (IoT) 设备中的嵌入式通用集成电路卡 (eUICC) 提供远程配置架构和需求规范。 2. 主要内容&#…...

sql版本序列号

SQL Server 2019 Enterprise密钥:HMWJ3-KY3J2-NMVD7-KG4JR-X2G8G SQL Server 2019 Enterprise Core密钥:2C9JR-K3RNG-QD4M4-JQ2HR-8468J SQL Server 2019 Standard密钥:PMBDC-FXVM3-T777P-N4FY8-PKFF4 SQL Server 2019 Web密钥:33…...

vue2-nextTick

这里是引用 vue2-nextTick 1. 什么是nextTick 先来看官方定义 在下次DOM更新循环结束之后执行延迟回调。在修改数据之后立即使用这个方法,获取更新后的DOM云里雾里,啥意思呢,其实本质就是事件循环、同步和异步的问题不懂事件循环相关问题的…...

【其他专题】如何在线将PNG转ICO图标

在我们编程打包成exe时,可能需要一些图标文件。但往往我们下载的图标文件是.png或是其他格式的,是不能用于做图标文件的,因为图标文件往往是.ico文件。 比如下图所示的.png文件,我们怎么快速的将它转为ico文件呢? 首先…...

2019_AutoInt

AutoInt:通过自注意神经网络进行自动特征交互学习 创新点复现论文0摘要1介绍2相关工作2.1点击率预测2.2学习特征交互2.3注意力和残差网络 3问题定义4自动特征交互学习4.1概述4.2输入层4.3嵌入层4.4交互层4.5输出层 4.6训练4.7 AutoInt分析 5实验5.1实验装置5.2定量结…...

HAL库 Systick定时器 基于STM32F103EZT6 野火霸道,可做参考

目录 1.时钟选择(这里选择高速外部时钟) ​编辑 2.调试模式和时基源选择: 3.LED的GPIO配置 这里用板子的红灯PB5 4.工程配置 5.1ms的systick中断实现led闪烁 源码: 6.修改systick的中断频率 7.systick定时原理 SysTick 定时器的工作原理 中断触发机制 HAL_SYSTICK_Co…...

接口测试中缓存处理策略

在接口测试中,缓存处理策略是一个关键环节,直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性,避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明: 一、缓存处理的核…...

Docker 离线安装指南

参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性,不同版本的Docker对内核版本有不同要求。例如,Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本,Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...

XCTF-web-easyupload

试了试php,php7,pht,phtml等,都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接,得到flag...

23-Oracle 23 ai 区块链表(Blockchain Table)

小伙伴有没有在金融强合规的领域中遇见,必须要保持数据不可变,管理员都无法修改和留痕的要求。比如医疗的电子病历中,影像检查检验结果不可篡改行的,药品追溯过程中数据只可插入无法删除的特性需求;登录日志、修改日志…...

macOS多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

文章目录 问题现象问题原因解决办法 问题现象 macOS启动台(Launchpad)多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。 问题原因 很明显,都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放

简介 前面两期文章我们介绍了I2S的读取和写入,一个是通过INMP441麦克风模块采集音频,一个是通过PCM5102A模块播放音频,那如果我们将两者结合起来,将麦克风采集到的音频通过PCM5102A播放,是不是就可以做一个扩音器了呢…...

相机从app启动流程

一、流程框架图 二、具体流程分析 1、得到cameralist和对应的静态信息 目录如下: 重点代码分析: 启动相机前,先要通过getCameraIdList获取camera的个数以及id,然后可以通过getCameraCharacteristics获取对应id camera的capabilities(静态信息)进行一些openCamera前的…...

Linux云原生安全:零信任架构与机密计算

Linux云原生安全:零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言:云原生安全的范式革命 随着云原生技术的普及,安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测,到2025年,零信任架构将成为超…...

MacOS下Homebrew国内镜像加速指南(2025最新国内镜像加速)

macos brew国内镜像加速方法 brew install 加速formula.jws.json下载慢加速 🍺 最新版brew安装慢到怀疑人生?别怕,教你轻松起飞! 最近Homebrew更新至最新版,每次执行 brew 命令时都会自动从官方地址 https://formulae.…...

渗透实战PortSwigger靶场:lab13存储型DOM XSS详解

进来是需要留言的&#xff0c;先用做简单的 html 标签测试 发现面的</h1>不见了 数据包中找到了一个loadCommentsWithVulnerableEscapeHtml.js 他是把用户输入的<>进行 html 编码&#xff0c;输入的<>当成字符串处理回显到页面中&#xff0c;看来只是把用户输…...