稳定的扩散工作流程（分步示例）

此工作流程中使用的软件

我将在此工作流程中使用 AUTOMATIC1111 GUI，因为我想利用一些高级提示技术并测试多个模型。快速入门指南中的 Colab 笔记本运行此 GUI，并包含本教程中使用的所有模型。如果您想在本地安装此 GUI，请查看 Windows 安装指南。

在后期处理阶段，我将使用免费开源的照片编辑器 GIMP 进行小的最终调整。

1.建立一个基本提示

第一项任务是搜索与您想要的大致匹配的提示。这包括两个方面：（1）主题和（2）风格。

您应该尽可能详细地描述主题。接下来，包括影响风格和美学的多个关键字。

假设我想创建一个女人的数字插图。使用提示生成器（您还可以在这篇文章中找到关键字列表），我得到以下初始提示

[blake lively:Ana de Armas:0.8] 的数字绘画，全身，当代白色上衣，红色连衣裙，Artgerm，广见，artstation，柔和的眼睛，极其细致的面部，惊人的美丽，高度细致，锐利的焦点，容光焕发光线

放置一个标准的否定提示“以防万一”……

丑陋的，毁容的，畸形的，裁剪过的

我使用关键字混合来控制模型的外观。

这只是草稿提示。我们将在工作流程中对其进行更改。让我们继续下一步。

2.选择型号

测试基本提示也是选择模型的好时机。（阅读这篇文章了解安装和使用模型的说明。）

对于数码人像，我会测试这三个模型：

稳定扩散 1.5：基本模型
F222：专门研究女性（注意：这是 NSFW 模型）
OpenJourney：MidJourney v4 风格

以下是每个模型的样本。我们将根据样式选择模型。不要担心获得完美的图像。缺陷可以在以后修复。

我将使用 512×832 像素的肖像尺寸来增加生成全身肖像的机会。其余参数非常标准：Euler 采样器的 25 个采样步骤，CFG 比例 7。

稳定扩散 v1.5

Stable Diffusion v1.5 生成数字和照片风格的混合。其中一些很好，但其中许多解剖结构不好，很难修复。

来自 Stable Diffusion v1.5 的示例图像。

F222

使用 F222 生成肖像风格的图像是一个安全的选择。通过对大量女性图像进行微调，通常可以正确生成身体部位。它使用此提示生成非常标准的数字艺术风格。

来自 F222 的示例图像。

开放旅程

OpenJourney 使用 MidJourney v4 生成的图像进行训练，MidJourney v4 是一种付费 AI 图像生成服务。这些图像具有独特的感觉和外观。

来自 OpenJourney 的示例图像。

我喜欢 F222 和 OpenJourney 的风格。但是让我们选择 OpenJourney 来继续工作流程。

3.细化提示，得到好的作文

细化提示

现在您已经选择了一个模型，让我们通过添加或删除关键字来优化提示，直到您获得可用于下一阶段的图像。

在测试新提示时，我会一次生成至少 4 张图像。有些提示并不是一直有效。你不想因为一个糟糕的形象而取消提示。

我会添加一些关键字来生成更有趣的背景和灯光效果。

选择一个好的构图

此阶段的目标不是选择完美的图像，而是选择构图良好的图像。以后可以使用修复修复任何小缺陷。

但是不要选择有很多缺陷的。你将花费大量的时间来修复。

眯起眼睛

如何挑选好的作文？这与其他任何艺术品都没有什么不同。一个常见的技巧是在看图像时眯起眼睛。您会看到它的模糊版本，删除了所有分散注意力的细节。如果颜色和形状仍然令您满意，那么它就是一个很好的构图。

唤起情感

你见过让你无法移开视线的艺术品吗？通常情况下，这不是因为技术执行，而是因为艺术传达了一种在情感上触动你的信息。

好的艺术品传递信息并唤起情感。选择一个能引起您共鸣的图像。

选择一张图像进行处理

我将批量大小保持为 4，将种子保持为 -1（随机）。我不断修改提示，生成一批 4 张图像，同时注意构图。

现在，我看到这张图片完全引起了我的共鸣…… 让我们在本教程的其余部分使用它……

具有良好构图的图像。

这是最后的提示：

[blake lively:Ana de Armas:0.8]街头城市景观背景数字绘画，快乐，全身，现代白色上衣，红色连衣裙，（袜子：1.2），Artgerm，广建，artstation，柔和的眼睛，非常详细脸，惊人的美丽，非常详细，锐利的焦点，辐射光线，电影照明，多彩，体积光

否定提示还是一样：

丑陋的，毁容的，畸形的，裁剪过的

4.修复缺陷修复

润色主题

此图像的上半部分形状良好，但下半部分不太连贯。让我们使用修复来修复它。

如果您刚刚使用 AUTOMATIC1111 在 txt2img 选项卡中生成此图像，请使用发送到修复按钮将图像和参数发送到修复选项卡。

如果您已将图像保存在本地存储中，请转到 PNG 信息选项卡，将图像拖放到图像画布中。生成参数将填充在文本框中。按发送进行修复。

导航到 img2img 选项卡。选择修复子选项卡。使用画笔工具为要重新生成的区域绘制蒙版。

为您想要重新生成的区域创建蒙版。

使用原始掩码内容和去噪强度 0.66 进行修复。我想要一件红色连衣裙，所以我删除了关键字“white”，并在提示中将红色连衣裙的强调度提高到 1.3：

[blade lively:Ana de Armas:0.8] 街头城市景观背景中的数字绘画，快乐，全身，现代上衣，（红色连衣裙：1.3），（袜子：1.2），Artgerm，广建，artstation，柔和的眼睛, 非常详细的脸, 惊人的美丽, 非常详细, 锐利的焦点, 辐射光线, 电影照明, 多彩, 体积光

在修复衣服或其他身体部位时，通常不需要全分辨率修复。所以我不选中此选项。

这是我选择的修复结果：

让我们再整理一下腰带和裙子。提示可以保持不变。可以根据您想要的变化量来调整去噪强度。对于此修复，它保持在 0.66 不变。

现在我们得到：

我发现保持掩码内容与原始内容保持一致，但大部分时间都可以上下调整去噪强度。

润色背景

最后，修饰背景以去除任何分散注意力的细节。同样，执行此操作的一个好方法是眯着眼睛看图像的模糊版本。删除背景中突出的任何内容。

使用修复来修饰背景。

现在背景已经固定好，图像的形状非常好！

修复后的图像。

5. 放大图像

这部分工作流程是将图像放大，因为它非常小：只有 512×832 像素。我们将使用 AI 放大器将其放大 4 倍。

在 AUTOMATIC1111 中，在修复结果下，单击发送到 extras。

转到附加选项卡。您可以尝试不同的升频器和设置。请务必将生成的图像保存到本地计算机并放大以检查细节，尤其是脸部。

经过一些实验，这是我确定的设置：

调整大小：4
升频器：R-ESRGAN 4x+
CodeFormer 可见性：~0.5
CodeFormer 权重：~0.5
修脸前高档：有

一般规则是应用您可以逃脱的最少量的面部修复。这可以通过降低 CodeFormer 可见性和/或增加 CodeFormer 权重来实现。在恢复人脸之前进行升级可以减少升级器引入的伪像。

这是升级后的图像：

使用具有面部修复功能的 R-ESRGAN 放大图像。

6. 最终调整

最后一步是使用 GIMP 或您选择的任何照片编辑软件对亮度和对比度进行一些小的调整。您可以做很多事情来修饰图像。我只会提到非常基础的东西：水平、曲线和裁剪。

调整水平

在 GIMP 中，单击顶部菜单中的颜色 → 色阶。调整左右向上箭头，使其覆盖直方图的尾部。这是为了确保图像使用整个强度值范围。

然后将中间的向上箭头调整到您喜欢的亮度级别。

在 GIMP 中调整级别。

调整曲线

在 GIMP 中，单击顶部菜单中的颜色 → 曲线。分别调整曲线的上半部分和下半部分，以独立控制应用于明亮部分和阴影的对比度。

在 GIMP 中调整曲线。

庄稼

与真实照片一样，AI 图像可能需要裁剪以改善构图。这与应用于训练数据的简单自动裁剪有关。

要在 GIMP 中裁剪图像，请单击工具 → 变换工具 → 裁剪。

由于这张图片看起来已经很不错了，所以我不打算裁剪它。

调整大小（可选）

您可以选择调整图像的大小以用于不同的用途。要调整大小，请单击图像 → 缩放图像。输入新的宽度和高度。

在 GIMP 中调整图像大小。

最后结果

所以在这里我们得到了最终的结果。

最终图像。

在此处查看同一工作流程中的更多图像。

回顾一下，此 Stable Diffusion 工作流程中的步骤是

构建基本提示。
选择一个模型。
细化提示并生成具有良好构图的图像。
通过修复修复缺陷。
放大图像。
使用照片编辑软件进行最终调整。

声明：本站部分文章来源于网络，如有侵犯您的合法权益，请您即时与我们联系，我们将在第一时间处理。如需转载本站文章，请在转载时标明出处并保留原文链接，否则我们将保留追究法律责任的权利。

{{userData.name}}已认证

此工作流程中使用的软件

1.建立一个基本提示