输入否定提示
许多 Stable Diffusion GUI 或 Web 服务提供否定提示。在 AUTOMATIC1111(此处安装说明)中,您在输入提示的位置下方输入否定提示。
AUTOMATIC1111中否定提示输入框
但是,如果您找不到在其他 GUI 或服务中输入否定提示的方法,请不要感到惊讶。这是 v1 模型中的一个非官方功能。
用例
我将通过几个使用否定提示的示例,以便您了解可以做什么以及如何调整它。我将在本节中使用 v1.5 基本模型,但这些技术适用于 v2 模型。
搬东西
第一个明显的用法是删除您不想在图像中看到的任何内容。假设您在雨天生成了一幅巴黎的画作。
Prompt: autumn in paris, ornate, beautiful, atmosphere, vibe, mist, smoke, fire, chimney, rain, wet, pristine, puddles, melting, dripping, snow, creek, lush, ice, bridge, forest, roses, flowers, by stanley artgerm lau, greg rutkowski, thomas kindkade, alphonse mucha, loish, norman rockwell. Seed: 1923936260
你想生成另一个,但不是一条空荡荡的街道。你可以做的是使用相同的种子值,它指定图像,并添加否定提示“people”。您会得到一张删除了大多数人的图像。
添加否定提示“人”但保持相同的提示和种子。
请注意,场景与原始场景非常相似但不完全相同。如果你真的需要原来的,你将需要使用修复来在保持场景连贯的同时煞费苦心地移除人物。
你可能已经注意到上图中还剩下一个人。您可以通过强调否定提示来告诉 Stable Diffusion 更加努力(people:1.3)
。这告诉 Stable Diffusion,关键字people
现在的重要性提高了 30%。
对否定提示增加 30% 的强调people
会移除最后一个人。
请记住,虽然您可以在 AUTOMATIC1111 中使用关键字强调,但并非所有服务都普遍支持它。在给我写一封愤怒的电子邮件之前,一定要检查一下你正在使用的那个……
修改图像
您可以轻推 Stable Diffusion 以根据负面提示做出细微的改变。您不想完全删除任何内容,只是对主题进行细微更改。
让我们处理这个基本图像:
Prompt: emma watson as nature magic celestial, top down pose, long hair, soft pink and white transparent cloth, space, D&D, shiny background, intricate, elegant, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, artgerm, bouguereau. Seed: 479804672
看样子风大了,头发都飘了。让我们使用否定提示“windy”来保持头发顺畅。
添加否定提示“有风”可以使头发垂下来。
原始图像中的艾玛看起来有点……发育不全。使用否定提示“未成年”让她看起来更像成年人。
否定提示:未成年。
如果我们不介意风但想让头发盖住耳朵怎么办?让我们添加具有不同强调因素的否定提示“耳朵”。下面是三个越来越重要的 1.3、1.6 和 1.9。
(耳朵:1.3)
(耳朵:1.6)
(耳朵:1.9)
在所有强调因子中,耳朵被头发覆盖得更多,但当因子达到 1.9 时,图像的构图发生了变化。负面提示会强烈影响扩散过程。
带关键词切换的否定提示
现在,如果您真的想使用高度强调怎么办(ear:1.9)
?我不知道你的耳朵有什么问题,但我有一个技巧可以教给你。您可以使用关键字切换,首先使用无意义的词作为否定提示,然后(ear:1.9)
在稍后的采样步骤中切换到。
让我们选择the
无意义的、无用的否定提示。您可以通过将其放在否定提示中来验证其无用性。您将获得与未放置任何内容相同的图像。现在将其用作否定提示:
[the: (ear:1.9): 0.5]
因为,我使用了 20 个采样步骤,这意味着the
在步骤 1-10 和(ear:1.9)
步骤 11-20 中用作否定提示。
这背后的原因是扩散过程在开始步骤中最为重要。后面的步骤只是对细节进行更精细的调整,例如覆盖耳朵的头发。
仅在稍后的步骤中切换到否定提示。
现在我们所取得的成就简直令人惊叹。
(ear:1.9)
我们现在可以在不改变构图的情况下使用更强烈的强调。- 我们得到的图像更接近原始图像。
- 耳朵被遮住了。
修改样式
否定提示不仅对修改内容有用,对修改样式也很有用。为什么要使用否定提示来改变风格?有时在正面提示中添加太多只会混淆扩散器。想象一下有人告诉你同时去 77 个(令牌限制)个地方。如果他们告诉您应该避免哪些区域,这会有所帮助。
锐化
您可以在否定提示中使用“模糊”,而不是在提示中使用关键字“sharp”、“focused”。图像确实变得更清晰。
在否定提示中使用“模糊”会使图像更加清晰。
真实感
使用否定提示painting, cartoon
会使它更像照片。
如果你想保持原来的构图,你可以尝试我前面提到的关键字切换。使用[the: (painting cartoon:1.9): 0.3]
我们得到:
它更接近原版,但增加了写实风格。
否定提示对v2模型很重要
Stable Diffusion v2.1 的否定提示
与 Max Woolf 的发现一致,我自己的经验是否定提示对于 v2 模型非常重要。下面我使用了生成逼真的人类的积极提示,但使用的是 Stable Diffusion 2.1 模型。
一位年轻女性,头发上有亮点,坐在餐厅外面,棕色眼睛,穿着裙子,侧灯
稳定扩散 2.1。添加更多负面提示可以改善图像。
仅添加两到三个负面提示即可逐步改善图像的美感。我会说这非常接近 v1 模型的质量。
Stable Diffusion v1.5 的否定提示
让我们在 v1.5 模型上重复这个练习。
v1.5 添加否定提示。改进不明确。
在 v1.5 中没有任何负面提示,图像效果非常好。添加否定提示ugly, deformed and disfigured
可能会有所改善,但不如 v2.1 中那样清晰。好像v1.5模型不理解这些话。
为什么否定提示在 v2 中变得更加重要?
这是一个我只能推测的领域……但为什么不呢?v2 的两个变化是
- 使用更大的 OpenCLIP 语言模型。
- 过滤掉训练数据中的 NSFW 内容。
第一个嫌疑人是从 Open AI 的 CLIP 模型切换到 OpenCLIP。这会影响模型的嵌入。Open AI 使用专有数据训练 CLIP 模型。如果数据经过精心策划,每个人看起来都远高于平均水平,那么提示“女人”与提示“漂亮女人”是一样的。这将使提示更容易。
我的第二个猜测是,被认为是 NSFW 的东西也可能具有很高的美感。这可能是过滤器的故障,或者只是 NSFW 图像的性质。排除 NSFW 图像也会无意中使数据偏向坏的和丑陋的。
v2 模型中的样板否定提示
我们已经谈到了 v2 中否定提示的重要性。现在让我们找到一个好的通用否定提示。
搜索一个好的否定提示
我将使用 2.1 模型(512 像素)进行此测试。没有否定提示的原件是
原件。
不错,但可以改进。使用我们极简主义的否定提示,我们立即看到了改进:
负面提示:丑陋、毁容、畸形
添加underexposed
和overexposed
有助于使图像不那么平坦。
负面提示:曝光不足、曝光过度、丑陋、毁容、畸形。
添加low contrast
.
Negative prompt: low contrast, underexposed, overexposed, ugly, disfigured, deformed
接下来,让我们测试一下这个在互联网上流传的流行的 v2 负面提示:
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft
我认为它做得不错,尽管它可能稍微修改了样式。这可能是由否定关键字引起的blurry, blurred, grainy, draft
。有些款式可能看起来就是这样。删除这些关键字似乎更接近原来的风格。
Negative prompt: ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off
接下来,添加我们刚刚使用的照明关键字 ( low contrast, underexposed, overexposed
)。它确实有助于对比度和动态范围。
Negative prompt: ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed
现在添加更多否定关键字以避免采样不良艺术或新手绘图,我们到达下面的最后一个否定提示。这是一个相当不错的样板否定提示,不会影响样式。
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
与没有负面提示相比,这是一个巨大的改进。如果是风格,您可能想要去除低对比度、曝光不足或曝光过度。
通用否定提示
我们将把刚刚找到的 v2 的通用否定提示放入一组测试中,看看它的性能如何。回顾一下,通用的否定提示是
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
照片风格
迅速的:
A man walking around her neighborhood, highlight hair, detailed eyes, sharp focus, young face, perfect symmetric face, pupil reflecting surroundings, realistic skin, soft healthy skin
没有否定提示。
带有否定提示。
通用否定提示与照片风格图像配合得很好。这家伙看起来高出一个联盟,而且早上肯定花了更多的时间在他的头发上……
胺式
迅速的:
anime style girl on battleground, holding a ninja sword, detailed eyes, perfect face
没有否定提示。
带有否定提示。
通用的否定提示同样可以很好地帮助动漫风格的角色。这个对象站得更好,更英俊,也更愿意战斗,就像它看起来的那样。忍者刀直立起来,看起来更加危险。
油画风格
约翰·萨金特 (John Sargent) 的印象派油画,一位年轻人站在一辆红色特斯拉敞篷跑车旁边
没有否定提示。
带有否定提示。
普遍的否定提示对特斯拉和那个人都有帮助。现在它展示的是一辆闪亮的新车和一个看起来身价百万的年轻人,而不是展示一辆破旧的汽车和一个问题少年。
结论
看起来这个 v2 通用否定提示在各种风格下都能很好地工作!我们的两部分否定提示系列到此结束。