什么是 VAE?
VAE 代表变分自动编码器。它是神经网络模型的一部分,可对来自较小潜在空间的图像进行编码和解码,从而使计算速度更快。
我需要 VAE 吗?
您无需安装 VAE 文件即可运行 Stable Diffusion——您使用的任何模型,无论是 v1、v2 还是自定义,都已经具有默认的 VAE。
当人们说下载和使用 VAE 时,他们指的是使用它的改进版本。当模型训练器使用附加数据进一步微调模型的 VAE 部分时,就会发生这种情况。他们不是发布一个大文件的全新模型,而是只发布已更新的小部分。
使用VAE有什么效果?
通常,它很小。改进后的 VAE 可以更好地从潜在空间解码图像。细节得到更好的恢复。它有助于在所有精细细节都很重要的地方渲染眼睛和文本。
Stability AI 发布了两种经过微调的 VAE 解码器变体,EMA 和 MSE。(指数移动平均和均方误差是衡量自动编码器好坏的指标。)
请参阅下面转载的比较。
Stability AI 对 EMA、MSE 和原始解码器的比较。(256×256 图像)
你应该使用哪一个?Stability 对 256×256 图像的评估是 EMA 产生更清晰的图像,而 MSE 的图像更平滑。(这符合我自己的测试。)
在我自己使用 512×512 图像对 Stable Diffusion v1.4 和 v1.5 进行的测试中,我发现某些图像在渲染眼睛方面有很大改进,尤其是当面部较小时。我没有看到渲染文本有任何改进,但我认为无论如何,没有多少人因此而使用 Stable Diffusion。
在任何情况下,新的 VAE 都不会表现得更差。要么做得更好,要么什么都不做。
下面是使用稳定扩散 v1.5 模型的原始、EMA 和 MSE 之间的比较。(提示可以在这里找到。)放大并比较差异。
原来的
母亲
均方误差
使用 SD v1.5 的原始、EMA 和 MSE 之间的 VAE 比较。请注意,原始图像中的乱码眼睛已恢复。
对文本生成的改进不是很清楚(在提示中添加了“拿着一个标志说稳定扩散”):
原来的
母亲
均方误差
原始、EMA 和 MSE 之间的 VAE 比较。文本渲染的改进尚不清楚。
您还可以将这些 VAE 与自定义模型一起使用。我测试了一些动漫模型,但没有看到任何改进。我鼓励你自己做测试。
最后一点,EMA 和 MSE 与 Stable Diffusion v2.0 兼容。您可以使用它们,但效果很小。2.0已经很擅长渲染眼睛了。也许他们已经将改进纳入了模型。
我应该使用 VAE 吗?
如果您对获得的结果感到满意,则无需使用 VAE。例如,您已经在使用像 CodeFormer 这样的面部修复来修复眼睛。
如果你在接受所有你能得到的小改进的阵营,你应该使用 VAE。您只需要经历一次设置的麻烦。之后,艺术创作工作流程保持不变。
如何使用VAE?
VAE 可以在快速入门指南中包含的 Colab Notebook 中使用。
下载
目前,Stability 发布了两个改进版本的 VAE。下面是直接下载链接。
EMA VAE 的下载链接
MSE VAE 的下载链接
安装
此安装说明适用于 AUTOMATIC1111 GUI。将下载的VAE文件放在目录下
stable-diffusion-webui/models/VAE
适用于 Linux 和 Mac 操作系统
为方便起见,在 Linux 或 Mac OS 的 stable-diffusion-webui 目录下运行以下命令下载并安装 VAE 文件。
wget https://huggingface.co/stabilityai/sd-vae-ft-ema-original/resolve/main/vae-ft-ema-560000-ema-pruned.ckpt -O models/VAE/vae-ft-ema-560000-ema-pruned.ckptwget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.ckpt -O models/VAE/vae-ft-mse-840000-ema-pruned.ckpt
使用
要在 AUTOMATIC1111 GUI 中使用 VAE,请转到“设置”选项卡并单击左侧的“Stabe Diffusion”部分。
并找到一个名为 SD VAE 的部分。在下拉菜单中,选择要使用的 VAE 文件。
按顶部的大红色应用设置按钮。你应该看到消息
设置:已应用 sd_vae
加载成功后在“设置”选项卡中。
下拉菜单中的其他选项是:
- None:使用模型自带的原版VAE。
- 自动:请参阅此帖子了解行为。我不建议初学者使用 Auto,因为它很容易混淆使用的是哪个 VAE。
专业提示:如果找不到设置,请单击左侧的“显示所有页面”。所有设置都将显示在一个页面上。使用 Ctrl-F 查找设置。
概括
我们已经了解了如何使用 Stability AI 发布的两个改进的 VAE 解码器。它们为渲染眼睛提供了微小但显着的改进。您可以决定是否要使用它。
我正在使用它,因为我没有看到任何损害我图像的情况。我希望这篇文章有所帮助!