-
初学者修复指南(分步示例)
图像模型和GUI 我们将使用 Stable Diffusion AI 和 AUTOMATIC1111 GUI。请参阅我的快速入门指南以了解如何在 Google 的云服务器中进行设置。 基本修复设置 在本节中,我将逐步向您展示如何使用修复修复小缺陷。 我将使用 Lonely Palace 提示中的原始图像: [emma watson: amber heard: 0.5], (long hair:0.…- 0
- 0
- 42
-
如何使用 Stable Diffusion AI 对图像进行风格化
GUI 我将向您展示如何使用 AUTOMATIC1111 GUI 进行操作。请参阅我的快速入门指南以了解如何在 Google 的云服务器中进行设置。 风格化图像的工作流程 基本理念 基本思想是使用 img2img 以文本提示中指定的新样式修改图像。 不是使用随机潜在状态,而是使用原始图像对初始潜在状态进行编码。添加少量由去噪强度控制的随机性,模型根据文本提示构建新图像。 因此,如果您在文本提示中包…- 0
- 0
- 62
-
稳定扩散模型初学者指南和您应该了解的模型
微调模型 什么是微调? 微调是机器学习中的常用技术。它采用在宽数据集上训练的模型,并在窄数据集上训练更多。 经过微调的模型将偏向于生成与您的数据集相似的图像,同时保持原始模型的多功能性。 人们为什么要制造它们? 稳定的扩散很好,但并不是什么都擅长。例如,它可以并且将在提示中生成带有关键字“anime”的动漫风格图像。但是生成动漫子流派的图像可能很困难。您可以使用该子类型的图像微调模型,而不是修改提…- 0
- 0
- 46
-
如何运行 Stable Diffusion 2.0 并初步了解
网页服务 这是最简单的选择。去访问下面的网站并输入您的提示。 目前只有有限的 Web 选项可用。但在接下来的几周内应该会有更多。 以下是您可以运行 Stable Diffusion 2.0 的网站列表 拥抱的脸 基站 设置仅限于无。 本地安装 安装基础软件 我们将介绍如何在 AUTOMATIC1111 GUI 中使用 Stable Diffusion 2.0。按照您各自环境的安装说明进行操作。 这…- 0
- 0
- 46
-
如何使用AI upscaler改善图像细节
为什么我们需要图像升频器? Stable Diffusion v1 的默认图像大小为 512×512 像素。这在今天的标准中是相当低的。我们以iPhone 12为例。它的相机可生成 12 MP 图像——即 4,032 × 3,024 像素。它的屏幕显示 2,532 x 1,170 像素,因此需要放大未缩放的 Stable Diffusion 图像并且看起来质量很差。 更复杂的是,稳定扩散生成的复杂…- 0
- 0
- 78
-
如何使用 img2img 通过稳定扩散(图像到图像)将业余绘图变成专业绘图
什么是图像到图像? 图像到图像(简称 img2img)是一种从输入图像和文本提示中生成新的 AI 图像的方法。输出图像将遵循输入图像的颜色和构图。 输入图像只是一个指南。它不需要很漂亮或有任何细节。重要的部分是颜色和构图。 提示要求同图文转图一样。 软件设置 我们将在本教程中使用 AUTOMATIC1111 GUI。 启用彩色素描工具 默认情况下,彩色素描工具未打开。使用它使 img2img 变得…- 0
- 0
- 68
-
如何使用VAE改善眼部和面部
什么是 VAE? VAE 代表变分自动编码器。它是神经网络模型的一部分,可对来自较小潜在空间的图像进行编码和解码,从而使计算速度更快。 我需要 VAE 吗? 您无需安装 VAE 文件即可运行 Stable Diffusion——您使用的任何模型,无论是 v1、v2 还是自定义,都已经具有默认的 VAE。 当人们说下载和使用 VAE 时,他们指的是使用它的改进版本。当模型训练器使用附加数据进一步微调…- 0
- 0
- 35
-
如何使用 Dreambooth 将任何东西放入 Stable Diffusion
什么是梦想亭? Dreambooth 由谷歌研究团队于 2022 年发布,是一种通过向模型注入自定义主题来微调扩散模型(如稳定扩散)的技术。 为什么叫Dreambooth?据谷歌研究团队称, 它就像一个照相亭,但一旦捕捉到主题,就可以将其合成到您梦寐以求的任何地方。 听起来不错!但它的效果如何?下面是研究文章中的一个例子。仅使用特定狗(我们称她为 Devora)的 3 张图像作为输入,dreamb…- 0
- 0
- 168
-
如何使用 Stable Diffusion 将照片卡通化
软件设置 我们将在本教程中使用 AUTOMATIC1111GUI。 出于演示的目的,我们将使用以下卡通风格的模型。该技术适用于任何具有独特风格的定制模型。(这就是他们制作定制模型的原因,对吧?) Anything v3 – 动漫风格模型。 任何v3 Inkpunk Diffusion – 日本插画风格。(关键词:nvinkpunk) 墨水朋克扩散。 Mo-Di Diffusion——现代迪士尼风格…- 0
- 0
- 434
-
如何在稳定扩散中使用嵌入
什么是嵌入? 嵌入是文本反转的结果,这是一种在模型中定义新关键字而不修改它的方法。该方法之所以受到关注,是因为它能够将新样式或对象注入到具有少至 3 -5 个样本图像的模型中。 文本反转如何工作? 文本反转的惊人之处不在于添加新样式或对象的能力——其他微调方法也可以做到这一点或做得更好。事实上,它可以在不更改模型的情况下这样做。 下面转载的原始研究文章中的图表说明了它是如何工作的。 通过文本反转为…- 0
- 0
- 49
-
如何在 AUTOMATIC1111 GUI 中安装 Stable Diffusion 2.1
2.1 机型变种 有两种可用的文本到图像模型: 2.1 基础模型:默认图片大小为512×512像素 2.1模型:默认图片大小为768×768像素 768 型号能够生成更大的图像。您可以将图像大小设置为 768×768,而不必担心臭名昭著的双头问题。 这对于生成具有小角色的大场景特别有用。可以生成比 512 模型更清晰的人脸,增加下游升级和人脸修复的成功机会。 768 模型的缺点是生成图像需要更长的…- 0
- 0
- 53
-
如何在 Windows 上安装 Stable Diffusion (AUTOMATIC1111)
系统要求 您的 PC 应运行 Windows 10 或更高版本,并配备具有 4 GB 或更多显存的独立 Nvidia 视频卡 (GPU)。集成 GPU 将不起作用。 如果您的 PC 不满足这些要求,则备选方案是 云服务——Google Colab。 Mac 苹果硅 M1/M2。 安装步骤 第一步:安装python 您将需要 Python 3.10.6 来运行 Stable Diffusion。选择…- 0
- 0
- 119
-
Stable Diffusion 2 中的深度到图像:所有你需要知道的
depth-to-image 能做什么 使用深度到图像,您可以更好地控制单独合成主体和背景。 假设我想把La La Land中的浪漫场景变成一场摔跤比赛...... 原始图像。 我们稍后会详细介绍,但现在只是将深度到图像视为图像到图像的增强版本。它们可以以完全相同的方式使用——给定图像和文本提示,它将生成一个新图像。 假设我使用提示 两个男人摔跤的照片 对于图像到图像和深度到图像。以下是去噪强度从…- 0
- 0
- 37
-
稳定的扩散工作流程(分步示例)
此工作流程中使用的软件 我将在此工作流程中使用 AUTOMATIC1111 GUI,因为我想利用一些高级提示技术并测试多个模型。快速入门指南中的 Colab 笔记本运行此 GUI,并包含本教程中使用的所有模型。如果您想在本地安装此 GUI,请查看 Windows 安装指南。 在后期处理阶段,我将使用免费开源的照片编辑器 GIMP 进行小的最终调整。 1.建立一个基本提示 第一项任务是搜索与您想要的…- 0
- 0
- 94
-
如何在 Apple Silicon M1/M2 Mac 上安装和运行 Stable Diffusion
画东西应用程序 安装说明 画东西 Draw Things 是一款可以安装在 iPhone、iPad 和 Mac 上的 Apple 应用程序。安装它与安装任何其他应用程序没有什么不同。 应用产品页面 它支持相当广泛的开箱即用模型列表以及您可以进行的一组合理的自定义。它还支持修复。 Draw Things App 的优缺点 优点 易于安装 一组很好的功能 缺点 功能不如 AUTOMATIC1111 广…- 0
- 0
- 252
-
如何在 Google Colab 上运行 Stable Diffusion (AUTOMATIC1111)
什么是 AUTOMATIC1111? 如果您想成为 Stable Diffusion 的认真用户,您应该知道 AUTOMATIC1111 是什么。您可以选择不使用它。但是你需要知道它能做什么,因为它是功能的黄金标准,虽然不一定是稳定性…… Stable Diffusion 是一种机器学习模型。本身不是很用户友好。您将需要编写代码才能使用它。这很麻烦。大多数用户使用 GUI(图形用户界面)来使用 S…- 0
- 0
- 28
-
ChatGPT:如何为 Stable Diffusion 生成提示
什么是聊天 GPT? ChatGPT 是 Open AI 于 2022 年 11 月发布的聊天机器人。它建立在 GPT-3 家族的大型语言模型之上,该模型使用互联网上包含数千亿个单词的文本进行训练。 一本几千亿字的书到底有多长?需要一个人五千年以上才能全部读完。 因此,ChatGPT 包含了大量的人类知识。它可以生成散文、诗歌、小说甚至计算机代码。 ChatGPT 是如何训练的? ChatGPT …- 0
- 0
- 387
-
如何使用outpainting扩展图像
需要的软件 在本指南中,我们将使用 AUTOMATIC1111,这是一种流行且功能齐全的稳定扩散 GUI。我们将使用快速入门指南中的一键启动 Colab Notebook。请参阅使用说明。您还可以在 Windows 和 Mac 上安装此 GUI。 启动笔记本电脑时,请确保选择本教程中将使用的 F222 型号。 分步指南 第一步是准备好你的形象。我将使用这张由 Stable Diffusion 生成…- 0
- 0
- 244
-
指导 Pix2Pix:使用文字编辑和风格化照片
Instruct pix2pix 能做什么? 这是一种创新的照片编辑方式,只需告诉它您想要更改的内容即可。例如,假设我们要将马变成下图中的龙。 我们可以简单地把图像给模型,然后说“把马变成龙”。该模型将通过手术将马变成龙,同时保持图像的其余部分完好无损。 Instruct pix2pix 是如何工作的? 有两个部分可以了解模型的工作原理:(1) 模型架构和 (2) 训练数据。 模型架构 Instr…- 0
- 0
- 39
-
Stable Diffusion 提示:权威指南
一个好的提示的剖析 一个好的提示需要详细和具体。一个好的过程是查看关键字类别列表并决定是否要使用其中的任何一个。 关键字类别是 主题 中等的 风格 艺术家 网站 解决 额外细节 颜色 灯光 提示生成器中提供了每个类别的大量关键字列表。您还可以在此处找到简短列表。 您不必包含所有类别的关键字。把它们当作一个清单来提醒你可以使用什么。 让我们回顾一下每个类别,并通过从每个类别中添加关键字来生成一些图像…- 0
- 0
- 35
-
如何使用稳定扩散修复去除多余的肢体
软件 我将在本教程中使用 AUTOMATIC1111 GUI。您可以使用快速入门指南中的 Colab 笔记本一键运行此 GUI。您也可以将其安装在 Windows 和 Mac 上。 我们将需要 v1.5 修复模型。确保在快速入门指南中启动 colab notebook 时检查修复模型。 如果您在本地运行 AUTOMATIC1111,请按照说明安装修复模型。 在第二个示例中,我将使用 Photosh…- 0
- 0
- 83