Stable Diffusion - 模型版本

Stable Diffusion模型自发布以来经历了显著的改进，每个版本都从前一个版本中汲取了经验教训。本章比较了Stable Diffusion各个版本之间的功能。

Stable Diffusion 1.x

第一代Stable Diffusion模型，称为 1.x 系列，包括 1.1、1.2、1.3、1.4 和 1.5 版本。它们足以生成各种风格，并且只需要有限的计算能力和资源。

2.x 系列包括 2.0 和 2.1。该系列已开发用于创建高分辨率图像，以及解释富有表现力和复杂提示的能力。

Stable Diffusion XL 1.0 是最常用的开源版本，可创建高分辨率图像，并具有改进的色彩分级和构图。此外，此版本可以理解复杂的提示和概念。

Stable Diffusion XL Turbo (SDXL Turbo) 是 SDXL 1.0 的扩展，旨在通过一个步骤快速生成图像。

Stable Diffusion 3 是 Stability AI 于 2024 年 3 月宣布的最新版本，在解释提示、图像质量和分辨率以及拼写能力等功能方面均有改进。该模型仍处于预览阶段，尚未向公众开放。

下表总结了Stable Diffusion各个版本的功能和改进 −

功能	SD 1.5	SD 2.0	SD 2.1	SD XL 1.0
发布日期	2022 年 10 月	2022 年 11 月	12 月2022	2023 年 7 月
分辨率	512x512	768x768	768x768	1024x1024
快速技术	OpenAI 的 CLIP Vit-L/14	LAION 的 OpenCLIP-ViT/H	LAION 的 OpenCLIP-ViT/H	OpenCLIP-ViT/G 和CLIP-ViT/L
优势	适合初学者，在景观和建筑主题上表现更好	改进了对复杂提示的处理和解释，更好的图像分辨率	改进了概念理解，更好的颜色分级和图像质量	更好的肖像，高分辨率和图像质量，缩短的提示
局限性	提示解释不佳	生成限制更多，NSFW 过滤	更"受审查"，尤其是在生成名人和艺术风格时。	需要计算资源才能在本地运行