Stable Diffusion - 模型版本

Stable Diffusion模型自发布以来经历了显著的改进,每个版本都从前一个版本中汲取了经验教训。本章比较了Stable Diffusion各个版本之间的功能。

Stable Diffusion 1.x

第一代Stable Diffusion模型,称为 1.x 系列,包括 1.1、1.2、1.3、1.4 和 1.5 版本。它们足以生成各种风格,并且只需要有限的计算能力和资源。

Stable Diffusion 2.x

2.x 系列包括 2.0 和 2.1。该系列已开发用于创建高分辨率图像,以及解释富有表现力和复杂提示的能力。

Stable Diffusion XL 1.0

Stable Diffusion XL 1.0 是最常用的开源版本,可创建高分辨率图像,并具有改进的色彩分级和构图。此外,此版本可以理解复杂的提示和概念。

Stable Diffusion XL Turbo (SDXL Turbo) 是 SDXL 1.0 的扩展,旨在通过一个步骤快速生成图像。

Stable Diffusion 3

Stable Diffusion 3 是 Stability AI 于 2024 年 3 月宣布的最新版本,在解释提示、图像质量和分辨率以及拼写能力等功能方面均有改进。该模型仍处于预览阶段,尚未向公众开放。

比较Stable Diffusion模型

下表总结了Stable Diffusion各个版本的功能和改进 −

功能 SD 1.5 SD 2.0 SD 2.1 SD XL 1.0
发布日期 2022 年 10 月 2022 年 11 月 12 月2022 2023 年 7 月
分辨率 512x512 768x768 768x768 1024x1024
快速技术 OpenAI 的 CLIP Vit-L/14 LAION 的 OpenCLIP-ViT/H LAION 的 OpenCLIP-ViT/H OpenCLIP-ViT/G 和CLIP-ViT/L
优势 适合初学者,在景观和建筑主题上表现更好 改进了对复杂提示的处理和解释,更好的图像分辨率 改进了概念理解,更好的颜色分级和图像质量 更好的肖像,高分辨率和图像质量,缩短的提示
局限性 提示解释不佳 生成限制更多,NSFW 过滤 更"受审查",尤其是在生成名人和艺术风格时。 需要计算资源才能在本地运行