Stable Diffusion - 模型版本
Stable Diffusion模型自发布以来经历了显著的改进,每个版本都从前一个版本中汲取了经验教训。本章比较了Stable Diffusion各个版本之间的功能。
Stable Diffusion 1.x
第一代Stable Diffusion模型,称为 1.x 系列,包括 1.1、1.2、1.3、1.4 和 1.5 版本。它们足以生成各种风格,并且只需要有限的计算能力和资源。
Stable Diffusion 2.x
2.x 系列包括 2.0 和 2.1。该系列已开发用于创建高分辨率图像,以及解释富有表现力和复杂提示的能力。
Stable Diffusion XL 1.0
Stable Diffusion XL 1.0 是最常用的开源版本,可创建高分辨率图像,并具有改进的色彩分级和构图。此外,此版本可以理解复杂的提示和概念。
Stable Diffusion XL Turbo (SDXL Turbo) 是 SDXL 1.0 的扩展,旨在通过一个步骤快速生成图像。
Stable Diffusion 3
Stable Diffusion 3 是 Stability AI 于 2024 年 3 月宣布的最新版本,在解释提示、图像质量和分辨率以及拼写能力等功能方面均有改进。该模型仍处于预览阶段,尚未向公众开放。
比较Stable Diffusion模型
下表总结了Stable Diffusion各个版本的功能和改进 −
功能 | SD 1.5 | SD 2.0 | SD 2.1 | SD XL 1.0 |
---|---|---|---|---|
发布日期 | 2022 年 10 月 | 2022 年 11 月 | 12 月2022 | 2023 年 7 月 |
分辨率 | 512x512 | 768x768 | 768x768 | 1024x1024 |
快速技术 | OpenAI 的 CLIP Vit-L/14 | LAION 的 OpenCLIP-ViT/H | LAION 的 OpenCLIP-ViT/H | OpenCLIP-ViT/G 和CLIP-ViT/L |
优势 | 适合初学者,在景观和建筑主题上表现更好 | 改进了对复杂提示的处理和解释,更好的图像分辨率 | 改进了概念理解,更好的颜色分级和图像质量 | 更好的肖像,高分辨率和图像质量,缩短的提示 |
局限性 | 提示解释不佳 | 生成限制更多,NSFW 过滤 | 更"受审查",尤其是在生成名人和艺术风格时。 | 需要计算资源才能在本地运行 |