Stable Diffusion XL

Stable Diffusion XL 1.0 是文本到图像生成模型发展过程中的重大进步。此版本是 Stability AI 的旗舰模型,经过改进,成为世界上最好的图像生成模型,由限量版、仅供研究使用的 SDXL 0.9 接替。本章探讨了 Stable Diffusion XL (SDXL) 1.0 的功能、访问方式和局限性。

Stable Diffusion XL 的功能

据报道,当 Stability AI 将 SDXL 1.0 与其他各种模型进行测试时,结果是,与其他版本相比,人们更喜欢这个模型。该版本提供的一些关键功能是 −

  • 上下文理解 −其中一个显著的改进是模型能够理解和解释复杂的提示。
  • 清晰易读的文本 − 该模型还专注于生成准确清晰的文本,即图像上的文本。
  • 更好的肖像 − 虽然以前的模型在生成人体肖像和解剖结构方面存在问题。该模型通过生成更好的质量在一定程度上解决了该问题。
  • 艺术风格 − Stable Diffusion XL 为图像生成提供了各种艺术风格,例如动漫、数字艺术、电影、3D 模型等。
  • 提示 − 您不再需要提供冗长的提示来获得所需的结果,SDXL 比以前的模型更好地理解简短的提示。
  • 开源和色彩合成 − SDXL 之所以是 Stable Diffusion 所有版本中最常用的模型,是因为它是开源的,并且旨在生成高质量图像以及更好的色彩分级和构图。

如何访问 Stable Diffusion XL?

有很多方法可以获得 SDXL 模型。访问和使用 Stable Diffusion XL 的四种主要方式是 −

在线访问 Stable Diffusion XL 1.0

Clipdrop 是免费访问 Stable Diffusion XL 的最简单方法之一。导航到他们的官方网站后,您可以输入提示或从预先写好的示例中进行选择并生成图像。

使用 Discord 访问 Stable Diffusion XL 1.0

生成图像的另一种最简单方法是通过 Discord 访问它。开始使用后,请访问 #bot-1 - #bot-10 频道之一,您将找到以下命令来输入提示符 "/dream prompt: *enter prompt here*。输入提示符后,机器人将生成两张图片,这让您可以选择更好的图片,也有助于训练模型。

使用 Hugging Face 访问 Stable Diffusion XL 1.0

该模型目前可在 Hugging Face 上下载。单击此处下载 SDXL 1.0 基础模型

Stable Diffusion XL Turbo

SDXL 的下一个增强版本是 Stable Diffusion XL Turbo,采用名为对抗扩散蒸馏 (ADD),允许模型在单个步骤中合成图像。

您也可以通过在 Hugging Face 上下载模型权重和代码或访问 Stability AI 的图像编辑平台 Clipdrop 来访问此模型。

Stable Diffusion XL 的局限性

该模型有一些局限性,例如 −

  • 它无法生成完美的照片写实效果。
  • 它很难生成具有复杂提示的任务。
  • 它在生成肖像和人物方面也存在困难。
  • 它在生成清晰易读的文本方面不是很准确,但比之前的模型。
  • 由于模型的自动编码部分是有损的,因此在编码过程中可能会丢失信息。