深度学习生成模型(三)—— 扩散模型:DDPM 与 Stable Diffusion(五十一)

深度学习生成模型(三)—— 扩散模型:DDPM 与 Stable Diffusion(五十一)

1. 定位导航

🎉2021 后视觉生成的统治者!

第 49-50 篇我们看到了 VAE(模糊但稳定)和 GAN(清晰但不稳定)的经典权衡。扩散模型2020-2021 横空出世,两者兼得

  • 清晰程度超过 GAN
  • 训练稳定性接近 VAE

催生了

  • Stable Diffusion(2022):开源文生图革命
  • DALL-E 2/3(OpenAI)
  • Midjourney
  • Imagen(Google)
  • Sora(视频生成)
  • AlphaFold 3(蛋白质生成)

核心想法(极简):

教模型"逐步去噪"——把白噪声一步步变成图像。

2. 核心想法:加噪 → 去噪

2.1 直觉故事

想象一张清晰的图