AI 自学作战地图
返回学习地图

Stanford · 深度学习

CS236 · 深度生成模型

Deep Generative Models

系统讲自回归、VAE、GAN、扩散等生成模型,理解今天图像/视频生成的底层。

中文重点解读

这门课讲什么

斯坦福深度生成模型课,系统讲自回归模型、变分自编码器(VAE)、生成对抗网络(GAN)、扩散模型与评估方法——今天的图像/视频生成都建立在这些之上。

为什么重要

生成式 AI 是当下最热的方向之一。CS236 把”模型如何生成数据”这条线讲透,让你理解扩散、AIGC 背后的原理,而不只是会调工具。

怎么学不踩坑

概率与变分推断门槛较高,公式多。建议每讲一个模型就配一份参考实现对照着读,先把扩散模型这条当下最主流的线吃透。

学到什么程度算过关

能讲清扩散模型的基本原理,并跑通一个小型生成模型。

高频英文术语

理解 AIGC / 扩散背后的原理,先掌握这套生成模型词汇:

  • Generative Model 生成模型 —— 学会“造出新数据”的一类模型。
  • Autoregressive Model 自回归模型 —— 一个接一个地生成(如逐像素、逐 token)。
  • Variational Autoencoder (VAE) 变分自编码器 —— 用隐变量+变分推断做生成。
  • Generative Adversarial Network (GAN) 生成对抗网络 —— 生成器与判别器对抗训练。
  • Latent Variable 隐变量 —— 隐藏在数据背后、不可直接观测的因素。
  • Normalizing Flow 标准化流 —— 用可逆变换构造可算似然的生成模型。
  • Diffusion Model 扩散模型 —— 加噪再学去噪,当下图像/视频生成主流。
  • Evidence Lower Bound (ELBO) 证据下界 —— VAE 优化的目标函数。
  • KL Divergence KL 散度 —— 衡量两个概率分布的差异。
  • Score-Based Model 基于分数的模型 —— 与扩散密切相关的一类方法。
  • Sampling 采样 —— 从模型分布里抽出新样本。
  • Likelihood 似然 —— 模型认为某数据出现的概率,常作训练目标。
Key Chapters

重点章节

  • 自回归模型
  • 变分自编码器 VAE
  • 生成对抗网络 GAN
  • 扩散模型
  • 评估
Common Blocks

最容易卡在哪

  • 概率与变分推断门槛高
  • 公式多,需配代码理解
中文配套

辅助资料

Pass Bar

学到什么程度算过关

能讲清扩散模型的基本原理,并跑通一个小型生成模型。