这门课讲什么
斯坦福深度生成模型课,系统讲自回归模型、变分自编码器(VAE)、生成对抗网络(GAN)、扩散模型与评估方法——今天的图像/视频生成都建立在这些之上。
为什么重要
生成式 AI 是当下最热的方向之一。CS236 把”模型如何生成数据”这条线讲透,让你理解扩散、AIGC 背后的原理,而不只是会调工具。
怎么学不踩坑
概率与变分推断门槛较高,公式多。建议每讲一个模型就配一份参考实现对照着读,先把扩散模型这条当下最主流的线吃透。
学到什么程度算过关
能讲清扩散模型的基本原理,并跑通一个小型生成模型。
高频英文术语
理解 AIGC / 扩散背后的原理,先掌握这套生成模型词汇:
- Generative Model 生成模型 —— 学会“造出新数据”的一类模型。
- Autoregressive Model 自回归模型 —— 一个接一个地生成(如逐像素、逐 token)。
- Variational Autoencoder (VAE) 变分自编码器 —— 用隐变量+变分推断做生成。
- Generative Adversarial Network (GAN) 生成对抗网络 —— 生成器与判别器对抗训练。
- Latent Variable 隐变量 —— 隐藏在数据背后、不可直接观测的因素。
- Normalizing Flow 标准化流 —— 用可逆变换构造可算似然的生成模型。
- Diffusion Model 扩散模型 —— 加噪再学去噪,当下图像/视频生成主流。
- Evidence Lower Bound (ELBO) 证据下界 —— VAE 优化的目标函数。
- KL Divergence KL 散度 —— 衡量两个概率分布的差异。
- Score-Based Model 基于分数的模型 —— 与扩散密切相关的一类方法。
- Sampling 采样 —— 从模型分布里抽出新样本。
- Likelihood 似然 —— 模型认为某数据出现的概率,常作训练目标。
重点章节
- 自回归模型
- 变分自编码器 VAE
- 生成对抗网络 GAN
- 扩散模型
- 评估
最容易卡在哪
- 概率与变分推断门槛高
- 公式多,需配代码理解
辅助资料
- 动手学深度学习 · 生成模型相关 ↗ 来源:李沐 / d2l