AI 自学作战地图

返回学习地图

Stanford · 深度学习

CS236 · 深度生成模型

Deep Generative Models

系统讲自回归、VAE、GAN、扩散等生成模型，理解今天图像/视频生成的底层。

去官方学习 ↗

中文重点解读

这门课讲什么

斯坦福深度生成模型课，系统讲自回归模型、变分自编码器（VAE）、生成对抗网络（GAN）、扩散模型与评估方法——今天的图像/视频生成都建立在这些之上。

为什么重要

生成式 AI 是当下最热的方向之一。CS236 把”模型如何生成数据”这条线讲透，让你理解扩散、AIGC 背后的原理，而不只是会调工具。

怎么学不踩坑

概率与变分推断门槛较高，公式多。建议每讲一个模型就配一份参考实现对照着读，先把扩散模型这条当下最主流的线吃透。

学到什么程度算过关

能讲清扩散模型的基本原理，并跑通一个小型生成模型。

高频英文术语

理解 AIGC / 扩散背后的原理，先掌握这套生成模型词汇：

Generative Model 生成模型 —— 学会“造出新数据”的一类模型。
Autoregressive Model 自回归模型 —— 一个接一个地生成（如逐像素、逐 token）。
Variational Autoencoder (VAE) 变分自编码器 —— 用隐变量+变分推断做生成。
Generative Adversarial Network (GAN) 生成对抗网络 —— 生成器与判别器对抗训练。
Latent Variable 隐变量 —— 隐藏在数据背后、不可直接观测的因素。
Normalizing Flow 标准化流 —— 用可逆变换构造可算似然的生成模型。
Diffusion Model 扩散模型 —— 加噪再学去噪，当下图像/视频生成主流。
Evidence Lower Bound (ELBO) 证据下界 —— VAE 优化的目标函数。
KL Divergence KL 散度 —— 衡量两个概率分布的差异。
Score-Based Model 基于分数的模型 —— 与扩散密切相关的一类方法。
Sampling 采样 —— 从模型分布里抽出新样本。
Likelihood 似然 —— 模型认为某数据出现的概率，常作训练目标。

Key Chapters

重点章节

自回归模型
变分自编码器 VAE
生成对抗网络 GAN
扩散模型
评估

Common Blocks

最容易卡在哪

概率与变分推断门槛高
公式多，需配代码理解

中文配套

辅助资料

动手学深度学习 · 生成模型相关 ↗ 来源：李沐 / d2l

Pass Bar

学到什么程度算过关

能讲清扩散模型的基本原理，并跑通一个小型生成模型。