这门课讲什么
MIT 的深度学习导论,每年更新的快节奏 survey:神经网络与反向传播、卷积网络、循环网络与序列建模、生成模型,近年已覆盖 LLM 与生成式 AI。节奏快、信息密、紧跟热点。
为什么重要
它的价值是快速建立深度学习的全景直觉。在投入 CS231n / CS224N 这类高强度课之前,先用它把”深度学习有哪些大块、各自在解决什么”过一遍,后面学起来就有地图。和 CMU 11-785 主题高度重叠——普通路径取这门 survey 即可,不必两门都修。
怎么学不踩坑
因为是 survey,每个概念都点到为止,想深入会发现不够细——这是正常的,深度交给后面的专门课。建议配一个动手项目边学边搭,把”看过”变成”会用”。
学到什么程度算过关
能用 PyTorch 或 TensorFlow 搭一个能训练收敛的小神经网络,并说清反向传播在做什么。
高频英文术语
深度学习的全景词,这门 survey 会快速带过,先眼熟起来:
- Neural Network 神经网络 —— 由层层神经元组成的可训练函数。
- Backpropagation 反向传播 —— 用链式法则把误差逐层回传、算梯度的核心算法。
- Activation Function 激活函数 —— 给网络引入非线性(ReLU、Sigmoid 等)。
- Convolutional Neural Network (CNN) 卷积神经网络 —— 擅长图像的网络结构。
- Recurrent Neural Network (RNN) 循环神经网络 —— 处理序列数据的结构。
- LSTM 长短期记忆网络 —— 解决 RNN 长程依赖问题的改进版。
- Attention 注意力机制 —— 让模型聚焦于关键输入,Transformer 的核心。
- Generative Model 生成模型 —— 学会“造数据”的一类模型。
- Dropout 随机失活 —— 训练时随机丢神经元来防过拟合。
- Batch Normalization 批归一化 —— 稳定并加速训练的常用技巧。
- Gradient Descent 梯度下降 —— 调参把损失降下来的优化方法。
重点章节
- 神经网络与反向传播
- 卷积网络
- 循环网络与序列建模
- 生成模型
- 大模型概览
最容易卡在哪
- 节奏快,概念一带而过
- 想深入却发现 survey 课不够细
辅助资料
- 动手学深度学习 · 卷积神经网络 ↗ 来源:李沐 / d2l