这门课讲什么
斯坦福面向计算机视觉的深度学习课,CV 方向的标杆。从图像分类、线性分类器讲到反向传播、卷积神经网络、训练技巧、可视化与迁移学习。它的讲义(cs231n.github.io)本身就是被广泛引用的经典学习材料。
为什么重要
反向传播和 CNN 这两块,CS231n 讲得既深又清楚,值得精读。即使你最终不做视觉方向,这门课对”神经网络到底怎么训练”的打磨,也会迁移到其他领域。
怎么学不踩坑
和 CS224N 二选一:想做视觉、想把反向传播与 CNN 吃透,选这门;想理解大模型,选 CS224N。作业(assignment)要求从零实现,难度不小——这正是它的价值所在,别跳过,但允许自己查资料、对照参考实现。
学到什么程度算过关
能从零实现一个简单 CNN 的前向与反向传播,并在一个图像数据集上训练出合理准确率。
高频英文术语
读 cs231n.github.io 讲义和写 assignment 时,这些词绕不开:
- Convolution 卷积 —— 用小窗口扫过图像提取局部特征的核心运算。
- Kernel / Filter 卷积核 / 滤波器 —— 卷积里那组可学习的权重。
- Feature Map 特征图 —— 卷积输出的中间表示。
- Stride 步幅 —— 卷积核每次滑动的步长。
- Padding 填充 —— 在图像边缘补零以控制输出尺寸。
- Pooling 池化 —— 下采样、压缩特征图(最大/平均池化)。
- ReLU 修正线性单元 —— 最常用的激活函数。
- Softmax 归一化指数 —— 把分数转成类别概率分布。
- Backpropagation 反向传播 —— 逐层回传误差算梯度,这门课的重头戏。
- Transfer Learning 迁移学习 —— 拿预训练模型在新任务上微调。
- Data Augmentation 数据增强 —— 翻转/裁剪等扩充训练数据。
- Convolutional Neural Network (CNN) 卷积神经网络 —— 计算机视觉的主力结构。
重点章节
- 图像分类与线性分类器
- 反向传播
- 卷积神经网络
- 训练技巧
- 可视化与迁移学习
最容易卡在哪
- 作业(assignment)从零实现难度大
- 和 CS224N 二选一时不知该选哪门
辅助资料
- 动手学深度学习 · 现代卷积网络 ↗ 来源:李沐 / d2l