AI 自学作战地图
返回学习地图

Stanford · 系统与前沿

CS231n · 面向计算机视觉的深度学习

Deep Learning for Computer Vision

CV 方向的标杆课,讲义本身就是经典材料,反向传播与 CNN 部分尤其值得精读。

中文重点解读

这门课讲什么

斯坦福面向计算机视觉的深度学习课,CV 方向的标杆。从图像分类、线性分类器讲到反向传播、卷积神经网络、训练技巧、可视化与迁移学习。它的讲义(cs231n.github.io)本身就是被广泛引用的经典学习材料。

为什么重要

反向传播和 CNN 这两块,CS231n 讲得既深又清楚,值得精读。即使你最终不做视觉方向,这门课对”神经网络到底怎么训练”的打磨,也会迁移到其他领域。

怎么学不踩坑

和 CS224N 二选一:想做视觉、想把反向传播与 CNN 吃透,选这门;想理解大模型,选 CS224N。作业(assignment)要求从零实现,难度不小——这正是它的价值所在,别跳过,但允许自己查资料、对照参考实现。

学到什么程度算过关

能从零实现一个简单 CNN 的前向与反向传播,并在一个图像数据集上训练出合理准确率。

高频英文术语

读 cs231n.github.io 讲义和写 assignment 时,这些词绕不开:

  • Convolution 卷积 —— 用小窗口扫过图像提取局部特征的核心运算。
  • Kernel / Filter 卷积核 / 滤波器 —— 卷积里那组可学习的权重。
  • Feature Map 特征图 —— 卷积输出的中间表示。
  • Stride 步幅 —— 卷积核每次滑动的步长。
  • Padding 填充 —— 在图像边缘补零以控制输出尺寸。
  • Pooling 池化 —— 下采样、压缩特征图(最大/平均池化)。
  • ReLU 修正线性单元 —— 最常用的激活函数。
  • Softmax 归一化指数 —— 把分数转成类别概率分布。
  • Backpropagation 反向传播 —— 逐层回传误差算梯度,这门课的重头戏。
  • Transfer Learning 迁移学习 —— 拿预训练模型在新任务上微调。
  • Data Augmentation 数据增强 —— 翻转/裁剪等扩充训练数据。
  • Convolutional Neural Network (CNN) 卷积神经网络 —— 计算机视觉的主力结构。
Key Chapters

重点章节

  • 图像分类与线性分类器
  • 反向传播
  • 卷积神经网络
  • 训练技巧
  • 可视化与迁移学习
Common Blocks

最容易卡在哪

  • 作业(assignment)从零实现难度大
  • 和 CS224N 二选一时不知该选哪门
中文配套

辅助资料

Pass Bar

学到什么程度算过关

能从零实现一个简单 CNN 的前向与反向传播,并在一个图像数据集上训练出合理准确率。