AI 自学作战地图
返回学习地图

MIT · 深度学习

MIT 6.S191 · 深度学习导论

Introduction to Deep Learning

每年更新的快节奏深度学习入门,已覆盖 LLM 与生成式 AI,适合快速建立直觉。

中文重点解读

这门课讲什么

MIT 的深度学习导论,每年更新的快节奏 survey:神经网络与反向传播、卷积网络、循环网络与序列建模、生成模型,近年已覆盖 LLM 与生成式 AI。节奏快、信息密、紧跟热点。

为什么重要

它的价值是快速建立深度学习的全景直觉。在投入 CS231n / CS224N 这类高强度课之前,先用它把”深度学习有哪些大块、各自在解决什么”过一遍,后面学起来就有地图。和 CMU 11-785 主题高度重叠——普通路径取这门 survey 即可,不必两门都修

怎么学不踩坑

因为是 survey,每个概念都点到为止,想深入会发现不够细——这是正常的,深度交给后面的专门课。建议配一个动手项目边学边搭,把”看过”变成”会用”。

学到什么程度算过关

能用 PyTorch 或 TensorFlow 搭一个能训练收敛的小神经网络,并说清反向传播在做什么。

高频英文术语

深度学习的全景词,这门 survey 会快速带过,先眼熟起来:

  • Neural Network 神经网络 —— 由层层神经元组成的可训练函数。
  • Backpropagation 反向传播 —— 用链式法则把误差逐层回传、算梯度的核心算法。
  • Activation Function 激活函数 —— 给网络引入非线性(ReLU、Sigmoid 等)。
  • Convolutional Neural Network (CNN) 卷积神经网络 —— 擅长图像的网络结构。
  • Recurrent Neural Network (RNN) 循环神经网络 —— 处理序列数据的结构。
  • LSTM 长短期记忆网络 —— 解决 RNN 长程依赖问题的改进版。
  • Attention 注意力机制 —— 让模型聚焦于关键输入,Transformer 的核心。
  • Generative Model 生成模型 —— 学会“造数据”的一类模型。
  • Dropout 随机失活 —— 训练时随机丢神经元来防过拟合。
  • Batch Normalization 批归一化 —— 稳定并加速训练的常用技巧。
  • Gradient Descent 梯度下降 —— 调参把损失降下来的优化方法。
Key Chapters

重点章节

  • 神经网络与反向传播
  • 卷积网络
  • 循环网络与序列建模
  • 生成模型
  • 大模型概览
Common Blocks

最容易卡在哪

  • 节奏快,概念一带而过
  • 想深入却发现 survey 课不够细
中文配套

辅助资料

Pass Bar

学到什么程度算过关

能用 PyTorch 或 TensorFlow 搭一个能训练收敛的小神经网络,并说清反向传播在做什么。