这门课讲什么
MIT 的机器学习导论(原 6.036,现已改名 6.390,注册号 6.3900)。它偏工程直觉:特征表示、过拟合与正则化、梯度下降、泛化,每周配一个动手 lab,强调”会用、会调”。
为什么重要
它和 CS229 是一对互补:6.390 重工程直觉,CS229 重数学严谨。 先用 6.390 把”机器学习在工程上怎么跑起来”建立起来,再上 CS229 回到数学根,学起来不容易崩。
怎么学不踩坑
第一个坑是搜错材料——用旧编号 6.036 会找到停更的老版本,一定认准 6.390 / introml.mit.edu 的最新学期。Lab 节奏偏快,建议跟着每周作业走,不要堆到最后。
学到什么程度算过关
能解释过拟合与正则化的关系,并独立完成一个分类 lab。
高频英文术语
这门课偏工程直觉,这些是每个 lab 都会碰到的词:
- Feature 特征 —— 喂给模型的输入变量,特征好坏常比模型更关键。
- Classifier 分类器 —— 把样本判成某一类的模型。
- Hypothesis 假设 —— 模型对“输入到输出”关系的猜测函数。
- Perceptron 感知机 —— 最简单的线性分类器,神经网络的雏形。
- Linear / Logistic Regression 线性 / 逻辑回归 —— 回归与二分类的入门基石。
- Gradient Descent 梯度下降 —— 迭代调参把误差降下来的核心方法。
- Regularization 正则化 —— 限制模型复杂度、抑制过拟合。
- Overfitting 过拟合 —— 在训练集很好、在新数据上崩。
- Generalization 泛化 —— 模型在没见过的数据上的表现,机器学习的终极目标。
- Cross-Validation 交叉验证 —— 反复划分数据来挑超参、估真实表现。
- Neural Network 神经网络 —— 课程后段引入的非线性模型。
重点章节
- 特征表示
- 过拟合与正则化
- 梯度下降
- 神经网络入门
- 泛化
最容易卡在哪
- 用旧编号 6.036 搜不到最新材料
- lab 节奏快,跟不上每周作业
辅助资料
- 动手学深度学习 · 线性神经网络 ↗ 来源:李沐 / d2l