这门课讲什么
斯坦福的人工智能原理课,系统训练大模型时代之前那套”会推理”的经典 AI:搜索、约束满足、马尔可夫决策过程、博弈、逻辑与推理。
为什么重要
今天的热点都在深度学习,但”把现实问题建模成可求解的形式”这种底层思维,正是 CS221 给的。它补齐了纯 ML 课不教的决策与推理视角,对做 Agent、规划类问题尤其有用。
怎么学不踩坑
它和机器学习课重心不同,初学容易觉得”用不上”——别急着跳过,重点放在建模能力:遇到一个问题,先想清楚它是搜索、MDP 还是约束满足。建模题偏抽象,多动手练几道。
学到什么程度算过关
能把一个现实问题建模成搜索 / MDP / 约束问题,并说清该用哪种方法求解。
高频英文术语
这门“经典 AI”课的术语,是把现实问题翻译成可求解形式的工具:
- Search 搜索 —— 在状态空间里找通往目标的路径。
- Heuristic 启发式 —— 引导搜索方向的估计函数。
- Markov Decision Process (MDP) 马尔可夫决策过程 —— 序贯决策问题的标准框架。
- Reinforcement Learning 强化学习 —— 在未知环境里靠奖励试错学策略。
- Constraint Satisfaction Problem (CSP) 约束满足问题 —— “变量+约束”式建模。
- Game Tree 博弈树 —— 表达对抗博弈中各方走法的树。
- Minimax 极小化极大 —— 假设对手最优的博弈决策法。
- Bayesian Network 贝叶斯网络 —— 用图表达概率依赖、做不确定推理。
- State / Action / Reward 状态 / 动作 / 奖励 —— 决策问题的三大基本要素。
- Logic & Inference 逻辑与推理 —— 用符号规则推出新结论。
- Dynamic Programming 动态规划 —— 用子问题最优解拼出整体最优。
重点章节
- 搜索
- 约束满足
- 马尔可夫决策过程
- 博弈
- 逻辑与推理
最容易卡在哪
- 和 ML 课重心不同,容易觉得'用不上'
- 建模题抽象,需多练
辅助资料
- 李宏毅 · 强化学习与决策章节 ↗ 来源:李宏毅 / 台大