AI 自学作战地图

返回学习地图

Stanford · 经典 AI 与机器学习

CS221 · 人工智能：原理与技术

Artificial Intelligence: Principles and Techniques

经典 AI 的系统训练：搜索、约束满足、马尔可夫决策、博弈、逻辑。

去官方学习 ↗

中文重点解读

这门课讲什么

斯坦福的人工智能原理课，系统训练大模型时代之前那套”会推理”的经典 AI：搜索、约束满足、马尔可夫决策过程、博弈、逻辑与推理。

为什么重要

今天的热点都在深度学习，但”把现实问题建模成可求解的形式”这种底层思维，正是 CS221 给的。它补齐了纯 ML 课不教的决策与推理视角，对做 Agent、规划类问题尤其有用。

怎么学不踩坑

它和机器学习课重心不同，初学容易觉得”用不上”——别急着跳过，重点放在建模能力：遇到一个问题，先想清楚它是搜索、MDP 还是约束满足。建模题偏抽象，多动手练几道。

学到什么程度算过关

能把一个现实问题建模成搜索 / MDP / 约束问题，并说清该用哪种方法求解。

高频英文术语

这门“经典 AI”课的术语，是把现实问题翻译成可求解形式的工具：

Search 搜索 —— 在状态空间里找通往目标的路径。
Heuristic 启发式 —— 引导搜索方向的估计函数。
Markov Decision Process (MDP) 马尔可夫决策过程 —— 序贯决策问题的标准框架。
Reinforcement Learning 强化学习 —— 在未知环境里靠奖励试错学策略。
Constraint Satisfaction Problem (CSP) 约束满足问题 —— “变量+约束”式建模。
Game Tree 博弈树 —— 表达对抗博弈中各方走法的树。
Minimax 极小化极大 —— 假设对手最优的博弈决策法。
Bayesian Network 贝叶斯网络 —— 用图表达概率依赖、做不确定推理。
State / Action / Reward 状态 / 动作 / 奖励 —— 决策问题的三大基本要素。
Logic & Inference 逻辑与推理 —— 用符号规则推出新结论。
Dynamic Programming 动态规划 —— 用子问题最优解拼出整体最优。

Key Chapters

重点章节

搜索
约束满足
马尔可夫决策过程
博弈
逻辑与推理

Common Blocks

最容易卡在哪

和 ML 课重心不同，容易觉得'用不上'
建模题抽象，需多练

中文配套

辅助资料

李宏毅 · 强化学习与决策章节 ↗ 来源：李宏毅 / 台大

Pass Bar

学到什么程度算过关

能把一个现实问题建模成搜索/MDP/约束问题，并说清该用哪种方法。