AI Agent 专题章节与框架映射
做 AI Agent 专题时,一个很常见的问题是:
是不是每一章都应该配一个框架来学?
答案通常是否定的。
因为很多章节讲的是:
- 概念边界
- 能力拆分
- 系统结构
- 失败模式
- 工程判断
这些内容如果过早被某个框架“包住”,反而更容易把问题理解窄了。
所以这篇文档不做“框架排行榜”,而是只回答一件事:
当前 AI Agent 专题里的主要章节,分别更适合借助哪些框架 / SDK / 官方阅读来学习与落地?
我会尽量坚持一个原则:
- 先看能力边界,再看框架
- 先看官方原语,再看高层抽象
- 先做最小闭环,再决定是否需要重框架
1. 先看一个最重要的结论
不是每一章都需要框架。
更准确地说,AI Agent 专题里的章节,大致可以分成两类:
1.1 主要在教“原理和判断”的章节
例如:
Prompt EngineeringContext EngineeringWorkflow vs AgentHarness EngineeringAgent Observability and Debugging里的很多诊断思路
这类章节的重点,不是“用哪个 SDK 调起来”,而是:
- 你是否知道问题边界在哪里
- 你是否能分清该用普通 workflow 还是 agent
- 你是否知道系统失败时该先查哪一层
- 你是否能把评估、日志、回归和运行底座拆开理解
这类内容应该尽量保持 framework-agnostic。
1.2 主要在教“如何把系统跑起来”的章节
例如:
Tool Use / Function Calling最小 AgentTool-Using AgentResearch AgentRAG Agent多步编排 / 状态管理 / 多 Agent
这类章节适合映射到具体框架,因为它们已经进入:
- API 原语
- 工具注册
- 状态传递
- graph / flow 编排
- tracing / eval 接入
直接说就是:
不是先给每一章找框架,而是先判断这章到底在讲“能力本身”,还是已经进入“工程承载层”。
2. 推荐的整体学习顺序
如果你是按章节一路往下学,我更推荐下面这个顺序:
- 先学
OpenAI官方原语 - 再学
LangChain / LangGraph这种偏通用编排层 - 再按需求接触
Microsoft Agent Framework、CrewAI这类更偏完整工程承载的平台 - 把
AutoGen放在“历史脉络 + 现有存量项目理解”位置,而不是新项目默认首选
原因很简单:
OpenAI官方文档最适合理解工具调用、结构化输出、会话状态、Agent SDK 这些底层能力LangChain / LangGraph最适合理解“从单次 tool call 走向状态化编排”的过渡Microsoft Agent Framework更接近把AutoGen与Semantic Kernel路线统一后的企业级工程底座CrewAI更适合把“agent / crew / flow / tracing / memory / knowledge”快速组织成一套完整运行系统AutoGen官方现在已经明确说明进入maintenance mode,并建议新用户优先使用Microsoft Agent Framework
所以全文默认采用下面这条推荐逻辑:
先能力 -> 再编排 -> 再工程平台 -> 最后再看历史框架脉络。
3. 基础能力章节
这一组章节的重点,是先把模型、上下文、检索和工具这几层能力拆清楚。
3.1 Prompt Engineering
对应定位:
- 这一章应以
框架无关为主 - 不建议一开始绑定 LangChain、CrewAI 或其他 Agent 框架
可用官方阅读:
OpenAI Prompt engineeringOpenAI Structured Outputs
为什么这样映射:
Prompt Engineering的核心是指令设计、示例设计、输出约束,而不是 agent graph- OpenAI 官方文档已经直接覆盖了提示策略、结构化输出、模型快照固定和配套 eval 的基本做法
- 如果这一章一上来就进入某个框架的 prompt 模板,学习者很容易只记住框架写法,而没真正理解 prompt 设计本身
推荐顺序:
OpenAI Prompt engineeringOpenAI Structured Outputs- 再回到你自己的最小代码骨架里手写 prompt
更适合在这一章避免的事:
- 过早学“某框架的 prompt DSL”
- 把 prompt 问题误当成 agent 架构问题
3.2 Context Engineering
对应定位:
- 这一章也应以
框架无关为主 - 框架只适合作为“承 载上下文装配”的工具,而不是学习主体
可用官方阅读:
OpenAI Conversation stateOpenAI Structured OutputsMicrosoft Agent Framework的agent session / context providers相关定位
为什么这样映射:
Context Engineering本质上是在解决“调用模型前,到底给它看什么”- OpenAI 官方会帮助你理解:模型调用本身是无状态的,多轮状态需要你显式传递或管理
- Microsoft Agent Framework 官方则更适合帮助你看到:当系统进入工程阶段后,
session、context providers这些抽象怎样承载状态和上下文
推荐顺序:
- 先用
OpenAI理解会话状态是怎么被手动构造出来的 - 再看
Microsoft Agent Framework如何把状态管理收敛成统一抽象 - 最后再在具体项目里决定要不要交给
LangGraph或CrewAI Flow承载
更适合在这一章避免的事:
- 把
memory神化成万能方案 - 还没分清“工作记忆 / 历史摘要 / 检索知识”就直接接入重框架
3.3 RAG
对应定位:
RAG应以检索能力本身为主,框架为辅- 这一章适合先学检索原语,再学 orchestration
可用框架 / 官方阅读:
OpenAI RetrievalOpenAI File searchCrewAI KnowledgeLangChain的 retrieval / agent 相关官方文档
为什么这样映射:
- OpenAI 官方已经把
vector store、语义检索、file_search这些原语讲得比较直接,适合先建立“检索不是魔法,而是一套可控输入能力”的理解 - 如果你想快速得到“带知识访问能力的 agent”,
OpenAI File search是最轻量的托管起点之一 CrewAI Knowledge更适合在你已经接受“知识源是系统一部分,而不是单次外挂”之后再引入LangChain更适合当你需要把 retrieval 和 agent loop 组合到一起,而不是只做单次问答
推荐顺序:
OpenAI RetrievalOpenAI File searchLangChain的检索与 agent 结合能力CrewAI Knowledge
这一章最该坚持的原则:
- 先理解
chunk / search / rerank / grounding - 再决定是否需要框架帮你接管知识访问
3.4 Tool Use / Function Calling
对应定位:
- 这是第一批适合明确映射框架的章节
- 但首选仍然应该是
OpenAI官方原语,而不是先上重型 agent framework
可用框架 / 官方阅读:
OpenAI Function callingOpenAI Tools / Remote MCPOpenAI Agents SDKLangChain agentsMicrosoft Agent Framework
为什么这样映射:
- 工具调用本质上是 agent 工程最底层、最关键的原语之一
- OpenAI 官方已经把工具 schema、调用生命周期、多轮 tool call 流程讲得很清楚
OpenAI Agents SDK适合在你已经理解 tool call 原语后,再进一步接入 handoff、tracing、guardrails 这类 agent 运行能力LangChain agents更适合你想快速搭一个“会调工具的单 agent”Microsoft Agent Framework则更适合你已经明确要把工具调用放进更长期、可扩展、可插 middleware 的工程体系里
推荐顺序:
OpenAI Function callingOpenAI Agents SDKLangChain agentsMicrosoft Agent Framework
不建议的顺序:
- 还没理解 tool schema,就直接学多 agent
- 还没搞清 tool result 回注,就直接引入复杂 crew / graph
3.5 MCP
对应定位:
- 这一章更适合放在
工具接入层 - 它不是替代
tool calling,而是把工具、资源和提示进一步推进到协议化接入
可用官方阅读:
Model Context Protocol DocsMCP ArchitectureOpenAI Remote MCP
为什么这样映射:
MCP最适合放在已经理解工具调用原语之后来学- 它帮助你把“单点工具注册”扩展成“统一能力接入”
- 这一章的 重点不是框架 API,而是
Host / Client / Server、能力发现、资源与工具边界
推荐顺序:
- 先读
Tool Use / Function Calling - 再读
MCP 入门与实践 - 最后再把它映射到具体 SDK 或框架
3.6 A2A
对应定位:
- 这一章更适合放在
Agent 互联层 - 它不是普通工具调用,也不是单纯的 workflow 编排
可用官方阅读:
A2A Protocol SpecificationA2A Agent Skills & Agent Card
为什么这样映射:
A2A适合讨论独立 Agent 系统之间的互操作- 它的核心对象不是函数,而是
task、artifact、agent card - 这一章更适合和
Workflow vs Agent、Planning Patterns、多 Agent 设计一起看
4. Agent 工程章节
这一组章节开始进入“怎么让系统多步跑起来、怎样保持状态、什么时候需要 workflow、什么时候需要 agent”。
4.1 Workflow vs Agent
对应定位:
- 这章应保持