Agent 与工程化
这一组内容主要解决的问题是:
当你已经会用模型、会做检索、会接工具之后,怎么把这些能力真正组织成一个可运行、可调试、可评估、可交付的 Agent 系统。
这里不只是讲“Agent 是什么”,还会进一步进入:
- Workflow 和 Agent 的边界
- State / Memory 的 设计
- Planning Pattern
- Evals / Harness
- Observability / Guardrails
- Production Checklist
小地图
你可以把它理解成一条逐步升级的主线:
- 先理解 Agent 基本形态
- 再分清什么时候该用 Workflow,什么时候才真的需要 Agent
- 然后处理状态、规划、评估、调试和风险治理
适合谁看
适合:
- 已经理解基础能力,准备真正学习 Agent 的人
- 想从“Demo 能跑”升级到“系统能稳”的人
- 关心评估、调试、上线和治理的人
建议怎么读
推荐顺序:
- Agent Engineering
- Workflow vs Agent
- Agent Memory and State
- Agent Planning Patterns
- Evaluation / Evals
- Harness Engineering
- Agent Observability and Debugging
- Guardrails and Human-in-the-Loop
这一组读完之后,你应该收获什么
读完这一组后,最好能回答这些问题:
- 一个系统什么时候算 Agent,什么时候只是 Workflow
- State 和 Memory 应该怎么分工
- 不同 Planning Pattern 适合什么任务
- 为什么 Agent 不能只靠“看起来效果不错”来迭代
- 为什么 Observability、Harness、Guardrails 是生产化必需品
如果这些问题都更清楚了,你对 Agent 的理解就会从概念层进入工程层。