跳到主要内容

Agent 与工程化

这一组内容主要解决的问题是:

当你已经会用模型、会做检索、会接工具之后,怎么把这些能力真正组织成一个可运行、可调试、可评估、可交付的 Agent 系统。

这里不只是讲“Agent 是什么”,还会进一步进入:

  • Workflow 和 Agent 的边界
  • State / Memory 的设计
  • Planning Pattern
  • Evals / Harness
  • Observability / Guardrails
  • Production Checklist

小地图

你可以把它理解成一条逐步升级的主线:

  • 先理解 Agent 基本形态
  • 再分清什么时候该用 Workflow,什么时候才真的需要 Agent
  • 然后处理状态、规划、评估、调试和风险治理

适合谁看

适合:

  • 已经理解基础能力,准备真正学习 Agent 的人
  • 想从“Demo 能跑”升级到“系统能稳”的人
  • 关心评估、调试、上线和治理的人

建议怎么读

推荐顺序:

  1. Agent Engineering
  2. Workflow vs Agent
  3. Agent Memory and State
  4. Agent Planning Patterns
  5. Evaluation / Evals
  6. Harness Engineering
  7. Agent Observability and Debugging
  8. Guardrails and Human-in-the-Loop

这一组读完之后,你应该收获什么

读完这一组后,最好能回答这些问题:

  • 一个系统什么时候算 Agent,什么时候只是 Workflow
  • State 和 Memory 应该怎么分工
  • 不同 Planning Pattern 适合什么任务
  • 为什么 Agent 不能只靠“看起来效果不错”来迭代
  • 为什么 Observability、Harness、Guardrails 是生产化必需品

如果这些问题都更清楚了,你对 Agent 的理解就会从概念层进入工程层。