Agent 与工程化
这一组内容主要解决的问题是:
当你已经会用模型、会做检索、会接工具之后,怎么把这些能力真正组织成一个可运行、可调试、可评估、可交付的 Agent 系统。
这里不只是讲“Agent 是什么”,还会进一步进入:
- Workflow 和 Agent 的边界
- State / Memory 的设计
- Planning Pattern
- Evals / Harness
- Observability / Guardrails
- Production Checklist
- 可直接复制的 TypeScript 模板
小地图
1. 基础结构
2. 评估、治理与运行
3. Runtime 与控制流
这 3 张图对应一条逐步升级的主线:
- 先理解 Agent 基本形态
- 再分清什么时候该用 Workflow,什么时候才真的需要 Agent
- 然后进入评估、数据治理、运行治理和风险控制
适合谁看
适合:
- 已经理解基础能力,准备真正学习 Agent 的人
- 想从“Demo 能跑”升级到“系统能稳”的人
- 关心评估、调试、上线和治理的人
建议怎么读
推荐顺序:
- Agent Engineering
- Workflow vs Agent
- Router 与 Triage 设计
- Agent Memory and State
- Prompt Injection and Agent Security
- Agent Planning Patterns
- 多 Agent 系统设计
- Handoff、Agents as Tools 与 A2A
- Evaluation / Evals
- Harness Engineering
- Agent Memory and RAG Data Governance
- Agent Latency, Cost, and Reliability
- Agent Observability and Debugging
- Agent Failure Triage
- Multi-Agent Evaluations
- Agent Runtime State Machine
- Long-Running Agents 与 Durable Execution
- Queues、Retry、Backoff 与 Dead Letter
- Guardrails and Human-in-the-Loop
- Approval 与 Human Review Workflow
- Tool Approval、Interrupt 与 Resume
- Browser and Computer Use Agents
- AI Agent 常见反模式
- Agent Evals / Harness 模板
- Agent Evals Markdown 表格模板
- Harness Markdown 表格模板
- TypeScript 在 Agent 项目中的落地实践
- Minimal Agent TypeScript 模板
- Tool-Using Agent TypeScript 模板
- RAG Agent TypeScript 模板
- Research Agent TypeScript 模板