Agent Engineering
学到这里,你已经有了几块非常关键的积木:
Prompt Engineering:知道怎么提要求Context Engineering:知道怎么组织输入信息RAG:知道怎么给模型补 知识Tool Use / Function Calling:知道怎么让模型调用外部能力
接下来再往前走一步,就是 Agent Engineering。
它关注的是:
- 怎么把这些能力组合起来
- 让模型不只是回答一次
- 而是围绕目标连续做多步决策、调用工具、读取结果、更新状态,直到任务完成
一句话说:
Agent Engineering 研究的是“如何把模型变成一个能持续执行任务的系统”。
1. Agent 是什么
Agent 可以理解为:一个围绕目标执行多步动作的智能体。
它通常具备下面几种能力:
- 理解目标
- 拆解任务
- 决定下一步做什么
- 调用工具
- 读取结果
- 维护任务状态
- 必要时调整计划
- 最终完成任务
所以 Agent 不只是“会聊天的模型”,而是“围绕目标持续行动的系统”。
2. Agent 和普通问答的区别
普通问答通常是这样的:
- 用户提问
- 模型回答
- 结束
但 Agent 更像这样:
- 接收目标
- 判断要分几步完成
- 先做第一步
- 根据结果决定 第二步
- 继续调用工具或检索资料
- 维护中间状态
- 最终汇总输出
所以两者最本质的区别是:
- 普通问答是
single-turn或单次响应 - Agent 是
goal-oriented multi-step execution
3. 为什么需要 Agent
很多真实任务并不是“一句话就能答完”的。
比如:
- 帮我调研某个竞品并整理报告
- 帮我查一个 bug 的原因并提出修复方案
- 帮我比较几个服务商并推荐一个
- 帮我读取多份文档后总结重点
- 帮我根据天气决定是否创建提醒
这类任务通常需要:
- 多步执行
- 中间判断
- 工具调用
- 状态延续
- 最终整合
这就是 Agent 的用武之地。
4. Agent 的核心组成
一个典型 Agent 系统,通常包含下面几块。
4.1 Goal
也就是目标。
Agent 的运行总是围绕某个明确目标展开,比如:
- “找到故障原因”
- “生成调研报告”
- “安排一场会议”
- “完成一份知识库问答”
4.2 Planner
也就是规划器。
它负责决定:
- 任务要不要拆分
- 先做哪一步
- 哪些步骤依赖工具
- 下一步优先做什么
4.3 Memory / State
也就是记忆和状态。
Agent 必须知道:
- 已经做过什么
- 查到了什么
- 还缺什么
- 当前卡在哪里
否则它很容易在多步流程里“失忆”。
4.4 Tools
也就是外部能力。
没有工具的 Agent,很多时候只能停留在:
- 思考
- 复述
- 猜测
有了工具之后,Agent 才能真正:
- 查数据
- 执行动作
- 获取反馈
4.5 Execution Loop
Agent 通常不是只运行一轮,而是进入一个循环:
- 看当前目标和状态
- 决定下一步