跳到主要内容

一个完整的 Research Agent 案例

如果说 Tool-Using Agent 更偏“怎么行动”,那么 Research Agent 更偏:

怎么围绕问题持续探索、补信息、比较证据,并最终形成有依据的结论。

这类 Agent 非常适合学习,因为它能同时体现:

  • 多步执行
  • 信息探索
  • 证据整合
  • 状态更新
  • 最终收束

而又不像高风险执行 Agent 那样过早引入很多治理复杂度。

1. 先定义一个案例场景

我们先做一个典型研究型任务:

调研某个 AI 框架是否适合做企业内部知识助手

用户真正想知道的,往往不是单个事实,而是一组综合判断:

  • 它适合什么场景
  • 它不适合什么场景
  • 有哪些已知限制
  • 团队落地成本大不大

这种任务的特点是:

  • 路径不固定
  • 需要多轮信息收集
  • 需要比较和整合

所以它特别适合 Research Agent

2. 什么是 Research Agent

可以先用一句话理解:

Research Agent 是一种围绕研究目标,主动收集资料、识别缺口、补充证据并形成综合结论的 Agent。`

它不只是检索几段资料,而是更像一个会持续推进调研过程的系统。

3. 它和普通 RAG 问答的区别

普通 RAG 问答很多时候更像:

  1. 用户提问
  2. 检索资料
  3. 直接回答

Research Agent 更像:

  1. 理解研究目标
  2. 拆出若干调研维度
  3. 逐步收集资料
  4. 判断哪里还缺信息
  5. 继续补资料
  6. 处理冲突和不确定点
  7. 最终形成结构化结论

所以它的重点不只是“找到资料”,而是“组织研究过程”。

4. 一个完整案例的系统结构

4.1 Research Goal Layer

定义这次研究到底要解决什么问题。

4.2 Planning Layer

拆出研究维度,例如:

  • 功能能力
  • 使用门槛
  • 适用场景
  • 风险限制

4.3 Retrieval / Search Layer

负责:

  • 检索资料
  • 读取内容
  • 提取关键信息

4.4 Evidence Layer

把拿到的内容整理成可比较、可复用的证据。

4.5 State Layer

记录:

  • 已完成的调研维度
  • 当前证据
  • 冲突点
  • 缺失项

4.6 Final Synthesis Layer

把调研结果收束成:

  • 结论
  • 风险
  • 建议
  • 依据

5. 先看一张图

这张图体现的关键点是:

  • 研究不是一次性完成
  • 中间会不断判断“信息够不够”

6. 一个典型执行流程

6.1 第一步:理解研究目标

系统先明确:

  • 不是简单介绍框架
  • 而是判断它是否适合某个具体业务场景

6.2 第二步:拆出研究维度

例如拆成:

  • 能力覆盖
  • 与现有系统兼容性
  • 团队学习成本
  • 已知限制

6.3 第三步:发起第一轮检索

围绕每个维度找相关资料。

6.4 第四步:提取证据

把资料变成更结构化的信息,比如:

  • 支持什么
  • 不支持什么
  • 有什么边界

6.5 第五步:判断缺口

系统发现:

  • 某些维度信息不足
  • 某些来源之间互相冲突

6.6 第六步:继续补资料

对缺口维度继续做检索或读取。

6.7 第七步:收束输出

最后整理出:

  • 结论
  • 适用条件
  • 风险点
  • 推荐动作

7. 为什么这个案例非常适合学习 Agent

因为它能把 Agent 的几个关键问题一次展示出来:

  • 目标驱动
  • 多步探索
  • 状态管理
  • 信息完整性判断
  • 依据化输出

同时又不会过早把注意力全拉到高风险执行治理上。

8. State 在这里该记录什么

Research Agent,状态比很多人想象中更重要。

建议至少记录:

  • research_goal
  • dimensions
  • evidence_collected
  • missing_info
  • conflicts
  • current_step

因为研究型任务最怕的不是一次查不到,而是:

  • 查过的东西散掉
  • 缺口没被显式记录
  • 中间冲突没有被保留

9. 最该评估什么

9.1 Research Coverage

核心维度有没有覆盖到。

9.2 Evidence Quality

依据是否足够相关、足够可靠。

9.3 Groundedness

结论是否真正基于证据。

9.4 Synthesis Quality

是否把零散资料整合成了有结构的判断。

9.5 Efficiency

为了得到结论,是否跑了太多冗余步骤。

10. 和 RAG Agent 的关系

Research AgentRAG Agent 很接近,但侧重点不完全一样。

  • RAG Agent 更强调:检索能力如何和 Agent 编排结合
  • Research Agent 更强调:研究过程如何被组织和推进

也就是说:

  • RAG Agent 更偏知识增强的系统案例
  • Research Agent 更偏研究任务的工作流案例

这也是为什么两篇都值得保留。

11. 第一版最小实现建议

我建议第一版先做到:

  • 1 个明确研究场景
  • 3 到 4 个研究维度
  • 1 套检索能力
  • 1 个简单状态对象
  • 1 组固定研究题目

这样就已经足够学习到 Research Agent 的核心骨架了。

12. 常见坑

12.1 不拆研究维度

这样系统会非常容易在一堆资料里打转。

12.2 过早收束

第一轮检索之后就直接总结,很容易漏关键信息。

12.3 只收集,不整合

这会让输出变成资料堆积,而不是研究结论。

12.4 缺口不显式记录

系统会忘记自己还缺什么。

13. 一句话总结

Research Agent 最值得学习的地方,不是它会检索,而是:

它会把“收集信息 -> 识别缺口 -> 继续探索 -> 最终整合”这件事组织成一个真正连续的研究过程。