一个完整的 Research Agent 案例

如果说 Tool-Using Agent 更偏“怎么行动”，那么 Research Agent 更偏：

怎么围绕问题持续探索、补信息、比较证据，并最终形成有依据的结论。

这类 Agent 适合作为学习案例，因为它能同时体现：

多步执行
信息探索
证据整合
状态更新
最终收束

而又不像高风险执行 Agent 那样过早引入很多治理复杂度。

1. 先定义一个案例场景

我们先做一个典型研究型任务：

调研某个 AI 框架是否适合做企业内部知识助手

用户真正想知道的，往往不是单个事实，而是一组综合判断：

它适合什么场景
它不适合什么场景
有哪些已知限制
团队落地成本大不大

这种任务的特点是：

路径不固定
需要多轮信息收集
需要比较和整合

所以这个场景放在 Research Agent 里很自然。

2. 什么是 Research Agent

可以先用一句话理解：

Research Agent 是一种围绕研究目标，主动收集资料、识别缺口、补充证据并形成综合结论的 Agent。`

它不只是检索几段资料，而是是一个会持续推进调研过程的系统。

3. 它和普通 RAG 问答的区别

普通 RAG 问答通常是：

用户提问
检索资料
直接回答

Research Agent 通常是：

理解研究目标
拆出若干调研维度
逐步收集资料
判断哪里还缺信息
继续补资料
处理冲突和不确定点
最终形成结构化结论

所以它的重点不只是“找到资料”，而是“组织研究过程”。

4. 一个完整案例的系统结构

4.1 Research Goal Layer

定义这次研究到底要解决什么问题。

4.2 Planning Layer

拆出研究维度，例如：

功能能力
使用门槛
适用场景
风险限制

4.3 Retrieval / Search Layer

负责：

检索资料
读取内容
提取关键信息

4.4 Evidence Layer

把拿到的内容整理成可比较、可复用的证据。

4.5 State Layer

记录：

已完成的调研维度
当前证据
冲突点
缺失项

4.6 Final Synthesis Layer

把调研结果收束成：

结论
风险
建议
依据

5. 先看一张图

这张图体现的关键点是：

研究不是一次性完成
中间会不断判断“信息够不够”

6. 一个典型执行流程

6.1 第一步：理解研究目标

系统先明确：

不是简单介绍框架
而是判断它是否适合某个具体业务场景

6.2 第二步：拆出研究维度

例如拆成：

能力覆盖
与现有系统兼容性
团队学习成本
已知限制

6.3 第三步：发起第一轮检索

围绕每个维度找相关资料。

6.4 第四步：提取证据

把资料变成更结构化的信息，比如：

支持什么
不支持什么
有什么边界

6.5 第五步：判断缺口

系统发现：

某些维度信息不足
某些来源之间互相冲突

6.6 第六步：继续补资料

对缺口维度继续做检索或读取。

6.7 第七步：收束输出

最后整理出：

结论
适用条件
风险点
推荐动作

7. 为什么这个案例适合作为 Agent 学习案例

因为它能把 Agent 的几个关键问题一次展示出来：

目标驱动
多步探索
状态管理
信息完整性判断
依据化输出

同时又不会过早把注意力全拉到高风险执行治理上。

8. State 在这里该记录什么

对 Research Agent，状态比很多人想象中更重要。

建议至少记录：

research_goal
dimensions
evidence_collected
missing_info
conflicts
current_step

因为研究型任务最怕的不是一次查不到，而是：

查过的东西散掉
缺口没被显式记录
中间冲突没有被保留

9. 最该评估什么

9.1 Research Coverage

核心维度有没有覆盖到。

9.2 Evidence Quality

依据是否足够相关、足够可靠。

9.3 Groundedness

结论是否真正基于证据。

9.4 Synthesis Quality

是否把零散资料整合成了有结构的判断。

9.5 Efficiency

为了得到结论，是否跑了太多冗余步骤。

10. 和 RAG Agent 的关系

Research Agent 和 RAG Agent 很接近，但侧重点不完全一样。

RAG Agent 更强调：检索能力如何和 Agent 编排结合
Research Agent 更强调：研究过程如何被组织和推进

这里可以直接拆开看：

RAG Agent 更偏知识增强的系统案例
Research Agent 更偏研究任务的工作流案例

这也是为什么两篇都值得保留。

11. 第一版最小实现建议

我建议第一版先做到：

1 个明确研究场景
3 到 4 个研究维度
1 套检索能力
1 个简单状态对象
1 组固定研究题目

这样就已经足够学习到 Research Agent 的核心骨架了。

12. 常见坑

12.1 不拆研究维度

这样系统会非常容易在一堆资料里打转。

12.2 过早收束

第一轮检索之后就直接总结，很容易漏关键信息。

12.3 只收集，不整合

这会让输出变成资料堆积，而不是研究结论。

12.4 缺口不显式记录

系统会忘记自己还缺什么。

13. 一句话总结

Research Agent 先要看懂的，不是它会检索，而是：

它会把“收集信息 -> 识别缺口 -> 继续探索 -> 最终整合”这件事组织成一个真正连续的研究过程。

1. 先定义一个案例场景​

2. 什么是 Research Agent​

3. 它和普通 RAG 问答的区别​

4. 一个完整案例的系统结构​

4.1 Research Goal Layer​

4.2 Planning Layer​

4.3 Retrieval / Search Layer​

4.4 Evidence Layer​

4.5 State Layer​

4.6 Final Synthesis Layer​

5. 先看一张图​

6. 一个典型执行流程​

6.1 第一步：理解研究目标​

6.2 第二步：拆出研究维度​

6.3 第三步：发起第一轮检索​

6.4 第四步：提取证据​

6.5 第五步：判断缺口​

6.6 第六步：继续补资料​

6.7 第七步：收束输出​

7. 为什么这个案例适合作为 Agent 学习案例​

8. State 在这里该记录什么​

9. 最该评估什么​

9.1 Research Coverage​

9.2 Evidence Quality​

9.3 Groundedness​

9.4 Synthesis Quality​

9.5 Efficiency​

10. 和 RAG Agent 的关系​

11. 第一版最小实现建议​

12. 常见坑​

12.1 不拆研究维度​

12.2 过早收束​

12.3 只收集，不整合​

12.4 缺口不显式记录​

13. 一句话总结​