AI 应用整体架构图
前面几篇文档分别讲了:
Prompt EngineeringContext EngineeringRAGTool Use / Function CallingAgent EngineeringEvaluation / Evals
如果单篇看,它们都能理解;但真正做 AI 应用时,更重要的是把它们放进一个完整系统里理解。
这篇文档的目标,就是把这些内容串成一张整体架构图,帮你建立“AI 应用到底是怎么搭起来的”这件事的全局视角。
1. 先看整体图
你可以先把这个架构理解成 3 大块:
应用入口:用户从哪里进入系统运行核心:请求进来后,系统怎么理解、检索、调用工具、组织上下文并生成结果质量保障:怎么评估系统是不是稳定、准确、可用
2. 再看一张“请求如何流动”的图
这张图更接近真实执行流程。
它表达的是:
- 用户提问
- 系统先理解任务和指令
- 装配上下文
- 需要时检索知识、调用工具、读取状态
- 把这些信息组合后交给模型
- 模型输出答案或执行动作
- 再通过评估判断质量
3. 各层分别在做什么
下面按层拆开来看。
4. Application Layer:应用层
这一层就是用户真正接触到的地方。
常见形式包括:
- Chat 界面
- 文档问答助手
- Copilot
- AI 搜索
- 企业内部助手
- 自动化工作台
应用层主要负责: