Craft Agents
Craft Agents
官网文档
Craft Agents 是一个桌面端的 agent 工作台。它的核心思路不是“再做一个聊天框”,而是把 agent 真正放进日常工作流里,让它去接 GitHub、Linear、Slack、本地文件、Craft 文档,甚至任意能接上的 API。
如果已经用过 Claude Code、Codex 这一类工具,大概会很快明白它想做什么。它不是替代模型能力,而是把模型能力包进一个更适合长期、多任务、跨工具协作的界面里。
官方文档里有一句话我觉得挺准确:它是把 Claude 的 coding 能力,延伸到整个数字工作流里。这个描述不夸张。
它到底是什么
先别把它理解成普通 AI 聊天工具。Craft Agents 更像一个 agent 操作台,重点在下面几件事:
- 一个 inbox 式的多会话界面
- 可以长期保留上下文的 session
- 可以接入多种 source
- 可以先 Explore,再决定要不要 Execute
- 可以把结果变成团队能复用的文档和记录
这几个点放在一起,体验就和“开一个聊天窗口问模型”完全不一样了。
为什么我会推荐它
1. 它很适合现在这种多任务的 AI 工作方式
现在大家用 agent,越来越不像早期那样“一次只做一件事”。实际情况更像是:
- 一个任务在改代码
- 一个任务在查资料
- 一个任务在整理 issue
- 还有一个任务在慢慢跑
Craft Agents 很适合这种场景。它的多会话设计不是摆设,而是真的把“同时开几个任务”这件事当成默认工作方式来做。
对我来说,这一点比单次回答质量更重要。因为很多时候不是模型不够强,而是任务一多,聊天式界面很快就乱了。
2. 它把数据源这件事做得比较顺
Craft Agents 有个很重要的概念叫 Sources。简单说,就是把 agent 能访 问的能力拆成一个个来源:
- MCP servers
- REST APIs
- 本地文件
- 远程环境
这意味着它不是只能“聊”,而是真的可以带着上下文去不同地方拿信息、做动作。
比如一个任务完全可以一边看 GitHub repo,一边查 Linear issue,再把结果写回 Craft 文档。这个工作流如果纯靠聊天窗口去回忆上下文,通常很快就会失控。
3. Explore / Ask to Edit / Execute 这套权限模式很实用
我很喜欢它对权限的处理方式。不是一上来就全自动,而是给出一个分层梯度:
Explore:只读,先研究Ask to Edit:要改动前先确认Execute:放手让它跑
这个设计挺像真正和同事协作。先让它看,确认思路,再放权。很多 agent 工具不是太保守,就是太激进,Craft Agents 在这中间找到了一个还不错的平衡点。
4. 它比很多 agent 工具更适合长期使用
很多 AI 工具第一眼很惊艳,但用久了会暴露一个问题:记录留不住,任务不好管理,过几天连某个结论是怎么来的都不容易追清。
Craft Agents 在这点上明显下过功夫。session 是持久化的,状态是可以管理的,结果也更容易变成文档。官方甚至把“sessions become documentation”当成一个重点来讲,我觉得这不是空话。
单人使用时,这意味着上下文不需要每隔几天就重新捡一遍。
如果是在团队里推动 AI 工作流,这意味着 agent 产出的东西更容易被别人接住。
5. 它和 Claude Code 的关系处理得很聪明
官方文档里专门拿它和 Claude Code 做了对比,这点我觉得很坦诚。
两者不是谁替代谁。Craft Agents 和 Claude Code 用的是同一类基础能力,甚至 skills 格式、核心工具、thinking level 这些都能对齐,但侧重点不同:
- Claude Code 更像终端里的强执行助手
- Craft Agents 更像跨工具、多会话、可组织的工作台
如果本来就喜欢 Claude Code,Craft Agents 不会显得陌生,很多思路是通的,只是外面多了一层更适合长期协作的壳。
6. 开源这点很加分
Craft Agents 是开源的,代码在 GitHub 上,许可证是 Apache 2.0。
这点对 agent 工具其实很重要。因为这类软件变化太快,如果完全是黑盒,后续演进方向很难判断,也很难真正接进现有系统里。Craft Agents 至少在这件事上给了更大的空间。
它适合什么人
- 已经在高频使用 Claude Code、Codex、Cursor 这类 agent 工具的人
- 不满足于“单聊天窗口工作流”的人
- 想把 GitHub、Linear、Slack、文档、本地文件接进同一个 agent 界面的人
- 团队里需要长期保存 AI 工作记录的人
- 想自己折腾 sources、skills、权限规则的人
如果只是偶尔问模型几个问题,Craft Agents 可能会显得有点重。
但一旦开始把 agent 当成日常工作的一部分,它就会显得很顺手。
我觉得它和普通 AI 聊天工具最不一样的地方
1. 它不是围着“提示词”转
很多工具的核心仍然是 prompt box。Craft Agents 的重点是 workspace、sources、session、permission mode。
这意味着它更像在组织工作,而不是只组织提问。
2. 它天然支持多上下 文
一个项目一个 workspace,不同 workspace 各自隔离 source、skill、session,这个设计很实在。
一般不会想把公司仓库、本地私人文档、另一个客户项目全塞在同一套上下文里。Craft Agents 在这点上处理得比较干净。
3. 它更像“agent 原生软件”
GitHub README 里提到一个词叫 agent native。我觉得这个词没有乱用。
它很多设计都是围绕 agent 真正要长期工作来展开的,不只是“把模型接进现有软件”。这两种做法看起来差不多,用久了差别会很明显。
怎么上手
安装
官方支持 macOS、Windows 和 Linux。
如果是 macOS,可以直接下载对应架构的 DMG。官方文档里也给了安装脚本:
curl -fsSL https://agents.craft.do/install-app.sh | bash
如果偏向自行编译,也可以直接从开源仓库拉源码构建。
第一次启动
第一次启动会进 setup wizard。大致会做几件事:
- 可选连接 Craft 账号
- 选择要接的 Craft space
- 配置模型连接方式
官方 quickstart 里提到,模型连接可以走 Claude Pro/Max OAuth,也可以自己填 API Key。支持的方式不止一种,这点挺灵活。
我会建议的第一步
第一次试用时,不要一口气接十几个 source。
最简单的方式是:
- 先接一个本地项目目录
- 再接一个 GitHub 或 Linear
- 开一个 Explore 模式任务,让它先读、先总结
- 确认这套节奏顺了,再慢慢放权到 Execute
这样最容易建立感觉。
常用功能点
1. 多会话 inbox
这个功能看起来简单,但实际非常重要。任务多了以后,很需要一个能长期保留上下文、还能切换状态的地方。
2. Sources
这是它最核心的能力之一。MCP、REST API、本地文件都能接,意味着它不是局限在单一软件内部。
3. Permission modes
Explore、Ask to Edit、Execute 这三层模式很实用。尤其还在摸一个新 source 或新工作流的时候,Explore 会让人安心很多。
4. Workspaces
不同 workspace 可以隔离不同项目的 source、skill 和 session。对多项目用户来说,这比所有内容混在一个地方舒服太多。
5. 远程访问
官方文档提到可以跑 remote server,然后从桌面端、浏览器、CLI 去访问。这点很适合那些工作环境分散、机器很多的人。
6. 可定制性
主题、skills、状态、权限规则,很多东西都能通过配置文件去调整。它不是那种只能按作者预设来用的产品。
和 Codex、Claude Code 怎么选
这一块我觉得很值得单独讲清楚。因为这三个名字很容易被放在一起,但它们其实不是完全同一层的东西。
如果硬要先给一个最短的判断,我会这么分:
Claude Code:终端里最直接、最干活的那一类Codex:更强调多 agent、后台并行、云端委托Craft Agents:更强调工作台、多数据源、多会话和长期组织
先说结论,再展开。
1. Craft Agents 和 Claude Code
这两个最像,也最容易被拿来比较。原因很简单:Craft Agents 官方就明确说了,它和 Claude Code 共享同一套基础方向,skills 格式、MCP、核心工具、thinking level 这些都能对齐。
但真正用起来,感觉还是不一样。
Claude Code 更像是已经坐在终端里,准备直接开干:
- 直接进项目目录
- 读文件、改文件、跑命令
- 快速推进一个明确任务
这种模式非常强,尤其适合开发者已经有明确上下文的时候。仓库位置、改动目标和验证方式都明确以后,Claude Code 会特别顺。
Craft Agents 则更像把这套能力往外扩了一层。它不是只服务于“当前这个代码任务”,而是把任务管理、上下文组织、数据源接入、权限控制也一起放进来了。
简单说:
- 如果想马上进终端开干,Claude Code 更直接
- 如果要同时盯几个任务,还要接 GitHub、Linear、文档、API,Craft Agents 更像一个总控台
我觉得这两个不是替代关系,更像执行层和组织层的分工。
2. Craft Agents 和 Codex
Codex 现在的方向,和很多人几年前理解的“代码模型”已经不太一样了。按 OpenAI 现在的官方说法,它更像一个 coding agent,而且很强调云端委托、并行任务和多 agent 工作流。
这一点其实和 Craft Agents 有重叠,尤其是在“不是只聊,而是真的去做事”这件事上。
但两者的重点仍然不同。
我自己的理解是:
- Codex 更像一个 agent 指挥中心,尤其强调把任务委托出去,在云端并行跑
- Craft Agents 更像一个可以长期坐班的 agent 工作台,强调会话、来源、权限和上下文管理
Codex 的优势在于后台执行感很强。官方现在一直在强调 parallel agents、cloud environments、automations 这些东西。如果脑子里想 的是“把任务分发出去,让 agent 各自跑”,Codex 这套会很有吸引力。
Craft Agents 的优势则在于,更容易把不同来源的上下文拢在一个地方,而且 session 本身更像长期资产。这里不是只把任务扔出去跑完,而是在维护一个持续工作的环境。
3. Codex 和 Claude Code
这两个也很容易被拿来对比,但我觉得差别反而更清楚。
Claude Code 更偏本地、偏终端、偏即时协作。更像并肩工作的感觉。
Codex 更偏云端、偏委托、偏并行监督。更像“派任务再回来看结果”的关系。
如果平时更喜欢:
- 在本地目录里盯着改
- 自己掌控每一步
- 很快来回试错
那 Claude Code 会更自然。
如果更喜欢:
- 同时开多个任务
- 让 agent 在后台跑
- 自己做调度和 review
那 Codex 会更对路。
4. 三者放在一起怎么理解
我觉得可以把它们放在三个不同侧重点上看:
| 工具 | 更像什么 | 更适合什么场景 |
|---|---|---|
| Craft Agents | agent 工作台 | 多会话、多来源、长期组织、团队协作 |
| Codex | agent 指挥中心 | 云端委托、并行任务、多 agent 后台执 行 |
| Claude Code | 终端执行助手 | 本地开发、快速改码、即时协作、强执行 |
如果只问“哪个更强”,这个问题意义不大。因为三者都强,只是强在不同地方。
更实际的问题应该是:当前的瓶颈在哪。
5. 我会怎么选
如果当前的主要痛点是:
- 想在终端里更快改代码
- 想少切编辑器和命令行
- 想让 agent 直接跟着当前任务一起推进
那我会先选 Claude Code。
如果主要痛点是:
- 任务很多
- 想把工作分发给多个 agent
- 希望后台一直有人在跑活
那我会先看 Codex。
如果主要痛点是:
- 聊天窗口一多就乱
- 任务、文档、代码、issue 分散在不同地方
- 需要一个能长期组织 agent 工作的地方
那我会更推荐 Craft Agents。
6. 一个更现实的答案
很多人最后不会三选一,而是混着用。
比如很自然的一种组合就是:
- 用
Claude Code处理本地、即时、执行密集的任务 - 用
Codex处理可以委托出去的后台任务 - 用
Craft Agents管理跨来源的上下文、长期会话和任务组织
这套搭配其实挺合理。因为今天的 agent 工作流,很多时候已经不是“挑一个最强工具”,而是“给不同层级的工作配不同的工具”。
如果更喜欢终端、更习惯一把梭执行任务,Claude Code 还是非常强。
如果更需要这些东西:
- 多任务同时推进
- 把不同数据源接进同一个工作区
- 对 session 做长期管理
- 让过程本身也能沉淀为文档
那 Craft Agents 会更对路。
我自己的感觉是,这几个工具并不冲突。很多人最后可能会变成:
- 终端里用 Claude Code 或类似工具狠狠干活
- 后台任务交给 Codex 这类更偏委托型的 agent
- 在更大的任务组织层面,用 Craft Agents 管理上下文、来源和长期会话
这反而是很自然的组合。
我的看法
Craft Agents 不是那种“第一次打开就立刻震撼”的产品。它更像一类需要带着真实任务去跑几天,才会慢慢意识到价值的工具。
它真正有意思的地方,不是某个单点功能多炫,而是它把多任务、来源接入、权限控制、长期记录这些事情放在了一起,而且放得比较顺。
如果已经从“用一下 AI”走到“每天都在和 agent 协作”,那 Craft Agents 很值得认真试一阵。