研究预览 · Claude Code v2.1.154+

Claude Code 动态工作流

让 Claude 编写一个脚本,在后台编排数十到数百个子智能体——用于代码库规模的审计、迁移和经过交叉核验的研究。

每次运行最多 1,000 个子智能体 在后台运行 可恢复、可重跑

什么是动态工作流?

动态工作流是 Claude 为你的任务编写的一段 JavaScript 脚本。运行时在后台执行它,你的会话仍保持可响应,只有最终结果会返回到对话中。

一段脚本,而非聊天循环

Claude 编写一段 JavaScript 脚本,由它来承载循环、分支和中间结果。被重复的是编排本身——而不仅仅是提示词。

上下文保持轻量

中间结果存放在脚本变量中,而不是 Claude 的上下文窗口里,因此对话只保留最终报告——而非每个智能体的全部输出。

内建的质量模式

工作流可以让多个独立智能体在汇报前对彼此的发现进行对抗性审查,或从多个角度起草方案并加以权衡——比单次运行更值得信赖。

可阅读、可保存、可重跑

由于方案就是代码,你可以在运行前阅读脚本、在暂停后恢复它,还能把一次成功的运行保存为 /command,在每个分支上复用。

子智能体 vs 技能 vs 工作流

三者都能执行多步骤工作。区别在于由谁来掌握方案。

维度 子智能体 技能 工作流
它是什么 Claude 派生出的一个工作者 Claude 遵循的指令 运行时执行的一段脚本
由谁决定下一步运行什么 Claude,逐轮决定 Claude,按提示词决定 脚本
中间结果存放在哪里 Claude 的上下文窗口 Claude 的上下文窗口 脚本变量
规模 每轮委派几个任务 与子智能体相同 每次运行数十到数百个智能体

启动它的三种方式

所有付费方案均可使用(Pro 需在 /config 中开启),此外还支持 Claude API、Amazon Bedrock、Vertex AI 和 Microsoft Foundry。

1. workflow 关键词

在提示词中包含 “workflow” 一词,Claude 就会为该任务编写一个工作流,而不是逐轮处理。

Run a workflow to audit every API
route under src/ for missing auth

2. ultracode

设置 /effort ultracode,Claude 便会为会话中每个有分量的任务规划一个工作流——xhigh 级推理外加自动编排。

/effort ultracode

3. /deep-research

内置的工作流:它会扇出网络搜索、交叉核验信息源、对每条论断投票,并返回一份带引用的报告。

/deep-research What changed in
the Node permission model v20-v22?

关于 /deep-research

/deep-research 是内置的工作流,会跨多个信息源调查一个问题。它会抓取并交叉核验所查到的内容,过滤掉经不起交叉核验的论断,最终返回一份带引用的报告。它需要启用 WebSearch 工具。

何时该动用工作流

当任务所需的智能体超出单次对话所能协调的范围,或者当你希望把编排固化成一段可重跑的脚本时,就该用它。

1

覆盖整个代码库的漏洞排查——多个查找者并行工作,每个发现都先经核验再汇报。

2

大规模迁移——500 个文件的框架切换或语言移植,每处由一个智能体负责。

3

经过交叉核验的研究——让各信息源相互权衡,而非生成单一摘要。

4

难解的方案——从多个独立角度起草,再加以评判和综合。

案例研究:将 Bun 从 Zig 重写为 Rust

Jarred Sumner 借助动态工作流,把 Bun 运行时从 Zig 移植到 Rust——这种规模的改动通常需要一个团队耗时数周。

750K

行代码

11 days

耗时

99.8%

现有测试保持通过

值得了解的限制

动态工作流处于研究预览阶段。运行时会施加一些防护栏。

最多 16 个并发智能体

超出的智能体会排队,待有空位时再运行;在 CPU 核心有限的机器上,同时运行的数量更少。

每次运行 1,000 个智能体

用于兜底防范失控循环,其上限远高于任何正常工作流所需。

运行中无法输入

只有智能体的权限提示能够暂停运行。若需要在各阶段之间确认放行,请将每个阶段作为独立的工作流运行。

会话内可恢复

恢复时已完成的智能体会返回缓存结果,其余则实时运行。退出 Claude Code 会使工作流从头重新开始。

工作流会消耗更多 token——请提前规划

单次运行可能派生出数百个智能体,因此它消耗的 token 明显多于在对话中完成同样的任务,并会计入你方案的用量和速率限制。除非脚本将某个阶段路由到更便宜的模型,否则每个智能体都使用你会话所用的模型。

通过 QCode 运行大型工作流

由于 1,000 个智能体的运行会快速消耗 token,你用来运行它们的接入层级就很关键。QCode 提供针对中国低延迟优化的更高层级 Claude 接入,让代码库规模的工作流依然切实可行——无需境外银行卡或手机号。

开始用 Claude Code 构建

通过 QCode 获取 Claude Code 接入,以针对中国优化的低延迟运行动态工作流、ultracode 和 Opus 4.8。