深度 · 小互解读

Claude Code 官方讲透循环设计:4 级递进到无人值守

从手动确认到无人值守,Claude Code 团队给出 4 级循环分类与实操建议
一分钟速览
  • Anthropic 的 Claude Code 团队发博客,把「设计循环(loop)」拆成 4 种标准模式:回合制、目标制(/goal)、时间制(/loop/schedule)、主动式,按自主程度从低到高递进。
  • 循环的官方定义:agent 反复执行一轮轮工作,直到满足某个停止条件才收工。四种类型按「谁触发、怎么判断停、用什么功能实现、适合什么任务」四个维度区分。
  • /goal 的核心机制是引入一个独立的评估模型来判定是否达标,Claude 自己不能提前喊「够了就收工」,还可以设最多尝试次数上限。
  • 主动式循环把 /schedule(定时触发)、/goal(停止条件)、skills(校验标准)、dynamic workflows(多 agent 并行编排)、auto mode(免人工确认)五个功能叠起来,能无人值守地处理 bug 报告分诊、issue 分类、依赖升级这类持续性工作。
  • 两条实操建议:确定性工作用脚本,比让 Claude 每次重新推导更省 token;大规模 dynamic workflows(可能拉起数百个 agent)上线前先在小范围试跑。
立场提示:本文是 Anthropic 官方博客,讲的是自家 Claude Code 的能力与功能组合,属厂商发布内容。文中的分类框架、示例代码与 90 分「数百个 agent」等数字均引自原文,是官方口径。
1背景 · 这篇在讲什么

AI 帮你干活,但谁来决定「干完了」?

Claude Code 团队的 Delba de Oliveira 和 Michael Segner 于 2026 年 6 月 30 日在 Anthropic 官方博客发文,系统梳理了怎么为 Claude Code 设计「循环(loop)」:让 agent 反复执行工作,直到满足停止条件。

作者开篇点出一个现象:X 上到处在聊「别再一句句提示编码 agent 了,要设计循环」,但你真去找「循环到底是什么」,会看到一堆互相打架的答案。这篇文章要做的,就是把这件事说清楚。

它不是一个新产品发布,而是一套框架:把 Claude Code 里早就有的 5 个独立功能,统一整理成按自主程度分级的 4 种循环,并给出可以直接照抄的组合模板。
为什么值得看:/goal、/loop、/schedule、dynamic workflows、auto mode 这 5 个功能,第一次被归到一个坐标系里,从「你盯每一轮」到「无人值守」排成 4 级;文末还给出一条可复制的流水线,用这几个功能拼出自动处理 bug 分诊、issue 分类、依赖升级的系统。

下面按 4 级循环从简单到复杂逐个拆开,每级都能对上你手头的某类活儿。

2定义与坐标系

先搞懂:「循环」到底是什么

官方定义只有一句:循环,就是 agent 反复执行一轮轮工作,直到满足某个停止条件。关键区别在于,「什么时候算完成」是提前定好、交给系统判断的,不是你自己一轮一轮盯着催。

作者按四个维度给循环分类,这四个维度就是后面每种循环的统一参照系:谁触发它、它怎么判断该停、它用 Claude Code 里的哪个功能实现、它最适合什么任务。先把坐标系立起来,四种循环再往里对号入座。

自主程度 ↑ ① 回合制 ② 目标制 ③ 时间制 ④ 主动式 内圈:你盯每一轮 外圈:无人值守
越往外圈,自主程度越高,越少人管;最外圈那条持续流动的轨道,就是一条正在无人值守跑着的循环
① 谁触发

一句提示 → 手动实时 → 到点(时间间隔)→ 事件或排期,全程无人在场

② 怎么判断停

Claude 自己判断 → 达标或到重试上限 → 你取消或活干完 → 每个任务达标退出、整条流水线你手动关

③ 用什么功能

默认对话 → /goal/loop/schedule → 以上全部 + dynamic workflows + auto mode

④ 适合什么任务

短任务 → 有可验证退出标准的任务 → 周期性或对接外部系统 → 反复出现且定义清晰的工作流

作者也提醒:不是所有任务都需要复杂循环,从最简单的方案起步,这些模式按需选用就好。

3第 1 级 · 回合制

你问一句,它做一轮

这就是你每天在用的默认模式。你发的每一条提示,都开启一个由你亲手引导每一轮的循环:Claude 收集上下文、动手、检查自己的工作、必要时重复、然后回复。官方管它叫「agentic loop」。

举个原文的例子:你让 Claude 做一个点赞按钮。它读你的代码、改文件、跑测试,然后交回一个它「自认为」能用的东西。接下来由你手动验收,再写下一条提示。触发它的是一句提示,停下来的判断权在 Claude 自己手里,适合那些不属于固定流程、也不按排期来的短任务。

读上下文
动手改
跑测试自查
交回你验收
回合制循环 turn-based loop 示意
原文配图:回合制循环(agentic loop)示意,一句提示触发,Claude 自查后交回你手动确认。来源:Claude 官方博客

怎么让它自查得更彻底

你可以把「验证」这一步做强:把你平时手动验收的步骤写成一个 SKILL.md,让 Claude 能端到端地自己检查更多东西。关键是给它能看到、量到、动手的工具或连接器:检查越量化,Claude 越容易自我验证,需要的回合数也越少。

原文给了一个 verify-frontend-change 技能:任何前端改动,不许只凭「编辑成功」就报完成,得像人类审查者那样走完整流程。

  1. 启动 dev server,在浏览器打开改动的页面
  2. 直接和改动交互:点按钮、确认状态变化、截图前后对比
  3. 看浏览器控制台:不能有任何新报错或警告
  4. 用 Chrome DevTools MCP 跑性能 trace,审 Core Web Vitals

任一步失败,就修好后从第 1 步重跑,绝不交半成品。

看原始 SKILL.md 示例代码
---
name: verify-frontend-change
description: Verify any UI change end-to-end before declaring it done.
---

# Verifying frontend changes
Never report a UI change as complete based on a successful edit alone.
Verify it the way a human reviewer would:

1. Start the dev server and open the edited page in the browser.
2. Interact with the change directly. For a new control (button,
   input, toggle): click it, confirm the expected state change,
   and screenshot before/after.
3. Check the browser console: zero new errors or warnings.
4. Use the Chrome Devtools MCP, run a performance trace and audit
   Core Web Vitals.

If any step fails, fix the issue and rerun from step 1 — do
not hand back partially verified work.
4第 2 级 · 目标制 · 核心

先定好「及格线」,它才准停

有时候一轮不够,尤其是复杂任务。agent 在能反复迭代时表现更好。你可以用 /goal 把「什么样才算做完」定义清楚,来延长 Claude 迭代的时间。

核心机制

当你定义了成功标准,Claude 就不用自己去判断「够好了吗」然后提前收工。每次 Claude 想停下来,都有一个独立的评估模型(evaluator)拿着你的条件核对一遍,没达标就把它打回去继续干,直到目标达成、或者到了你设定的尝试次数上限才真正停。

换句话说,判定权从 Claude 手里拿走了,交给一个专门核对标准的评估模型。这也是为什么「确定性标准」特别好使:比如通过的测试数量、清除某个分数阈值,评估模型能明确打勾,不含糊。

Claude 迭代干活 尝试收工 评估模型 拿你的标准打分 达标? 达标 / 到重试上限 → 停止 达标 / 到上限 不达标 · 打回重做
Claude 每次想收工,都要过评估模型这道关:不达标沿虚线打回重做,达标或到上限才真停
打个比方

像交作业前先过一道质检关卡:质检员不是自己批自己,而是换了个人(评估模型)拿着标准表逐条打勾,不达标就打回重做,最多返工几次为止。

目标制循环 goal-based loop 示意
原文配图:目标制循环(/goal)示意,评估模型核对退出标准。来源:Claude 官方博客

一个具体例子:

/goal get the homepage Lighthouse score to 90 or above, stop after 5 tries.
90 分
示例设定的 Lighthouse 达标线,由评估模型核对
5 次
达不到时的最多重试次数,到上限就停,用来管住花销

目标制适合有可验证退出标准的任务;你交出去的是「停止条件」,用的功能就是 /goal。管花销的办法:把完成标准和重试上限都定具体,比如「试 5 次后停」。

5第 3 级 · 时间制

到点自己去看一眼

有些活儿是周期性的:任务不变,只有输入在变,比如每天早上汇总一遍 Slack 消息。还有些活儿依赖外部系统,最简单的对接办法就是按固定间隔去查一下、根据变化做出反应,比如一个 PR,它可能收到评审意见、也可能 CI 挂掉。

这类工作用 /loop 触发,它会按间隔重跑一句提示。停下来的条件是你取消它、或者活干完了(PR 合并了、队列空了)。例子:

/loop 5m check my PR, address review comments, and fix failing CI
/loop 本地跑

在你自己的电脑上按固定间隔重跑同一句提示。

你把电脑关了,它就停。适合你人在、临时盯一段的活儿。

/schedule 搬到云端

/schedule 建一个 routine,把这套「定时重跑」搬到云端常驻。

你电脑关了,它照样跑。适合要长期挂着、不受你在不在场影响的活儿。

5 分钟
示例:/loop 5m 每 5 分钟检查一次 PR、处理评审意见、修失败的 CI
按需拉长
管花销:把间隔设长,或改成「按事件反应」而不是死盯时间
6第 4 级 · 主动式 · 核心

五个功能拼起来,不用人管自己跑

前面几种原语,加上 auto mode(自动模式,不用每步停下来问你要不要继续)和 dynamic workflows(动态工作流,研究预览版),能组合成一条处理长期工作的循环。触发它的是事件或排期,全程没有人实时在场。

主动式循环的停止逻辑分两层:每个具体任务达到自己的目标就退出,而整条 routine 本身会一直跑,直到你手动把它关掉。它最适合那种反复出现、定义清晰的工作流:bug 报告、issue 分诊、迁移、依赖升级等等。

组合打法

以处理反馈为例,官方给的拼法是把四个功能一层层叠起来,再罩上 auto mode:

/schedule 定时触发
建一个 routine,每小时检查一次有没有新报告(研究预览版)
/goal 停止条件
定义什么算「做完」,配合 skills 说明该怎么验证
skills 校验标准
把「怎么算修好」固化成技能,让 Claude 能自查
dynamic workflows 多 agent 编排
编排一批 agent 去分诊每条报告、修复、再审查修复结果
auto mode 免人工确认
罩在最外层,让整条 routine 一路跑完,不停下来问权限
主动式循环 proactive loop 示意
原文配图:主动式循环(proactive loop)示意,事件或排期触发、无人实时在场。来源:Claude 官方博客

拼在一起,一条完整提示长这样:

/schedule every hour: check #project-feedback for bug reports.
/goal: don't stop until every report found this run is triaged,
actioned, and responded to. When fixing a bug, use a workflow to
explore three solutions in parallel worktrees and have a judge
adversarially review them.

翻成大白话:每小时去 #project-feedback 频道查 bug 报告;这一轮找到的每一条,不分诊完、处理完、回复完就别停;修某个 bug 时,用一个 workflow 在三个独立分支(worktree)里并行试三种解法,再让一个裁判 agent 对抗式地互相挑错。这里的 dynamic workflows 单次可以拉起量级到数百个的子 agent 分头干活、互相配合。

主动式闭环 跑到你手动关为止 1 2 3 4 5 监听 #project-feedback 分诊报告 三 worktree 并行修 裁判对抗式审查 响应 · 收尾
事件触发 → 分诊 → 多 agent 并行探索三种解法 → 裁判审查 → 自动收尾,然后回到监听下一个事件

管花销的办法:把 routine 派给更小更快的模型跑,只在需要判断的关键点上用最强的模型。

7质量保障

别让循环自己跑偏

一个循环的输出质量,取决于它周围那套系统。设计系统时,官方给了四条:

  • 保持代码库本身干净

    Claude 会照着你代码库里已有的模式和约定走,底子干净,它跟着走出来的东西才干净。

  • 给 Claude 一个自查的手段

    把「什么样才算好」用 skills 固化成你和团队的标准,让它能端到端检查自己。

  • 让文档触手可及

    框架和库的官方文档带着最新的最佳实践,别让它凭旧记忆瞎猜。

  • 用第二个 agent 做代码审查

    一个上下文全新的审查者偏见更少,不受主 agent 推理的影响。可以用内置的 /code-review,或接 GitHub 的 Code Review。

心法

当某一次的结果不达标,别只停在修好这一次的问题。试着把它固化成规则,去改进整个系统,让后面每一轮迭代都受益。出错时该改的是系统规则,不是这一次的结果。

8省 token

别让循环偷偷烧光你的 token

要管住 token,循环得有清晰的边界。原文给了六条可执行清单:

1选对原语和模型规模小任务不需要多 agent 或循环,有些任务用更便宜更快的模型就够。
2定清晰的成功与停止标准说清什么算完成,让 Claude 更快到位,但别停得太早。
3大规模跑之前先小范围试dynamic workflows 可能拉起数百个 agent,先在一小块工作上估花销。
4确定性工作用脚本跑脚本比每次重新推导便宜,比如 PDF 技能自带填表脚本,Claude 每次直接跑,而不是重写代码。
5别跑得比需要的勤轮询间隔按被监控对象实际变化的频率来定,不要固定死。
6定期复盘花销/usage 按 skills、subagents、MCP 拆解近期用量;/goal 无参数看已用轮数和 token;/workflows 看每个 agent 的用量并可随时停掉。
数百个
dynamic workflows 单次可拉起的 agent 量级,放量前务必先小范围试跑
脚本 < 推导
确定性步骤跑现成脚本,比让 Claude 每次重新推导代码更省
9速查

四种循环怎么选,一张表说清

面对一个具体任务,你要想清楚三件事:交出去什么、什么时候用、用哪个功能。原文这张总表把四级循环并成一行行对照,点开每张卡片能看具体示例。

循环你交出什么时候用用什么
回合制「检查」你在探索或做决定自定义验证 skills
目标制「停止条件」你清楚什么算完成/goal
时间制「触发」工作在项目之外按时间表发生/loop/schedule
主动式「提示词」工作反复出现且定义清晰以上全部 + dynamic workflows
回合制 · 看示例

让 Claude 做个点赞按钮:它读代码、改文件、跑测试、交回一个它自认为能用的版本,你手动验收后再写下一条提示。

目标制 · 看示例
/goal get the homepage Lighthouse score to 90 or above, stop after 5 tries.
时间制 · 看示例
/loop 5m check my PR, address review comments, and fix failing CI
主动式 · 看示例
/schedule every hour: check #project-feedback for bug reports.
/goal: don't stop until every report found this run is triaged,
actioned, and responded to. When fixing a bug, use a workflow to
explore three solutions in parallel worktrees and have a judge
adversarially review them.
从哪里开始 · 三个自查问题

看你已经在做的活儿,挑一个你是瓶颈的任务,问自己哪一块能交出去:

  1. 你能不能写出这件事的验收检查?
  2. 这件事的目标够不够清楚?
  3. 这活儿是不是按时间表来的?

有了想法就把循环跑起来,观察它在哪儿卡住、在哪儿越界,然后放手去迭代它。

我们把循环定义为:agent 反复执行一轮轮工作,直到满足某个停止条件。 Claude Code 团队,Getting started with loops,2026-06-30
来源:Claude 官方博客《Getting started with loops》(claude.com/blog/getting-started-with-loops),作者 Delba de Oliveira、Michael Segner,发布于 2026-06-30。本文为该厂商发布内容的中文可视化解读;文中分类框架、示例代码(/goal、/loop、/schedule 与组合提示)及「90 分、5 次、数百个 agent」等数字均引自原文,为官方口径。dynamic workflows、/schedule 为原文标注的研究预览版功能。