一文彻底搞懂 Loop Engineering

一文彻底搞懂 Loop Engineering

前言:AI 工程范式迎来第四代变革

2026 年 6 月,Google 工程总监 Addy Osmani 正式提出Loop Engineering(循环工程),迅速成为 AI Agent、代码自动化领域的核心架构范式。 在此之前,AI 工程已经历三代演进:

  1. Prompt Engineering(提示工程):打磨单次对话指令,人全程手动驱动交互;
  2. Context Engineering(上下文工程):整合 RAG、历史记忆、工具信息,丰富单次输入上下文;
  3. Harness Engineering(线束 / 驾驭工程):为 Agent 搭建沙箱、权限、工具集等静态运行环境;
  4. Loop Engineering(循环工程):搭建自治闭环调度系统,彻底把人类从 “反复下发提示、校验结果” 的重复劳动中解放。

Anthropic Claude Code 负责人 Boris Cherny 一句话点明核心转变:

我不再手动给 Claude 写提示词。我搭建循环系统,由循环自动向模型下发指令、判断下一步动作,我的工作只剩设计循环本身。

很多开发者会混淆Agent LoopLoop Engineering,二者并非同一概念:

  • Agent Loop:单个 Agent 底层最小执行单元,流程为「推理 Reason→执行 Act→观测 Observe→判断终止」,是所有智能体内置的基础逻辑;
  • Loop Engineering:上层系统工程方法论,批量调度、管控无数 Agent Loop,配套独立校验、事件触发、持久状态、熔断防护整套体系。 简单比喻:Agent Loop 是厨师自带的做菜步骤;Loop Engineering 是全自动中央厨房调度流水线。

一、Loop Engineering 核心定义

标准定义

Loop Engineering 是一套面向 LLM Agent 的闭环系统架构方法论:开发者仅定义可量化目标、校验规则、终止条件,搭建自动调度系统,由系统自主完成任务触发、Agent 分发、执行校验、自动纠错、状态持久化全流程,无人值守持续迭代,直到满足完工标准。

核心口号:Stop Prompting. Design the Loop.(停止手动提示,专注设计循环)

核心本质

传统 AI 协作是人作为循环控制器:人发 Prompt→看结果→人工修正指令→再次提问; 循环工程是系统替代人成为循环控制器,人类角色从 “实时操作员” 转变为 “系统架构师、规则定义者”。

二、完整循环工程六大核心模块(Addy Osmani 标准架构)

一套生产级 Loop 系统由 6 个缺一不可的模块组成:

1. Automations 自动化触发器

负责自主唤醒循环,无需人工启动,主流触发源:

  • 事件触发:Git PR 提交、Issue 新建、CI 构建失败、监控告警、数据库数据变更;
  • 定时触发:Cron 定时任务(每日凌晨批量修复 Bug、每周生成项目报告);
  • 手动兜底触发:支持人工一键启动特殊任务。

2. Sub-agents 子 Agent 集群

循环的执行单元,底层复用标准 Agent Loop 完成实际任务:

  • 多子 Agent 并行隔离执行,分工拆分复杂目标;
  • 区分执行 Agent(写代码、爬取数据)、评审 Agent(语义校验、逻辑审查)两类角色;
  • 每个子 Agent 独立运行原生ReAct循环。

3. Worktrees 隔离工作区

解决多 Agent 并行冲突的安全机制:

  • 每个任务分配独立沙箱 / 代码分支,Agent 修改文件互不覆盖;
  • 执行失败可一键销毁隔离环境,不污染主项目代码;
  • 支持多方案并行探索,择优合并最终结果。

4. Skills 技能库

沉淀可复用工具能力,避免 Agent 每次从零探索:

  • 文件读写、单元测试运行、编译构建、接口调用、Git 操作等标准化工具;
  • 技能持久归档,循环每次启动直接复用,大幅降低 Token 消耗。

5. Connectors 外部连接器

打通循环与外部业务系统:GitHub、飞书 / 钉钉通知、数据库、监控平台、测试服务; 配套权限管控:区分只读、可修改、需人工审批三类操作,防止越权风险。

6. State File 持久状态存储

循环的记忆中枢,解决长周期任务中断丢失进度问题:

  • 记录迭代轮次、历史报错、中间产出、任务进度、资源消耗;
  • 支持中断续跑、日志追溯、异常复盘;
  • 内置熔断数据:最大迭代次数、最大 Token 成本、连续无进展阈值。

三、标准执行流程

  1. 触发唤醒:触发器捕获事件,初始化循环状态;
  2. 任务分发:拆分大目标,分配至独立 Worktree 与子 Agent;
  3. 内层执行:每个Agent 运行自身 Agent Loop完成产出;
  4. 双层校验
    • 硬校验:单元测试、编译、Lint 等确定性程序校验;
    • 软校验:专用评审 Agent 核查逻辑、需求匹配度;
  1. 分支决策
    • 全部通过:归档成果、推送通知,循环正常结束;
    • 校验失败:提取报错,生成修正指令重新迭代;
    • 触发熔断:达到最大轮次 / 成本阈值,留存日志转交人工;
  1. 更新状态:保存本轮迭代信息,等待下一次触发。

四、落地适用场景

适合使用 Loop Engineering

  1. 代码自动化:PR 自动审查、批量修复 CI 报错、自动生成测试用例;
  2. 数据流水线:定时爬取、清洗校验、异常重跑、自动产出报表;
  3. 自动化运维:7×24 指标巡检、故障定位、自动修复复测;
  4. 长文本迭代:文献整理、稿件多轮修改直至满足规范。

不推荐使用

  1. 低频一次性任务,手动 Prompt 更快;
  2. 产出无量化标准、只能人工主观评判;
  3. 简单单轮问答,搭建调度系统收益极低。

五、极简 Python Demo(区分两层逻辑)

from dataclasses import dataclass, field import subprocess # 1. 循环持久状态(Loop Engineering专属) @dataclass class LoopState: goal: str iteration: int = 0 max_iter: int = 10 errors: list = field(default_factory=list) status: str = "running" # 底层:单个Agent Loop 执行单元 def agent_loop_fix_code(error: str) -> str: # LLM调用逻辑省略,输入报错返回修复代码 return "修复后代码片段" # 硬校验层(循环工程核心) def run_pytest_check(): res = subprocess.run(["pytest", "-q"], capture_output=True, text=True) return {"pass": res.returncode == 0, "msg": res.stdout + res.stderr} # 顶层:Loop Engineering 调度主循环 def loop_engine_run(goal: str): state = LoopState(goal=goal) while state.status == "running": state.iteration += 1 # 熔断判断 if state.iteration > state.max_iter: state.status = "need_human" break # 校验当前结果 check = run_pytest_check() if check["pass"]: state.status = "success" break # 失败则调用Agent Loop重跑 agent_loop_fix_code(check["msg"]) state.errors.append(check["msg"]) print(f"迭代轮次:{state.iteration}, 结果:{state.status}") if __name__ == "__main__": loop_engine_run("修复所有单元测试用例,全部通过")

代码分层说明:

  • agent_loop_fix_code:底层 Agent Loop;
  • LoopState、熔断、调度主逻辑:Loop Engineering 上层调度体系。

运行结果:

代码中的run_pytest_check()函数运行pytest -q,但当前项目没有测试文件,所以pytest总是返回失败状态,导致循环一直运行直到达到最大迭代次数(10次)。

六、区分:Loop Engineering vs 传统工作流

感觉“很像工作流”,是因为外壳相似(触发、编排、分支、状态),但内核完全相反

传统工作流 =步骤驱动、固定流程、单向执行

循环工程 =目标驱动、动态自适应、闭环自修正

1. 传统工作流(Airflow、Dolphin、Flowable、低代码)

  • 所有步骤开发时写死:A→B→C→D
  • 失败只会重试当前步骤,不会改变执行方案
  • 没有智能校验回流,流程单向不可逆
  • 不需要AI,纯脚本即可运行

本质:流水线,按既定工序跑完即可。

2. Loop Engineering 循环工程

  • 只定义最终目标,不定义中间步骤
  • Agent自主规划动作、调整方案、尝试不同思路
  • 校验失败错误回流,重新迭代优化产出
  • 迭代次数、路径完全动态,由结果决定

本质:研发实验室,不达验收标准不停止。

3. 核心差异对比

对比维度

传统工作流

Loop Engineering

驱动逻辑

步骤驱动,静态固定

目标驱动,动态自适应

失败处理

简单重试或终止,无优化能力

错误回流、策略迭代、自我修正

执行单元

脚本、API、固定任务

具备推理规划能力的Agent Loop

闭环能力

单向流程,无自我优化闭环

执行-校验-修正 内生自治闭环

七、 极简上手:终端/AI工具快速使用

主流AI编码工具(Claude Code等)原生支持循环工程能力,无需复杂部署,一键启用:

  • 开启定时循环/loop 5m 自动化检查项目代码规范、修复简易报错,固定周期持续巡检迭代;
  • 开启目标自治循环:直接下发量化Goal,例如/goal 将项目单元测试覆盖率提升至80%,最大迭代10轮,系统自动循环优化直至达标;
  • 终止循环:无需等待结束,手动兜底指令/goal clear,一键停止当前所有循环任务。

感兴趣的宝子可以关注一波,后续会更新更多有用的知识!!!