1 min read

LLM:生产级 Agent 工程范式:从 Claude Code 看模型与基础设施的边界

LLM 系列导航

1 LLM:Function Call(1)从传统工具调用到函数驱动 2020-09-08
2 LLM:关注因果推断研究进展 2023-06-22
3 LLM:人机协作 2024-05-19
4 LLM:分层管理风险定性 2024-08-08
5 LLM:FN分层分析与提升空间测算(1) 2024-09-12
6 LLM:FN分层分析与提升空间测算(2) 2024-09-12
7 LLM:FN分层分析与提升空间测算(3) 2024-09-12
8 LLM:FN分层分析与提升空间测算(4) 2024-09-12
9 LLM:FN分层分析与提升空间测算(5) 2024-09-12
10 LLM:推理不可复现的探索 2025-06-11
11 LLM:SFT 与 RL 的关系 2025-07-29
12 LLM:SFT 与 RL 的关系(理论修正与实践补充) 2025-07-30
13 LLM:SFT 与 RL 的关系(理论修正与实践补充II) 2025-07-31
14 LLM:表格数据特征工程(1)核心方法与框架 2025-08-03
15 LLM:表格数据特征工程(2)低数据场景的决策树生成 2025-08-03
16 LLM:表格数据特征工程(3)落地冷启动 2025-08-03
17 LLM:表格数据特征工程(4)线性可分性与模型选型 2025-08-03
18 LLM:撰写大模型落地提示词的关键 2025-08-27
19 LLM:从 Prompt 设计到工作流落地 2025-08-28
20 LLM:RL's Razor 抗遗忘 2025-09-04
21 LLM:RL's Razor 抗遗忘(4)on-policy认知误区 2025-09-04
22 LLM:RL's Razor 抗遗忘(5)RL在线生成样本 2025-09-04
23 LLMRL's Razor 抗遗忘(2) 2025-09-04
24 LLMRL's Razor 抗遗忘(3)SFT 与 RL 的认知偏差及应用 2025-09-04
25 LLM:MuseGraph融合GNN与LLM的通用图挖掘新框架 2025-09-05
26 LLM:幻觉成因与解决 2025-09-08
27 LLM:Agent 逻辑与应用场景 2025-09-23
28 LLM:拆解大模型缩放定律失效的三重分解 2025-10-05
29 LLM:近似on-policy数据抗遗忘 2025-10-21
30 LLM:近似on-policy数据抗遗忘(2)Iterative-SFT 2025-10-21
31 LLM:幻觉治理 2025-10-28
32 LLM:先验偏见(1)变量名带偏判断 2025-11-13
33 LLM:先验偏见(2)分层分析应对 2025-11-13
34 LLM:先验偏见(3)实验效度的场景化适配 2025-11-13
35 LLM:分层落地 2025-11-13
36 LLM:零样本在金融场景落地 2025-11-13
37 LLM:跨难度泛化的局限与量化 2025-11-26
38 LLM:重复提示词解锁非推理性能上限 2025-12-17
39 LLM:用失败样本提升指令遵循能力 2025-12-29
40 LLM:概率引导的高价值信号筛选 2026-01-14
41 LLM:低成本安全检测的级联方案 2026-01-16
42 LLM:定性编码的假阳性解决方案 2026-01-16
43 LLM:先验偏见(4)挑战与落地解决方案 2026-01-22
44 LLM:先验偏见(5)工程化方案 2026-01-22
45 LLM:先验偏见(6)递进式优化与工程化落地 2026-01-22
46 LLM:SimRL(1)分层评估 2026-02-03
47 LLM:SimRL(2)理论逻辑与工程落地 2026-02-03
48 LLM:SimRL(3)质量评估与落地优化 2026-02-03
49 LLM:MCP vs Skills 核心差异 2026-03-22
50 LLM:OpenClaw 消息渠道配置实践 2026-03-22
51 LLM:OpenClaw 检索架构的工程实现与设计逻辑 2026-03-24
52 LLM:OpenClaw 的Memory原生架构与Agent发展方向 2026-03-24
53 LLM:Coze云端开发环境初始化与504超时问题排查 2026-03-28
54 LLM:OpenClaw 微信 ClawBot 插件配置指南 2026-03-28
55 LLM:OpenClaw 记忆系统:三级架构的正确理解 2026-03-28
56 LLM:Agent Skill与状态管控的工程化定论 2026-04-03
57 LLM:Harness Engineering——代码智能体入门:核心概念与三大关键组件 2026-04-05
58 LLM:OpenClaw 一个月观察 2026-04-07
59 LLM:多模态模型规模误区与分工协作架构解析 2026-04-07
60 LLM:Claude Code 和 OpenClaw 的长会话差距 2026-04-08
61 LLM:Harness Engineering:AI Agent 的外循环工程体系 2026-04-12
62 LLM:Harness Engineering——Agent系统的信息筛选机制 2026-04-15
63 LLM:OpenClaw Heartbeat:让Agent拥有定时任务能力 2026-04-15
64 LLM:强化学习风控(1)RLVP框架与专家稠密奖励 2026-04-18
65 LLM:Harness Engineering——大模型Agent工程迭代 2026-05-03
66 LLM:量化部署系列:(1)动态精度路由与低精度正则化的工程实践 2026-05-10
67 LLM:量化部署系列:(2)用"躺平"和"用力过猛"理解量化路由 2026-05-11

引言

近期发布的《Dive into Claude Code》一文,以 Anthropic 所开源的编程智能体 Claude Code 为分析对象,系统呈现了一款可落地于真实场景的 AI Agent 系统的内部构造。不同于多数面向模型能力与提示词工程的讨论,该文将重心置于系统工程实现,揭示了生产级智能体从"可用"到"可靠"的关键路径。其结论不仅适用于代码开发场景,更对通用 AI Agent 架构设计具备范式意义。


一、系统构成:模型决策与工程基座的极端比例

Claude Code 是基于 TypeScript 实现的 CLI 形态 AI 编程 Agent,承担代码理解、编辑、执行与工程化协作等任务。对其代码库的结构拆解显示:

  • 系统中仅约 1.6% 逻辑与模型决策直接相关
  • 剩余 98.4% 为确定性工程基础设施,包括权限控制、执行沙箱、上下文管理、工具调度、异常处理、可观测性与安全拦截等模块

这一比例揭示了生产级 Agent 的本质:模型负责意图理解、规划判断与模糊问题求解,而工程系统负责约束边界、保障安全、维持执行一致性。智能体的可用性不取决于模型的单一能力上限,而取决于基础设施对模型不确定性的承接能力。


二、设计理念:自由决策与确定性约束

Claude Code 的核心设计哲学可概括为:在可控框架内保留模型决策自由(model judgment within a deterministic harness)。

系统将高复杂度、高模糊度的任务交给模型,同时将所有涉及执行、权限、状态与副作用的环节交由严格的工程规则管理。其目标并非以模型替代人工,而是在保证安全可控的前提下放大人类的开发效率,形成"模型负责判断、系统负责执行"的分工结构。

围绕这一理念,其核心价值取向可归纳为五点:

  1. 人类授权优先,以用户为最终决策主体
  2. 安全与合规前置,遵循最小权限原则
  3. 执行过程可追溯、可中断、可回滚、可审计
  4. 以工具链放大能力,而非追求模型完全自主
  5. 上下文动态自适应,平衡信息密度与窗口约束

这一分工结构可以类比传统对话系统的落地逻辑:大模型负责意图理解、问题求解,工程系统(人工拍板)负责约束、安全、执行,类似传统对话系统"前四步(ASR-意图理解-对话跟踪-决策学习)靠大模型,后两步(话术生成-TTS)靠约束工程"。


三、核心执行机制:极简循环与原则约束

系统并未采用复杂的规划器、状态机或工作流引擎,而是以一个高度稳定的循环作为主体:

  1. 上下文组装:聚合当前任务所需信息
  2. 模型推理:由模型输出下一步动作决策
  3. 权限校验与执行:完成安全检查后执行工具调用,并将结果回写上下文

支撑该循环的关键原则包括:

  • 默认拒绝(Deny-First):无明确授权则禁止执行,降低误操作与安全风险
  • 上下文瓶颈优先治理:通过渐进式压缩策略控制窗口膨胀
  • 子 Agent 隔离:子任务使用独立上下文,仅以摘要形式回传结果,减少相互干扰
  • 安全左移:将权限拦截、沙箱隔离、Hook 校验与 ML 风险检测前置,实现多层防御

四、架构实现:六大核心子系统

1. 核心循环

以极简 while 循环完成主体流程,控制流清晰、可预测性强,避免复杂状态跳转带来的不可控性。

2. 权限与安全

构建七层权限模型,覆盖文件、网络、Shell、工具、Agent、运行环境与用户操作。结合执行沙箱与拦截机制,显著降低风险暴露面。

3. 上下文管理

采用多级压缩管线,从轻量语法精简到语义蒸馏逐级递进,在有限窗口内尽可能保留结构信息与任务关键线索。

4. 工具系统

内置标准化工具集,统一接口规范并与权限体系绑定,确保模型调用可约束、可审计。

5. 扩展机制

按成本与侵入性分级提供 Hook、Skill、Plugin、MCP 等扩展方式,适配不同场景的定制需求。

6. 子 Agent 系统

以独立进程、独立上下文与独立权限实现子任务隔离,支持并行处理,最终通过摘要聚合结果,代价体现为团队模式下 Token 消耗显著上升。


五、关键发现与工程启示

论文在实现分析中提出若干具备普遍意义的结论:

  1. 安全机制必须优先初始化,避免出现执行早于校验的窗口期漏洞
  2. 沙箱与权限规则结合可大幅减少用户确认成本,提升可用性
  3. 上下文压缩不可避免存在信息损耗,局部最优并不必然等价于全局最优
  4. 子 Agent 模式虽能提升并行能力,但会显著增加计算与上下文开销

将 Claude Code 与流程编排类框架(如 LangGraph)对比可见显著路线差异:前者更强调放开模型决策、依靠基础设施保证可控性;后者更倾向于通过固定流程约束模型行为。而与常驻网关式 Agent 系统(如 OpenClaw)相比,Claude Code 更偏向单工程绑定的临时 CLI 进程,适合轻量化、高隔离的开发场景。


六、局限与未来方向

当前架构仍存在明显约束:上下文窗口限制导致全局代码库感知能力不足,压缩策略带来信息损失,模型决策的不确定性仍需外部系统高强度兜底。

未来演进方向集中在:更精细的自适应上下文压缩、子 Agent 动态调度与资源管理、更强的隔离与沙箱能力、多模型协同决策机制,以及更精准的用户意图对齐。


结语

Claude Code 的实践表明,生产级 AI Agent 的竞争焦点早已不在模型能力本身,而转向工程体系的成熟度。1.6% 的模型决策与 98.4% 的基础设施这一比例,本质上揭示了一个行业共识:智能体的可靠性、安全性与可用性,由工程底座决定。在大模型能力逐步趋同的背景下,围绕权限、沙箱、上下文、可观测性与可控性的基础设施建设,将成为 Agent 落地的核心壁垒。


参考文献

Anthropic. (2025). Dive into Claude Code. arXiv:2604.14228.

LLM 系列导航

1 LLM:Function Call(1)从传统工具调用到函数驱动 2020-09-08
2 LLM:关注因果推断研究进展 2023-06-22
3 LLM:人机协作 2024-05-19
4 LLM:分层管理风险定性 2024-08-08
5 LLM:FN分层分析与提升空间测算(1) 2024-09-12
6 LLM:FN分层分析与提升空间测算(2) 2024-09-12
7 LLM:FN分层分析与提升空间测算(3) 2024-09-12
8 LLM:FN分层分析与提升空间测算(4) 2024-09-12
9 LLM:FN分层分析与提升空间测算(5) 2024-09-12
10 LLM:推理不可复现的探索 2025-06-11
11 LLM:SFT 与 RL 的关系 2025-07-29
12 LLM:SFT 与 RL 的关系(理论修正与实践补充) 2025-07-30
13 LLM:SFT 与 RL 的关系(理论修正与实践补充II) 2025-07-31
14 LLM:表格数据特征工程(1)核心方法与框架 2025-08-03
15 LLM:表格数据特征工程(2)低数据场景的决策树生成 2025-08-03
16 LLM:表格数据特征工程(3)落地冷启动 2025-08-03
17 LLM:表格数据特征工程(4)线性可分性与模型选型 2025-08-03
18 LLM:撰写大模型落地提示词的关键 2025-08-27
19 LLM:从 Prompt 设计到工作流落地 2025-08-28
20 LLM:RL's Razor 抗遗忘 2025-09-04
21 LLM:RL's Razor 抗遗忘(4)on-policy认知误区 2025-09-04
22 LLM:RL's Razor 抗遗忘(5)RL在线生成样本 2025-09-04
23 LLMRL's Razor 抗遗忘(2) 2025-09-04
24 LLMRL's Razor 抗遗忘(3)SFT 与 RL 的认知偏差及应用 2025-09-04
25 LLM:MuseGraph融合GNN与LLM的通用图挖掘新框架 2025-09-05
26 LLM:幻觉成因与解决 2025-09-08
27 LLM:Agent 逻辑与应用场景 2025-09-23
28 LLM:拆解大模型缩放定律失效的三重分解 2025-10-05
29 LLM:近似on-policy数据抗遗忘 2025-10-21
30 LLM:近似on-policy数据抗遗忘(2)Iterative-SFT 2025-10-21
31 LLM:幻觉治理 2025-10-28
32 LLM:先验偏见(1)变量名带偏判断 2025-11-13
33 LLM:先验偏见(2)分层分析应对 2025-11-13
34 LLM:先验偏见(3)实验效度的场景化适配 2025-11-13
35 LLM:分层落地 2025-11-13
36 LLM:零样本在金融场景落地 2025-11-13
37 LLM:跨难度泛化的局限与量化 2025-11-26
38 LLM:重复提示词解锁非推理性能上限 2025-12-17
39 LLM:用失败样本提升指令遵循能力 2025-12-29
40 LLM:概率引导的高价值信号筛选 2026-01-14
41 LLM:低成本安全检测的级联方案 2026-01-16
42 LLM:定性编码的假阳性解决方案 2026-01-16
43 LLM:先验偏见(4)挑战与落地解决方案 2026-01-22
44 LLM:先验偏见(5)工程化方案 2026-01-22
45 LLM:先验偏见(6)递进式优化与工程化落地 2026-01-22
46 LLM:SimRL(1)分层评估 2026-02-03
47 LLM:SimRL(2)理论逻辑与工程落地 2026-02-03
48 LLM:SimRL(3)质量评估与落地优化 2026-02-03
49 LLM:MCP vs Skills 核心差异 2026-03-22
50 LLM:OpenClaw 消息渠道配置实践 2026-03-22
51 LLM:OpenClaw 检索架构的工程实现与设计逻辑 2026-03-24
52 LLM:OpenClaw 的Memory原生架构与Agent发展方向 2026-03-24
53 LLM:Coze云端开发环境初始化与504超时问题排查 2026-03-28
54 LLM:OpenClaw 微信 ClawBot 插件配置指南 2026-03-28
55 LLM:OpenClaw 记忆系统:三级架构的正确理解 2026-03-28
56 LLM:Agent Skill与状态管控的工程化定论 2026-04-03
57 LLM:Harness Engineering——代码智能体入门:核心概念与三大关键组件 2026-04-05
58 LLM:OpenClaw 一个月观察 2026-04-07
59 LLM:多模态模型规模误区与分工协作架构解析 2026-04-07
60 LLM:Claude Code 和 OpenClaw 的长会话差距 2026-04-08
61 LLM:Harness Engineering:AI Agent 的外循环工程体系 2026-04-12
62 LLM:Harness Engineering——Agent系统的信息筛选机制 2026-04-15
63 LLM:OpenClaw Heartbeat:让Agent拥有定时任务能力 2026-04-15
64 LLM:强化学习风控(1)RLVP框架与专家稠密奖励 2026-04-18
65 LLM:Harness Engineering——大模型Agent工程迭代 2026-05-03
66 LLM:量化部署系列:(1)动态精度路由与低精度正则化的工程实践 2026-05-10
67 LLM:量化部署系列:(2)用"躺平"和"用力过猛"理解量化路由 2026-05-11