1 min read

LLM:Harness:Agent系统的信息筛选机制

LLM 系列导航

1 LLM:Function Call(1)从传统工具调用到函数驱动 2020-09-08
2 LLM:关注因果推断研究进展 2023-06-22
3 LLM:人机协作 2024-05-19
4 LLM:分层管理风险定性 2024-08-08
5 LLM:FN分层分析与提升空间测算(1) 2024-09-12
6 LLM:FN分层分析与提升空间测算(2) 2024-09-12
7 LLM:FN分层分析与提升空间测算(3) 2024-09-12
8 LLM:FN分层分析与提升空间测算(4) 2024-09-12
9 LLM:FN分层分析与提升空间测算(5) 2024-09-12
10 LLM:推理不可复现的探索 2025-06-11
11 LLM:SFT 与 RL 的关系 2025-07-29
12 LLM:SFT 与 RL 的关系(理论修正与实践补充) 2025-07-30
13 LLM:SFT 与 RL 的关系(理论修正与实践补充II) 2025-07-31
14 LLM:表格数据特征工程(1)核心方法与框架 2025-08-03
15 LLM:表格数据特征工程(2)低数据场景的决策树生成 2025-08-03
16 LLM:表格数据特征工程(3)落地冷启动 2025-08-03
17 LLM:表格数据特征工程(4)线性可分性与模型选型 2025-08-03
18 LLM:撰写大模型落地提示词的关键 2025-08-27
19 LLM:从 Prompt 设计到工作流落地 2025-08-28
20 LLM:RL's Razor 抗遗忘 2025-09-04
21 LLM:RL's Razor 抗遗忘(4)on-policy认知误区 2025-09-04
22 LLM:RL's Razor 抗遗忘(5)RL在线生成样本 2025-09-04
23 LLMRL's Razor 抗遗忘(2) 2025-09-04
24 LLMRL's Razor 抗遗忘(3)SFT 与 RL 的认知偏差及应用 2025-09-04
25 LLM:MuseGraph融合GNN与LLM的通用图挖掘新框架 2025-09-05
26 LLM:幻觉成因与解决 2025-09-08
27 LLM:Agent 逻辑与应用场景 2025-09-23
28 LLM:拆解大模型缩放定律失效的三重分解 2025-10-05
29 LLM:近似on-policy数据抗遗忘 2025-10-21
30 LLM:近似on-policy数据抗遗忘(2)Iterative-SFT 2025-10-21
31 LLM:幻觉治理 2025-10-28
32 LLM:先验偏见(1)变量名带偏判断 2025-11-13
33 LLM:先验偏见(2)分层分析应对 2025-11-13
34 LLM:先验偏见(3)实验效度的场景化适配 2025-11-13
35 LLM:分层落地 2025-11-13
36 LLM:零样本在金融场景落地 2025-11-13
37 LLM:跨难度泛化的局限与量化 2025-11-26
38 LLM:重复提示词解锁非推理性能上限 2025-12-17
39 LLM:用失败样本提升指令遵循能力 2025-12-29
40 LLM:概率引导的高价值信号筛选 2026-01-14
41 LLM:低成本安全检测的级联方案 2026-01-16
42 LLM:定性编码的假阳性解决方案 2026-01-16
43 LLM:先验偏见(4)挑战与落地解决方案 2026-01-22
44 LLM:先验偏见(5)工程化方案 2026-01-22
45 LLM:先验偏见(6)递进式优化与工程化落地 2026-01-22
46 LLM:SimRL(1)分层评估 2026-02-03
47 LLM:SimRL(2)理论逻辑与工程落地 2026-02-03
48 LLM:SimRL(3)质量评估与落地优化 2026-02-03
49 LLM:MCP vs Skills 核心差异 2026-03-22
50 LLM:OpenClaw 消息渠道配置实践 2026-03-22
51 LLM:OpenClaw 检索架构的工程实现与设计逻辑 2026-03-24
52 LLM:OpenClaw 的Memory原生架构与Agent发展方向 2026-03-24
53 LLM:Coze云端开发环境初始化与504超时问题排查 2026-03-28
54 LLM:OpenClaw 微信 ClawBot 插件配置指南 2026-03-28
55 LLM:OpenClaw 记忆系统:三级架构的正确理解 2026-03-28
56 LLM:Agent Skill与状态管控的工程化定论 2026-04-03
57 LLM:代码智能体入门核心概念界定与三大关键组件详解 2026-04-05
58 LLM:OpenClaw 一个月观察 2026-04-07
59 LLM:多模态模型规模误区与分工协作架构解析 2026-04-07
60 LLM:Claude Code 和 OpenClaw 的长会话差距 2026-04-08
61 LLM:Harness Engineering:AI Agent 的外循环工程体系 2026-04-12
62 LLM:OpenClaw Heartbeat:让Agent拥有定时任务能力 2026-04-15

一、Harness的本质定位

Harness是AI Agent系统的信息筛选层,承担从外部信息源向模型上下文窗口传递关键信息的职能。

1.1 核心类比

以厨房作业场景类比Agent信息流转:

要素 对应实体 功能描述
上下文窗口 操作桌面 空间有限,仅容纳当前任务所需信息
大语言模型 主厨 专注于桌面可见信息,执行推理与决策
外部世界 仓库 存储工具、记忆库、历史记录等海量信息
Harness 配菜工序 从仓库取货、整理、筛选,将关键信息置于桌面

模型的能力边界受限于上下文窗口,其输出质量直接取决于Harness的信息筛选效能。

1.2 三重职能

Harness的信息管理流程包含三个环节:

信息获取:对接外部工具、记忆库、知识库,检索与当前任务相关的原始信息。

信息筛选:基于任务目标识别信号(必要信息)与噪音(干扰信息),在有限空间内实现信号最大化。

信息呈现:将筛选后的信息以结构化格式组织,适配模型的输入要求。

二、核心矛盾:有限窗口与无限信息

2.1 空间约束

当前大语言模型的上下文窗口虽已达数十万token量级,但相对于外部信息总量仍属有限资源。Harness设计面临根本张力:

  • 信息不足:上下文过于精简,模型缺乏完成任务所需的必要背景
  • 信息过载:包含无关或冗余信息,形成噪音干扰,降低推理准确性

2.2 信号与噪音的权衡

Harness的核心技术挑战在于精准筛选,需在以下维度实现优化:

  • 相关性:保留与当前任务直接相关的信息,过滤历史无关内容
  • 时效性:优先采用最新状态数据,排除过期缓存
  • 准确性:纳入经校验的可靠信息,排除未经证实的内容
  • 完整性:确保关键决策所需信息无遗漏,避免信息碎片化

三、未来瓶颈:海量记忆的精准检索

3.1 记忆库的指数增长

Agent持续运行将产生多维度经验数据:

  • 会话历史与交互记录
  • 任务执行轨迹与决策路径
  • 验证有效的成功模式
  • 错误尝试与修正记录

上述记忆数据可被复制、共享与迁移,形成跨Agent的集体知识库。随着Agent规模扩展,记忆库总量呈指数级增长态势。

3.2 精准检索的技术挑战

当记忆库规模达到海量级别,Harness的核心问题从"如何筛选"演进为"如何精准检索":

准确性挑战:从海量记忆中定位与当前任务最相关的信息片段

时效性挑战:在模型可接受的等待时间内完成检索,避免延迟累积

上下文感知挑战:理解当前任务状态,预判下一步信息需求

3.3 技术演进方向

针对上述挑战,技术路线可能包括:

  • 层次化记忆架构:区分短期记忆(热数据)与长期记忆(冷数据),实现分级访问
  • 语义索引机制:基于语义相似度而非关键词匹配进行信息检索
  • 预测性信息加载:基于任务规划预判信息需求,实现预加载
  • 记忆压缩与抽象:将原始经验提炼为结构化知识表示,降低存储与检索开销

四、与Harness工程体系的关联

本文所述的信息筛选机制,与前文Harness Engineering工程体系形成层次对应关系:

本文机制 前文构件 功能关联
信息呈现 工具中介 信息筛选是工具调用的前置环节
信号筛选 可感知性 决定模型可获取的信息范围
记忆库管理 持久状态面 信息筛选依赖状态存储与检索能力
精准检索 熵控系统 避免信息过载导致的系统熵增

信息筛选机制为Harness工程体系中的"工具中介"与"可感知性"构件提供了具体实现路径。

五、结语

Harness作为Agent系统的信息筛选层,其核心使命是在有限上下文窗口与无限外部信息之间建立精准桥梁。随着Agent应用的规模化部署,海量记忆的精准检索将成为制约系统效能的关键技术瓶颈。

从工具供给到信息管家的范式演进,体现了AI系统设计的核心转向:不仅是功能提供,更强调需求理解与精准信息支持。

LLM 系列导航

1 LLM:Function Call(1)从传统工具调用到函数驱动 2020-09-08
2 LLM:关注因果推断研究进展 2023-06-22
3 LLM:人机协作 2024-05-19
4 LLM:分层管理风险定性 2024-08-08
5 LLM:FN分层分析与提升空间测算(1) 2024-09-12
6 LLM:FN分层分析与提升空间测算(2) 2024-09-12
7 LLM:FN分层分析与提升空间测算(3) 2024-09-12
8 LLM:FN分层分析与提升空间测算(4) 2024-09-12
9 LLM:FN分层分析与提升空间测算(5) 2024-09-12
10 LLM:推理不可复现的探索 2025-06-11
11 LLM:SFT 与 RL 的关系 2025-07-29
12 LLM:SFT 与 RL 的关系(理论修正与实践补充) 2025-07-30
13 LLM:SFT 与 RL 的关系(理论修正与实践补充II) 2025-07-31
14 LLM:表格数据特征工程(1)核心方法与框架 2025-08-03
15 LLM:表格数据特征工程(2)低数据场景的决策树生成 2025-08-03
16 LLM:表格数据特征工程(3)落地冷启动 2025-08-03
17 LLM:表格数据特征工程(4)线性可分性与模型选型 2025-08-03
18 LLM:撰写大模型落地提示词的关键 2025-08-27
19 LLM:从 Prompt 设计到工作流落地 2025-08-28
20 LLM:RL's Razor 抗遗忘 2025-09-04
21 LLM:RL's Razor 抗遗忘(4)on-policy认知误区 2025-09-04
22 LLM:RL's Razor 抗遗忘(5)RL在线生成样本 2025-09-04
23 LLMRL's Razor 抗遗忘(2) 2025-09-04
24 LLMRL's Razor 抗遗忘(3)SFT 与 RL 的认知偏差及应用 2025-09-04
25 LLM:MuseGraph融合GNN与LLM的通用图挖掘新框架 2025-09-05
26 LLM:幻觉成因与解决 2025-09-08
27 LLM:Agent 逻辑与应用场景 2025-09-23
28 LLM:拆解大模型缩放定律失效的三重分解 2025-10-05
29 LLM:近似on-policy数据抗遗忘 2025-10-21
30 LLM:近似on-policy数据抗遗忘(2)Iterative-SFT 2025-10-21
31 LLM:幻觉治理 2025-10-28
32 LLM:先验偏见(1)变量名带偏判断 2025-11-13
33 LLM:先验偏见(2)分层分析应对 2025-11-13
34 LLM:先验偏见(3)实验效度的场景化适配 2025-11-13
35 LLM:分层落地 2025-11-13
36 LLM:零样本在金融场景落地 2025-11-13
37 LLM:跨难度泛化的局限与量化 2025-11-26
38 LLM:重复提示词解锁非推理性能上限 2025-12-17
39 LLM:用失败样本提升指令遵循能力 2025-12-29
40 LLM:概率引导的高价值信号筛选 2026-01-14
41 LLM:低成本安全检测的级联方案 2026-01-16
42 LLM:定性编码的假阳性解决方案 2026-01-16
43 LLM:先验偏见(4)挑战与落地解决方案 2026-01-22
44 LLM:先验偏见(5)工程化方案 2026-01-22
45 LLM:先验偏见(6)递进式优化与工程化落地 2026-01-22
46 LLM:SimRL(1)分层评估 2026-02-03
47 LLM:SimRL(2)理论逻辑与工程落地 2026-02-03
48 LLM:SimRL(3)质量评估与落地优化 2026-02-03
49 LLM:MCP vs Skills 核心差异 2026-03-22
50 LLM:OpenClaw 消息渠道配置实践 2026-03-22
51 LLM:OpenClaw 检索架构的工程实现与设计逻辑 2026-03-24
52 LLM:OpenClaw 的Memory原生架构与Agent发展方向 2026-03-24
53 LLM:Coze云端开发环境初始化与504超时问题排查 2026-03-28
54 LLM:OpenClaw 微信 ClawBot 插件配置指南 2026-03-28
55 LLM:OpenClaw 记忆系统:三级架构的正确理解 2026-03-28
56 LLM:Agent Skill与状态管控的工程化定论 2026-04-03
57 LLM:代码智能体入门核心概念界定与三大关键组件详解 2026-04-05
58 LLM:OpenClaw 一个月观察 2026-04-07
59 LLM:多模态模型规模误区与分工协作架构解析 2026-04-07
60 LLM:Claude Code 和 OpenClaw 的长会话差距 2026-04-08
61 LLM:Harness Engineering:AI Agent 的外循环工程体系 2026-04-12
62 LLM:OpenClaw Heartbeat:让Agent拥有定时任务能力 2026-04-15