1 min read

LLM:OpenClaw 检索架构的工程实现与设计逻辑

LLM 系列导航

1 LLM:Function Call(1)从传统工具调用到函数驱动 2020-09-08
2 LLM:关注因果推断研究进展 2023-06-22
3 LLM:人机协作 2024-05-19
4 LLM:分层管理风险定性 2024-08-08
5 LLM:FN分层分析与提升空间测算(1) 2024-09-12
6 LLM:FN分层分析与提升空间测算(2) 2024-09-12
7 LLM:FN分层分析与提升空间测算(3) 2024-09-12
8 LLM:FN分层分析与提升空间测算(4) 2024-09-12
9 LLM:FN分层分析与提升空间测算(5) 2024-09-12
10 LLM:推理不可复现的探索 2025-06-11
11 LLM:SFT 与 RL 的关系 2025-07-29
12 LLM:SFT 与 RL 的关系(理论修正与实践补充) 2025-07-30
13 LLM:SFT 与 RL 的关系(理论修正与实践补充II) 2025-07-31
14 LLM:表格数据特征工程(1)核心方法与框架 2025-08-03
15 LLM:表格数据特征工程(2)低数据场景的决策树生成 2025-08-03
16 LLM:表格数据特征工程(3)落地冷启动 2025-08-03
17 LLM:表格数据特征工程(4)线性可分性与模型选型 2025-08-03
18 LLM:撰写大模型落地提示词的关键 2025-08-27
19 LLM:从 Prompt 设计到工作流落地 2025-08-28
20 LLM:RL's Razor 抗遗忘 2025-09-04
21 LLM:RL's Razor 抗遗忘(2) 2025-09-04
22 LLM:RL's Razor 抗遗忘(3)SFT 与 RL 的认知偏差及应用 2025-09-04
23 LLM:RL's Razor 抗遗忘(4)on-policy认知误区 2025-09-04
24 LLM:RL's Razor 抗遗忘(5)RL在线生成样本 2025-09-04
25 LLM:MuseGraph融合GNN与LLM的通用图挖掘新框架 2025-09-05
26 LLM:幻觉成因与解决 2025-09-08
27 LLM:Agent 逻辑与应用场景 2025-09-23
28 LLM:拆解大模型缩放定律失效的三重分解 2025-10-05
29 LLM:近似on-policy数据抗遗忘 2025-10-21
30 LLM:近似on-policy数据抗遗忘(2)Iterative-SFT 2025-10-21
31 LLM:幻觉治理 2025-10-28
32 LLM:先验偏见(1)变量名带偏判断 2025-11-13
33 LLM:先验偏见(2)分层分析应对 2025-11-13
34 LLM:先验偏见(3)实验效度的场景化适配 2025-11-13
35 LLM:分层落地 2025-11-13
36 LLM:零样本在金融场景落地 2025-11-13
37 LLM:跨难度泛化的局限与量化 2025-11-26
38 LLM:重复提示词解锁非推理性能上限 2025-12-17
39 LLM:用失败样本提升指令遵循能力 2025-12-29
40 LLM:概率引导的高价值信号筛选 2026-01-14
41 LLM:低成本安全检测的级联方案 2026-01-16
42 LLM:定性编码的假阳性解决方案 2026-01-16
43 LLM:先验偏见(4)挑战与落地解决方案 2026-01-22
44 LLM:先验偏见(5)工程化方案 2026-01-22
45 LLM:先验偏见(6)递进式优化与工程化落地 2026-01-22
46 LLM:SimRL(1)分层评估 2026-02-03
47 LLM:SimRL(2)理论逻辑与工程落地 2026-02-03
48 LLM:SimRL(3)质量评估与落地优化 2026-02-03
49 LLM:MCP vs Skills 核心差异 2026-03-22
50 LLM:OpenClaw 消息渠道配置实践 2026-03-22
51 LLM:OpenClaw 的Memory原生架构与Agent发展方向 2026-03-24

OpenClaw是一款开源AI智能体框架,项目核心聚焦工程落地层面的开发,未开展全新大模型的训练工作,核心能力依托对不同类型模型与检索工具的整合、调度实现。

框架核心定位

OpenClaw的设计以实际可用性为核心导向,兼容本地部署与云端调用两种模式,支持多类模型的插拔式接入。框架整合传统信息检索算法、轻量语义模型、Transformer架构大模型的能力,搭建为可直接执行复杂任务的智能体系统,开发工作的重点集中在调度逻辑搭建、多环境兼容性适配、系统降级机制设计,而非基础模型的算法创新。

检索架构的核心组件与默认配置

OpenClaw的记忆与召回模块采用混合检索架构,核心由两路并行的检索通道组成。

第一路为BM25(Okapi BM25)检索通道,该算法是信息检索领域的经典关键词匹配算法,通过对词频、逆文档频率、文档长度归一化进行加权计算,完成文档与查询语句的匹配排序。在2026.3版本的OpenClaw中,BM25检索为默认开启状态,与另一路检索通道同步执行。

第二路为向量检索通道,该通道通过嵌入模型将文本转化为高维向量,基于向量空间的距离计算,完成语义层面的内容匹配。

向量检索的默认模型配置

OpenClaw的向量检索通道,会根据实际部署环境匹配不同的默认模型。

云端部署场景下,默认接入OpenAI的模型服务,配套的默认嵌入模型为text-embedding-3-small,向量维度为1536维。

本地部署场景下,默认嵌入模型为embeddinggemma-300M-Q8_0.gguf,模型文件大小约0.6GB,支持离线运行模式,模型文件可从Hugging Face对应仓库自动下载。

混合检索架构的设计逻辑

双路并行检索的架构设计,核心目的是实现两类算法的能力互补。BM25检索在精确符号匹配场景中表现出优势,可高效完成函数名、变量名、文件路径、命令语句、ID标识等内容的召回,匹配过程为确定性逻辑,不存在生成式模型的幻觉风险。向量检索则在语义匹配场景中更具优势,可完成同义词关联、上下文匹配、用户意图对齐类的内容召回。

两路检索的结果会通过加权融合的方式完成合并,默认权重配置为向量检索0.7、BM25检索0.3,融合后的结果经过排序处理后,会输入至后续大模型模块进行进一步分析处理。

该架构同时设置了降级机制,当向量检索服务无法正常使用时,系统可自动切换至纯BM25检索模式,保障核心的检索与召回功能可用。框架也支持手动调整检索模式,可关闭其中一路检索通道,单独使用单路检索完成任务。

OpenClaw的检索架构设计,以工程落地为核心目标,通过整合经典检索算法与现代语义模型,在检索召回的有效性、系统整体的可用性、多环境的部署兼容性之间形成平衡。该设计降低了智能体系统的部署与使用门槛,也为不同业务场景的适配调整提供了灵活的操作空间。

参考文献

OpenClaw Contributors. (2026). OpenClaw: Open-source AI agent framework. GitHub. https://github.com/openclaw-dev/openclaw

LLM 系列导航

1 LLM:Function Call(1)从传统工具调用到函数驱动 2020-09-08
2 LLM:关注因果推断研究进展 2023-06-22
3 LLM:人机协作 2024-05-19
4 LLM:分层管理风险定性 2024-08-08
5 LLM:FN分层分析与提升空间测算(1) 2024-09-12
6 LLM:FN分层分析与提升空间测算(2) 2024-09-12
7 LLM:FN分层分析与提升空间测算(3) 2024-09-12
8 LLM:FN分层分析与提升空间测算(4) 2024-09-12
9 LLM:FN分层分析与提升空间测算(5) 2024-09-12
10 LLM:推理不可复现的探索 2025-06-11
11 LLM:SFT 与 RL 的关系 2025-07-29
12 LLM:SFT 与 RL 的关系(理论修正与实践补充) 2025-07-30
13 LLM:SFT 与 RL 的关系(理论修正与实践补充II) 2025-07-31
14 LLM:表格数据特征工程(1)核心方法与框架 2025-08-03
15 LLM:表格数据特征工程(2)低数据场景的决策树生成 2025-08-03
16 LLM:表格数据特征工程(3)落地冷启动 2025-08-03
17 LLM:表格数据特征工程(4)线性可分性与模型选型 2025-08-03
18 LLM:撰写大模型落地提示词的关键 2025-08-27
19 LLM:从 Prompt 设计到工作流落地 2025-08-28
20 LLM:RL's Razor 抗遗忘 2025-09-04
21 LLM:RL's Razor 抗遗忘(2) 2025-09-04
22 LLM:RL's Razor 抗遗忘(3)SFT 与 RL 的认知偏差及应用 2025-09-04
23 LLM:RL's Razor 抗遗忘(4)on-policy认知误区 2025-09-04
24 LLM:RL's Razor 抗遗忘(5)RL在线生成样本 2025-09-04
25 LLM:MuseGraph融合GNN与LLM的通用图挖掘新框架 2025-09-05
26 LLM:幻觉成因与解决 2025-09-08
27 LLM:Agent 逻辑与应用场景 2025-09-23
28 LLM:拆解大模型缩放定律失效的三重分解 2025-10-05
29 LLM:近似on-policy数据抗遗忘 2025-10-21
30 LLM:近似on-policy数据抗遗忘(2)Iterative-SFT 2025-10-21
31 LLM:幻觉治理 2025-10-28
32 LLM:先验偏见(1)变量名带偏判断 2025-11-13
33 LLM:先验偏见(2)分层分析应对 2025-11-13
34 LLM:先验偏见(3)实验效度的场景化适配 2025-11-13
35 LLM:分层落地 2025-11-13
36 LLM:零样本在金融场景落地 2025-11-13
37 LLM:跨难度泛化的局限与量化 2025-11-26
38 LLM:重复提示词解锁非推理性能上限 2025-12-17
39 LLM:用失败样本提升指令遵循能力 2025-12-29
40 LLM:概率引导的高价值信号筛选 2026-01-14
41 LLM:低成本安全检测的级联方案 2026-01-16
42 LLM:定性编码的假阳性解决方案 2026-01-16
43 LLM:先验偏见(4)挑战与落地解决方案 2026-01-22
44 LLM:先验偏见(5)工程化方案 2026-01-22
45 LLM:先验偏见(6)递进式优化与工程化落地 2026-01-22
46 LLM:SimRL(1)分层评估 2026-02-03
47 LLM:SimRL(2)理论逻辑与工程落地 2026-02-03
48 LLM:SimRL(3)质量评估与落地优化 2026-02-03
49 LLM:MCP vs Skills 核心差异 2026-03-22
50 LLM:OpenClaw 消息渠道配置实践 2026-03-22
51 LLM:OpenClaw 的Memory原生架构与Agent发展方向 2026-03-24