LLM：FN分层分析与提升空间测算（3）

前两篇围绕二阶段FN提升空间测算，明确了分层抽样+LLM的低成本定量方案，解决了能提升多少的核心问题。而在实际模型迭代中，测算出提升空间后，更关键的是明确该开发哪些特征特征要做到什么细致程度。本文基于分类模型FN优化实践，衔接前两阶段方法论，提出通过特征分层+打扰率梯度提升构建FN难度体系，实现特征开发颗粒度与难度层级的准确适配，为模型迭代提供可落地的特征方向，填补从知增量到做落地的衔接空白。

本文思路同样参考Dunivin等人（2025）提出的两阶段自反思核心逻辑，在前文聚焦FN可修复性测算的基础上，进一步延伸至特征工程落地环节，将LLM辅助分析的场景从筛可修复样本拓展到定特征颗粒度，让两阶段方法论既覆盖定量测算，又支撑定性特征开发。

一、核心逻辑：从增量测算到难度分层，锚定特征开发方向

分类模型召回率无法达到满分，必然产生FN样本。这些FN并非单一维度的难样本，其可召回难度随打扰率调整呈现明显差异。若仅笼统开展特征开发，易出现开发的特征不解决核心难点颗粒度过粗无法覆盖高难度FN等问题。

核心解决思路是建立特征分层-打扰率梯度-难度层级的分析框架：通过互斥特征分层划分FN样本类型，以逐步提升打扰率的方式捕捉不同难度的FN，再根据难度差异匹配对应颗粒度的特征开发，让每一项特征开发都准确对接具体难度的FN，避免无的放矢。这种机制既承接了前两阶段不追求完美、聚焦实操的核心逻辑，又让特征开发有了明确的优先级和细致度标准。

二、三步构建FN难度体系，适配特征颗粒度

整套流程以现有分类模型FN为基础，无需额外搭建复杂框架，核心是通过梯度调整与分层归类，梳理出难度层级与特征需求，具体分三步推进：

1. 构建互斥特征分层，覆盖FN核心类型

先对现有FN样本进行特征拆解，搭建三个互斥的特征分层，全面覆盖FN的核心差异点，为后续难度归类提供基础维度。

三个分层互斥且无遗漏，既能避免样本重复归类导致的难度判断偏差，又能准确定位每类FN的核心特征场景，后续可针对不同分层单独开展特征开发，提升迭代针对性。

2. 梯度提升打扰率，捕捉不同难度FN

以当前模型打扰率为基准，按每次2pp的幅度逐步提升，每次提升后记录新增召回的FN样本——这类样本在低打扰率下无法被模型捕捉，其特征隐蔽性、复杂性高于上一轮FN，难度呈递增趋势。

将每次新增的FN样本，分别归入上述三个特征分层中。随着打扰率持续提升，各分层会不断纳入新的高难度FN，最终自然形成易-中-难三级难度体系：低打扰率下召回的FN为易层级，特征显性、易捕捉；中等打扰率新增FN为中层级，特征需结合少量上下文或多维度交叉判断；高打扰率新增FN为难层级，特征高度隐蔽，需细拆维度才能识别。

3. 匹配特征颗粒度，明确开发优先级

不同难度层级的FN，对应不同颗粒度的特征开发需求，结合分层场景明确开发方向与优先级：

易层级FN（低打扰率召回）：特征颗粒度可保持粗放，无需过度细拆，或调整现有特征阈值，低成本实现召回。

中层级FN（中等打扰率召回）：需适度细化特征颗粒度。

难层级FN（高打扰率召回）：需极致细拆特征颗粒度，构建多维度特征组合。

同时，按易-中-难优先级推进开发，先快速落地易层级特征优化，快速获取增量；再逐步攻克中、难层级，平衡迭代效率与召回提升效果。

三、落地要点：规避误区，聚焦实操价值

不追求打扰率无上限提升：打扰率提升需兼顾用户体验与模型效率，当新增FN均为难层级且开发成本过高时，可停止提升，明确该阶段模型召回天花板，避免资源浪费。
特征分层与难度层级动态调整：业务场景变化可能导致FN特征迁移，需定期复核特征分层合理性，调整打扰率梯度幅度，确保难度体系与实际业务适配。
借助LLM辅助特征细拆：针对难层级FN，可将样本与分层信息输入LLM，辅助拆解潜在细分特征维度，减少人工分析成本，同时保证特征拆解的全面性，贴合两阶段LLM辅助的核心逻辑。

结语

从FN提升空间测算到难度分层与特征颗粒度适配，本质是将模糊的迭代方向转化为准确的落地动作。前两阶段方法论解决了能提升多少的定量问题，本文则聚焦该怎么提升的定性落地，通过特征分层、打扰率梯度调整构建难度体系，让特征开发不再盲目。

这套思路始终延续低成本、重实操的核心，无需构建复杂模型框架，仅通过现有数据与梯度调整，就能实现特征开发与FN难度的准确匹配。对实际工作而言，这种定量测算+定性落地的闭环，远比追求完美模型更能高效推动召回率提升。

参考文献

Dunivin, Z. O., Noori, M., Frey, S., & Atkinson, C. (2025). Two-Stage LLM Self-Reflective Qualitative Coding: Mitigating False Positives in Automated Annotation. Unpublished manuscript. Stuttgart University, Stuttgart, Germany; University of California, Davis, Davis, CA, USA; University of Washington, Seattle, WA, USA.