评分卡：局部 AUC 的发展与应用

局部AUC的演进，完成了从区间评估工具到多场景实落地的发展。从1989年首次提出部分AUC（PAUC）概念，到适配类不平衡、弱监督等复杂场景，其核心价值始终围绕精准聚焦关键区间、解决实际决策痛点展开。

一、局部AUC：填补全局AUC与单一FPR点的空白

全局AUC作为ROC曲线的整体测算，对所有FPR区间赋予平等权重，无法适配存在硬性FPR约束的场景——例如临床诊断中，若FPR超过0.2会导致大量健康人误诊，此时仅需关注FPR≤0.2的区间性能，全局AUC难以反映该关键信息。单个FPR点仅能反映局部性能，而多FPR点比较会放大I类错误（即“假阳性错误”，指错误判定两种方法存在差异、实际无差异的概率）。其核心原因是：单次检验设定的显著性水平α（如0.05）是“单次检验犯I类错误的概率上限”，多次独立检验时，至少一次犯I类错误的概率会随检验次数累积升高。以临床诊断为例，若比较两种CT诊断方法在FPR=0.05、0.1、0.15、0.2四个点的TPR，每次检验α=0.05，单次I类错误概率0.05，四次检验后总I类错误概率升至1-(1-0.05)⁴≈0.185，近20%的概率误判方法差异显著，远高于设定的5%。

McClish（1989）首次建立PAUC分析框架，基于二项正态假设（无病样本X ~ N(μₓ, σₓ²)，有病样本Y ~ N(μᵧ, σᵧ²)），通过数值积分计算特定FPR区间[FP₁, FP₂]的PAUC，核心公式为：

\[\text{A} = \int_{\Phi^{-1}(\text{FP}_1)}^{\Phi^{-1}(\text{FP}_2)} \Phi(a + b \cdot v) dv\]

其中a=(μᵧ-μₓ)/σᵧ，b=σₓ/σᵧ，Φ为标准正态累积分布函数（fāi）。同时，通过微分法估计方差，公式为：

\[\text{Var}(A) = \left(\frac{\partial A}{\partial \Delta}\right)^2 \text{Var}(\hat{\Delta}) + \left(\frac{\partial A}{\partial \sigma_x^2}\right)^2 \text{Var}(\hat{\sigma_x^2}) + \left(\frac{\partial A}{\partial \sigma_y^2}\right)^2 \text{Var}(\hat{\sigma_y^2})\]

该框架支持连续/评分尺度数据及独立/依赖样本，成为区间级ROC评估的核心工具，填补了全局AUC与单一FPR点比较的空白。

二、反欺诈聚焦头部样本：与局部AUC的污染剔除逻辑一致

弱监督学习（WSL）的核心挑战在于现实中难以获取完整清洁标签，周志华（Zhou, Zhi-Hua）（2018）将其分为三类：不完整监督（半监督学习含少量标签与大量无标签数据、PU学习仅含正样本与无标签数据）、不准确监督（噪声标签学习存在标签翻转概率ηₚ/ηₙ）、不精确监督（多实例学习仅含包标签，实例无单独标签）。弱监督数据的核心痛点是标签或监督信息不可靠，污染样本多表现为高损失样本——正样本评分低、负样本评分高。Xie等人（2024）提出反向部分AUC（rpAUC），通过剔除正样本中评分最低的β比例、负样本中评分最高的α比例，保留干净样本区间，等价于“小损失技巧”，从源头上减少污染数据干扰。

反欺诈场景中，非头部未审核样本易存在标注污染——看似白样本实为未标注黑样本，导致评估失真。因此，聚焦打分头部的已审核样本进行AUC评估，与rpAUC的逻辑高度契合：两者均剔除看似某类样本、实际为另一类的污染数据，不依赖全局样本，仅聚焦可验证、低污染的区间，最终提升评估或优化结果的可靠性。

三、类不平衡+决策约束：局部AUC的核心适配场景

类不平衡与决策约束的叠加，是高价值决策场景（医疗、金融、安全）的常见问题。类不平衡指数据集中不同类别样本数量差异显著，且少数类往往更关键；决策约束指场景对FPR、TPR等指标有硬性限制，错误决策代价极高。

Jiang等人（2025）指出，全局AUC在这类场景中易偏向多数类，且无法适配指标约束。局部AUC通过精准聚焦关键区间（如FPR≤0.2、TPR≥0.8），适配决策约束的刚性要求；其实例级公式解耦成对依赖关系，降低计算复杂度，适配类不平衡数据的稀疏性，实现线性每迭代复杂度与 \(O(\epsilon^{-1/3})\) 的高效收敛，成为这类场景的最优评估与优化工具。

参考文献

Jiang, Y., Xu, Q., Shao, H., Yang, Z., Bao, S., Cao, X., & Huang, Q. (2025). Closing the approximation gap of partial AUC optimization: A tale of two formulations. IEEE Transactions on Pattern Analysis and Machine Intelligence. https://doi.org/10.1109/TPAMI.2025.3637063
McClish, D. K. (1989). Analyzing a portion of the ROC curve. Medical Decision Making, 9(3), 190-195. https://doi.org/10.1177/0272989X8900900306
Xie, Z., Liu, Y., He, H.-Y., Li, M., & Zhou, Z.-H. (2024). Weakly supervised AUC optimization: A unified partial AUC approach. IEEE Transactions on Pattern Analysis and Machine Intelligence. https://arxiv.org/abs/2305.14258
Zhou, Z.-H. (2018). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44-53. https://doi.org/10.1093/nsr/nwx106

评分卡：局部 AUC 的发展与应用

评分卡系列导航

一、局部AUC：填补全局AUC与单一FPR点的空白

二、反欺诈聚焦头部样本：与局部AUC的污染剔除逻辑一致

三、类不平衡+决策约束：局部AUC的核心适配场景

参考文献

评分卡系列导航

评分卡：局部 AUC 的发展与应用

评分卡 系列导航

一、局部AUC：填补全局AUC与单一FPR点的空白

二、反欺诈聚焦头部样本：与局部AUC的污染剔除逻辑一致

三、类不平衡+决策约束：局部AUC的核心适配场景

参考文献

评分卡 系列导航

评分卡系列导航

评分卡系列导航