1 min read

信贷风控:Partial Gini/局部AUC衡量尾部风险

1. 引言:全局指标的局限性

在信用评分模型中,传统评估指标如AUC(Area Under the ROC Curve)和KS统计量侧重于整体排序能力,但忽略了一个关键业务现实:高风险客群(低分尾部)的区分度才是决策核心。例如,AUC假设所有阈值同等重要,但现实中拒绝坏客户的成本远高于误拒好客户(Hand, 2009)。这种局限性催生了局部评估指标的需求,其中Partial Gini(PG,局部基尼系数) 通过聚焦高风险区间,提供了类似“局部AUC”的洞察,成为多维度评估框架的重要组成(Lessmann et al., 2015)。

2. Partial Gini(PG)的定义与计算

PG 是一种基于局部洛伦兹曲线(Partial Lorenz Curve)的指标,专门衡量评分分布中特定区间(如高风险尾部)的排序能力。其核心思想是:仅计算坏客户集中区域的基尼系数,从而评估模型在关键决策段的区分度。

  • 公式

    PG=AA+B

    其中:

    • A:局部洛伦兹曲线与对角线之间的面积(表示区间内不平等程度)
    • B:局部洛伦兹曲线下的面积
      计算时需设定阈值 b(如 b=0.4),仅考虑评分低于 b 的客户(Pundir & Seshadri, 2012)。
  • 类比局部AUC
    PG与AUC共享排序能力评估的本质,但AUC覆盖全部分布,而PG专注于高风险区间。例如,PG在评分低于0.4的客户中计算基尼系数,类似于在该区间内计算一个“局部AUC”,从而更精准地反映模型在风险最高段的性能(Lessmann et al., 2015)。

3. 为什么PG有意义?

  • 业务价值
    • 信用审批中,坏客户多集中在低分区间(如评分<0.4)。PG直接评估模型在此区域的区分度,帮助机构避免对高风险客户的误接受(Lessmann et al., 2015)。
    • 实证显示:PG与AUC的排名相关性较低(Kendall’s τ ~0.7),表明它提供独特信息,弥补了全局指标盲点(Lessmann et al., 2015)。
  • 学术渊源:PG源于经济学中的不平等测量。Pundir和Seshadri(2012)首次提出局部洛伦兹曲线和局部基尼系数,用于分析收入分布中特定群体的不平等。Lessmann等(2015)将其引入信用评分,开创了局部评估的先河。

4. 应用实例:来自大规模基准测试的证据

Lessmann等(2015)在8个真实信用数据集上测试41种分类算法,发现:

  • PG的敏感性:当模型在高风险区间表现不佳时,PG值显著下降,而AUC可能保持不变。例如,某神经网络模型AUC为0.85,但PG仅0.3,揭示其在尾部风险区分上的弱点。
  • 阈值选择的影响:设定 b=0.4 时,PG能有效捕捉80%的坏客户,但最佳阈值需根据业务成本调整(如拒绝率约束)。

5. 结论:融入多维度评估框架

PG并非要取代AUC或H-measure,而是作为多维度评估框架的关键组件。现代信用评分需同时关注:

  1. 全局排序(AUC/H-measure)
  2. 尾部风险(PG)
  3. 概率校准(Brier Score)
  4. 成本敏感度(误分类成本模拟)

这种框架确保模型不仅在统计上优异,更能驱动业务价值(Lessmann et al., 2015)。

参考文献

Lessmann, S., Baesens, B., Seow, H.-V., & Thomas, L. C. (2015). Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research. European Journal of Operational Research, 247(1), 124–136. https://doi.org/10.1016/j.ejor.2015.05.030

Pundir, S., & Seshadri, R. (2012). A novel concept of partial lorenz curve and partial gini index. International Journal of Engineering, Science and Innovative Technology, 1(1), 296–301.