1. 引言:全局指标的局限性
在信用评分模型中,传统评估指标如AUC(Area Under the ROC Curve)和KS统计量侧重于整体排序能力,但忽略了一个关键业务现实:高风险客群(低分尾部)的区分度才是决策核心。例如,AUC假设所有阈值同等重要,但现实中拒绝坏客户的成本远高于误拒好客户(Hand, 2009)。这种局限性催生了局部评估指标的需求,其中Partial Gini(PG,局部基尼系数) 通过聚焦高风险区间,提供了类似“局部AUC”的洞察,成为多维度评估框架的重要组成(Lessmann et al., 2015)。
2. Partial Gini(PG)的定义与计算
PG 是一种基于局部洛伦兹曲线(Partial Lorenz Curve)的指标,专门衡量评分分布中特定区间(如高风险尾部)的排序能力。其核心思想是:仅计算坏客户集中区域的基尼系数,从而评估模型在关键决策段的区分度。
公式:
其中:
- :局部洛伦兹曲线与对角线之间的面积(表示区间内不平等程度)
- :局部洛伦兹曲线下的面积
计算时需设定阈值 (如 ),仅考虑评分低于 的客户(Pundir & Seshadri, 2012)。
- :局部洛伦兹曲线与对角线之间的面积(表示区间内不平等程度)
类比局部AUC:
PG与AUC共享排序能力评估的本质,但AUC覆盖全部分布,而PG专注于高风险区间。例如,PG在评分低于0.4的客户中计算基尼系数,类似于在该区间内计算一个“局部AUC”,从而更精准地反映模型在风险最高段的性能(Lessmann et al., 2015)。
3. 为什么PG有意义?
- 业务价值:
- 信用审批中,坏客户多集中在低分区间(如评分<0.4)。PG直接评估模型在此区域的区分度,帮助机构避免对高风险客户的误接受(Lessmann et al., 2015)。
- 实证显示:PG与AUC的排名相关性较低(Kendall’s τ ~0.7),表明它提供独特信息,弥补了全局指标盲点(Lessmann et al., 2015)。
- 学术渊源:PG源于经济学中的不平等测量。Pundir和Seshadri(2012)首次提出局部洛伦兹曲线和局部基尼系数,用于分析收入分布中特定群体的不平等。Lessmann等(2015)将其引入信用评分,开创了局部评估的先河。
4. 应用实例:来自大规模基准测试的证据
Lessmann等(2015)在8个真实信用数据集上测试41种分类算法,发现:
- PG的敏感性:当模型在高风险区间表现不佳时,PG值显著下降,而AUC可能保持不变。例如,某神经网络模型AUC为0.85,但PG仅0.3,揭示其在尾部风险区分上的弱点。
- 阈值选择的影响:设定 时,PG能有效捕捉80%的坏客户,但最佳阈值需根据业务成本调整(如拒绝率约束)。
5. 结论:融入多维度评估框架
PG并非要取代AUC或H-measure,而是作为多维度评估框架的关键组件。现代信用评分需同时关注:
- 全局排序(AUC/H-measure)
- 尾部风险(PG)
- 概率校准(Brier Score)
- 成本敏感度(误分类成本模拟)
这种框架确保模型不仅在统计上优异,更能驱动业务价值(Lessmann et al., 2015)。
参考文献
Lessmann, S., Baesens, B., Seow, H.-V., & Thomas, L. C. (2015). Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research. European Journal of Operational Research, 247(1), 124–136. https://doi.org/10.1016/j.ejor.2015.05.030
Pundir, S., & Seshadri, R. (2012). A novel concept of partial lorenz curve and partial gini index. International Journal of Engineering, Science and Innovative Technology, 1(1), 296–301.