在信贷风控框架设计中,评分模型校准是风险量化的核心环节,但实操层面始终存在一个关键痛点:整体校准无法完全解决局部校准,局部还是有偏的,即客群的风险异质性问题,这也是分群策略存在的核心价值。
模型整体校准的目标,是让全量客群的评分与实际风险水平呈现稳定的对应关系,但同一评分在不同细分客群中,对应的风险往往存在显著差异。比如在全量客群中,评分800分对应的逾期率为1.2%,但在无信贷历史的年轻蓝领客群中,相同评分对应的逾期率可能达到3.5%,在高收入稳定职业客群中则可能低至0.3%。这种局部与整体的风险错配,无法通过单一的整体校准修正,只能通过分群拆分后进行针对性校准解决。这一矛盾学界尚未解决(Kleinberg, Mullainathan, & Raghavan, 2017),只有完美预测才能实现精准校准。
分群策略的落地,需要明确细分的推进边界,避免无意义的过度拆分,实操中主要遵循两项核心标准。第一是客群占比与样本量标准,细分的最终目的是为了风险管理,若某一分支客群占比过低,且没有足够的坏样本支撑风险结论,就失去了单独管理的意义。常规实操中,会以总体占比3%或5%作为阈值,若样本总量极大,即使分支占比仅1%,但坏样本量足以支撑风险说服力,也可保留细分;若样本量有限,占比接近阈值时则需终止细分。第二是风险逻辑一致性标准,细分过程中若出现风险倒序现象,就停止。比如在评分维度的细分中,若出现评分>800分的客群逾期率高于评分≤800分客群的情况,说明该维度的细分已经违背了基本的风险认知逻辑,细分结果不具备应用价值。这产生了辛普森悖论,感兴趣的可以再下探找到结构性变量。
在分群变量的选择上,实操中不会局限于单一变量,而是会结合多维度特征构建分层体系。常见的分群变量包括收入水平、行职业类型、信贷活跃度、资产状况等,这些变量能够有效区分客群的风险承载能力与还款意愿;同时会搭配多个不同维度的评分或数据指标进行剪枝,比如将A卡、B卡、第三方风控评分结合,作为细分过程中的风险校验维度,确保分群结果的稳定性。
需要注意的是,分群策略本质上是一种次优解,理想状态下若能开发出一个评分完美校准,即让同一评分在所有客群中都对应相同的风险水平,就无需进行复杂的分群与剪枝操作,直接通过评分与年化风险的映射关系即可完成风控管理。但在实际业务中,客群的风险影响因素复杂且多变,这种评分的开发难度极高,因此分群校准仍是当前解决局部风险异质性的主流方案。
从实操价值来看,分群校准的核心作用是实现差异化风控策略落地。针对不同细分客群,可基于校准后的风险水平,设置差异化的授信额度、利率定价与审批规则,比如对低风险客群放宽授信额度,对高风险客群收紧准入门槛,以此在风险可控的前提下,最大化信贷业务的收益与客群覆盖范围。当然这一做法会与算法公平性产生冲突,相关核心结论可参考Kleinberg, Mullainathan, & Raghavan(2017)的研究。
参考文献
Kleinberg, J., Mullainathan, S., & Raghavan, M. (2017). Inherent trade-offs in the fair determination of risk scores. Conference on Innovations in Theoretical Computer Science.