2 min read

信贷风控:现金贷场景的逆选择机制与建模

在信贷风控实践中,“逆选择”(Adverse Selection)是一个常被提及但定义模糊的概念。传统上,逆选择指的是由于信息不对称导致的劣币驱逐良币现象。然而在现金贷场景下,所谓的"逆选择"并非单一机制,而是三类完全不同的信号与建模问题的统称。本文将这三类机制拆解,分别阐述其特征、建模任务与干预策略,并提供一个统一的评估口径。

此外,在循环贷场景下,还存在一类特殊的建模陷阱:样本标签定义不当导致的伪正常样本问题。本文将其作为第四类机制补充,形成完整的逆选择分析框架。

一、第一类机制:需求驱动型

1.1 核心问题

这是授信前的意图识别问题,而非传统意义上的风险评分。核心任务是预测用户是否会把授信额度当作短期借贷工具使用——即授信后是否会迅速使用额度以满足即时资金需求。

1.2 特征定义与单调方向

授信前先验特征(可用于训练,无数据泄露):

特征 定义 与逾期单调方向
历史借贷余额与申请频率比 近6个月累计借贷余额 / 申请次数 正相关(比值越高,需求越强,逾期风险越高)
近30/90天外部查询次数 征信机构查询次数 正相关(查询越多,资金需求越强,逾期风险越高)
预授信额度与收入比值 系统评估的授信上限 / 月收入 正相关(比值越高,授信相对收入过高,逾期风险越高)
应用内相关页面浏览行为 访问额度管理页面的频次与时长 正相关(浏览越频繁,使用需求越强,逾期风险越高)
账单期末全额还款倾向 历史账单中全额还款的比例 负相关(倾向越强,流动性需求越弱,逾期风险越低)

授信后信号(仅用于验证,不可用于训练):

  • 授信后T0+X天内额度使用率
  • 授信后首次使用时长

1.3 建模任务与标签定义

  • 模型类型:二分类或排序模型
  • 标签定义:授信后MOB1–MOB6期间逾期率涨幅是否超过基准
  • 预测目标:短期需求倾向评分(高分 = 高需求倾向 = 高逾期风险)

1.4 干预策略

  • 限额而非拒绝:对高分用户降低授信上限,但不直接拒绝
  • 账期管控:调整可用账期,降低过度使用的便利性

二、第二类机制:行为驱动型

2.1 核心问题

这是消费偏好分类问题,预测某类消费模式是否会带来持续的现金流压力,从而影响还款能力。特定消费场景往往伴随还款意愿下降或收入结构不稳定。

2.2 特征定义与单调方向

授信前先验特征(可用于训练,无数据泄露):

特征 定义 与逾期单调方向
特定类型交易占比 目标消费类型交易金额 / 总消费金额 正相关(占比越高,现金流压力越大,逾期风险越高)
非正常时段消费比例 夜间(22:00-06:00)消费频次 / 总消费频次 正相关(比例越高,消费模式越不稳定,逾期风险越高)
高频小额消费频次 近30天内单笔低于500元的交易次数 正相关(频次越高,现金流管理越差,逾期风险越高)
历史还款与消费相关性 特定消费类型后的逾期率 / 平均逾期率 正相关(相关性越强,该消费模式风险越高)
消费波动性 消费金额的标准差 / 平均消费金额 正相关(波动性越高,收入稳定性越差,逾期风险越高)

授信后信号(仅用于验证,不可用于训练):

  • 授信后特定消费类型的交易占比变化

2.3 建模任务与标签定义

  • 模型类型:多标签分类 + 风险流失预测
  • 标签定义:是否进入特定消费模式、该模式是否伴随MOB1–MOB6期间逾期率上涨
  • 样本策略:由于高风险样本较小,需从全量交易场景中借样本训练

2.4 干预策略

  • 授信控制:对特定消费模式用户降低初始额度
  • 场景监控:识别消费行为变化,触发账期管控或降额

三、第三类机制:负债驱动型

3.1 核心问题

这并非传统意义上的逆选择,而是信用信号外溢机制:高额度让外部机构视用户为更强的信用能力,从而导致用户在外部新增负债。当总负债增速超过收入增速时,还款能力被挤占,最终导致逾期。

3.2 特征定义与单调方向

授信前先验特征(可用于训练,无数据泄露):

特征 定义 与逾期单调方向
历史负债收入比趋势 近6个月负债收入比的月度变化率 正相关(上升趋势越明显,还款压力越大,逾期风险越高)
外部查询次数趋势 近6个月外部征信查询的月度频次 正相关(上升趋势越明显,外部负债倾向越强,逾期风险越高)
历史授信后低使用模式 历史授信后30天内使用率 < 20%的比例 正相关(低使用但外部负债增加的次数越多,风险越高)
负债分散度 负债机构数量的变化 正相关(机构数增加越快,负债越分散,还款压力越大,逾期风险越高)
收入稳定性 近6个月收入的月度波动性 正相关(波动性越高,还款能力越不稳定,逾期风险越高)

授信后信号(仅用于验证,不可用于训练):

  • 授信后外部负债增量
  • 授信后外部查询次数增量

3.3 建模任务与标签定义

  • 模型类型:生存分析 / 增量预测模型
  • 预测目标:负债增长趋势与还款压力变化评分(高分 = 高负债增长倾向 = 高逾期风险)

3.4 干预策略

  • 单独识别:将此类用户单独分群,不与普通风险评分混淆
  • 贷后监控:动态监控外部负债变化,必要时降低授信
  • 差异化定价:对负债增速快的用户收紧策略

四、第四类机制:标签驱动型(伪正常样本识别)

4.1 核心问题

这是样本标签定义问题,而非风险信号识别。在循环贷场景下,存在一类特殊的高风险样本:表面无短逾、实则以贷养贷的伪正常用户。若模型标签定义不当,会导致这类样本被错误归入白样本进行训练,严重削弱模型对长周期逾期风险的识别能力。

4.2 FPD30标签定义的缺陷

传统风控模型常以 FPD30(首期还款30天逾期)作为好坏标签的划分依据。这种定义存在明显缺陷:

伪正常样本的形成机制

在循环贷场景下,用户可通过在账单到期前再次支用额度、以新贷偿还旧账单的方式,人为规避当期逾期。这类用户形成表面无短逾、实则以贷养贷的高风险伪正常样本。

标签错分的具体表现

  • 首期未逾期但从第二期及后续账期开始出现逾期恶化的用户,会被错误归入白样本
  • 模型滚动更新频率较高时,会过度拟合短期首逾表现
  • 中后期才暴露风险的用户被识别为低风险
  • 模型对长周期逾期、滚动逾期及隐性以贷养贷风险的识别能力持续弱化

4.3 全周期回溯标签逻辑

核心原则:标签逻辑与真实风险一致

对于观察周期较长、距今时间更久的训练样本,应回溯其全周期表现。若后续出现逾期行为,即便首期未逾期,也应从白样本中剔除。

标签定义调整方案

场景 原标签定义 调整后标签定义
首期未逾期但后续逾期 白样本(FPD30=0) 坏样本(全周期逾期=1)
首期逾期但后续正常 坏样本(FPD30=1) 灰样本(需结合周期长度判断)
全周期未逾期 白样本 白样本(不变)

回溯窗口设置

回溯窗口需覆盖完整的账期周期,确保能识别出滚动逾期的用户。窗口过短会导致部分伪正常样本未被剔除。

4.4 建模任务与标签定义

  • 模型类型:二分类模型
  • 标签定义:全周期是否发生逾期(而非仅首期是否逾期)
  • 预测目标:识别真实高风险用户,排除伪正常样本

4.5 干预策略

  • 样本筛选:在模型训练前执行全周期回溯,剔除伪正常样本
  • 滚动监控:定期重新评估历史样本的标签状态,及时更新
  • 标签分层:将样本分为纯白(首逾+全周期均未逾期)、灰样本(需人工复核)、坏样本(全周期逾期),分批处理

五、统一评估口径与策略融合

4.1 统一标签:MOB1–MOB6风险涨幅

为了让三类子任务可比较、可落地,统一使用授信后账龄1至账龄6(MOB1–MOB6)的风险涨幅作为最终验证标签。这一口径能确保所有模型目标对齐到同一风险衡量,避免多头目标混乱。

4.2 特征方向性检查清单

在模型训练前,需对每个特征进行单调方向验证:

验证项 方法
单变量相关性 计算特征与逾期率的Spearman相关系数
分箱分析 将特征分箱,观察逾期率随分箱的 monotonic 变化
离群值处理 检查离群值是否破坏单调性,必要时截断或Winsorize
业务合理性 单调方向需符合业务逻辑,不一致需深入分析

4.3 策略融合示意

  • 需求驱动评分 → 控制授信上限(评分越高,额度越低)
  • 行为驱动评分 → 降低场景额度或触发账期管控(评分越高,管控越严)
  • 负债驱动评分 → 降低整体授信或做贷后监控(评分越高,监控越频繁)

最终通过统一的阈值或分层策略输出授信方案,确保三类机制的影响被综合考量。

六、实践要点

  1. 模型形态需明确:每一类机制对应的模型任务类型、标签定义、特征工程方向需要提前清晰,避免后期目标漂移。
  2. 信号时序性:授信前信号与授信后信号需严格区分,授信后信号仅用于验证,不可用于训练。
  3. 单调方向验证:每个特征与逾期风险的单调方向需通过单变量分析验证,确保模型训练的方向一致性。
  4. 样本平衡:行为驱动型机制样本往往稀疏,需采用采样策略或迁移学习。
  5. 策略闭环:模型输出需转化为可落地的策略动作,并在上线后通过MOB口径进行回测验证。

七、结语

将"逆选择"拆解为四类独立机制,有助于现金贷风控从经验驱动转向数据驱动。每一类机制有其独特的信号特征与建模目标,通过明确的特征定义与单调方向验证,能提升模型的可解释性与稳定性。

样本标签定义是风控建模的基础工程——标签错了,再好的特征工程和算法优化都难以弥补。全周期回溯的标签逻辑,是循环贷场景下模型可靠性的根本保障。最终通过统一的MOB风险涨幅口径进行验证与融合,这种分层建模、统一评估的思路,能为复杂场景下的风险识别提供可落地的实践框架。