2 min read

评分卡跨产品的风险成本定义

风险成本定义

风险成本是信贷风控中的核心概念,用于量化借款用户的违约风险。针对每个用户(userid),风险成本定义为:

valuet = (1−ρ) × amount

参数说明

  • valuet:用户在时间 t 时刻的风险成本
  • ρ:估算的回款率(还款概率)
  • amount:用户在时间 t 时刻的逾期金额
  • 1 − ρ:用户不还款的概率(违约概率)

回款率计算

回款率 ρ 的计算公式为:

$$\rho = \frac{\sum(\tau \leq 5)}{\sum(\tau \leq 5) + \sum(\tau > 5) + \sum(\mathrm{default})}$$

符号定义

  • τ ≤ 5:逾期5天以内(含未逾期)
  • τ > 5:逾期超过5天
  • default:完全不还款

各项含义

  • ∑(τ≤5)整体样本中,逾期5天以内的还款金额总额
  • ∑(τ>5)整体样本中,逾期超过5天的还款金额总额
  • ∑(default)整体样本中,完全不还款的金额总额

公式推导

将回款率公式代入风险成本公式,得到完整表达式:

$$\begin{align} \mathrm{value}_{t} & = (1-\rho) \times \mathrm{amount} \\ & = \left(1 - \frac{\sum(\tau \leq 5)}{\sum(\tau \leq 5) + \sum(\tau > 5) + \sum(\mathrm{default})}\right) \times \mathrm{amount} \\ & = \frac{\sum(\tau > 5) + \sum(\mathrm{default})}{\sum(\tau \leq 5) + \sum(\tau > 5) + \sum(\mathrm{default})} \times \mathrm{amount} \end{align}$$

风险敏感性分析

从公式可以看出风险成本对各因素的敏感性:

  • ∑(τ≤5)↑ → 状况变好 → valuet
  • ∑(τ>5)↑ → 状况变差 → valuet
  • ∑(default)↑ → 状况变差 → valuet

实际应用场景

时间维度

实际应用中,需要在多个时间点计算风险成本:

  • 时间点t = 6, 12, 18, 24 month
  • 逾期标准:逾期5天和逾期30天两种标准

风险成本矩阵

最终形成用户风险成本评估表:

## Error in `library()`:
## ! there is no package called 'tidyverse'
## Error in `` tibble::tribble(~用户ID, ~逾期金额, ~逾期天数, ~`6个月风险成本`, ~`12个月风险成本`, ~`18个月风险成本`,
##     ~`24个月风险成本`, "A001", "10,000", "3", "800", "1,200", "1,500", "1,800", "A002",
##     "15,000", "10", "3,000", "4,500", "5,200", "6,000", "A003", "8,000", "0",
##     "200", "300", "400", "500", "A004", "20,000", "25", "8,000", "12,000",
##     "14,000", "16,000") %>% knitr::kable() ``:
## ! could not find function "%>%"

风险成本组合

总共需要估算8个风险成本指标:

  • 逾期标准:5天、30天
  • 时间维度:6个月、12个月、18个月、24个月

处理规则:如果某个时间点尚未到达,则对应单元格留空,并记录用户首次成交时间作为参考。

概念理解

好坏分类法

将借款行为分为两类:

  • 好借款:还款日延后5天内完成还款
  • 坏借款:还款日延后5天以上或完全不还

因此,回款率可以理解为:

$$\rho = \frac{\text{好借款金额}}{\text{好借款金额} + \text{坏借款金额}}$$

产品维度考量

为什么需要考虑产品维度?

因为同一用户可能同时持有多个产品,不同产品的还款表现可能差异很大。例如:

  • 产品A:逾期不超过5天
  • 产品B:逾期超过5天

在这种情况下,回款率应该基于产品级别计算:

$$1-\rho = \frac{\text{所有产品逾期金额总和}}{\text{所有产品借款金额总和}}$$

展示时:以用户为单位汇总展示结果。

技术实现要点

数据处理规则

  1. 时间判断:对每个产品(listingid)的最后还款日取最大值
  2. 逾期判断:基于 paymentdate - max(duedate) 进行逾期分类
  3. 分类标准
    • 逾期 ≤ 5天:好借款
    • 逾期 > 5天:坏借款

计算逻辑

这种分层计算方法能够更准确地反映用户的实际风险状况,避免因单一产品表现而误判整体风险水平。

总结

风险成本定义是信贷风控体系中的重要基础,通过量化违约概率和损失金额,为风险管理决策提供数据支持。合理的风险成本计算能够帮助金融机构更准确地评估用户信用风险,优化信贷策略。