{r setup, include=FALSE} knitr::opts_chunk$set(eval = FALSE) ## 风险成本定义
风险成本是信贷风控中的核心概念,用于量化借款用户的违约风险。针对每个用户(userid),风险成本定义为:
$$\mathrm{value}_{t} = (1-\rho) \times \mathrm{amount}$$
参数说明
- $\mathrm{value}_{t}$:用户在时间 $t$ 时刻的风险成本
- $\rho$:估算的回款率(还款概率)
- $\mathrm{amount}$:用户在时间 $t$ 时刻的逾期金额
- $1-\rho$:用户不还款的概率(违约概率)
回款率计算
回款率 $\rho$ 的计算公式为:
$$\rho = \frac{\sum(\tau \leq 5)}{\sum(\tau \leq 5) + \sum(\tau > 5) + \sum(\mathrm{default})}$$
符号定义
- $\tau \leq 5$:逾期5天以内(含未逾期)
- $\tau > 5$:逾期超过5天
- $\mathrm{default}$:完全不还款
各项含义
- $\sum(\tau \leq 5)$:整体样本中,逾期5天以内的还款金额总额
- $\sum(\tau > 5)$:整体样本中,逾期超过5天的还款金额总额\
- $\sum(\mathrm{default})$:整体样本中,完全不还款的金额总额
公式推导
将回款率公式代入风险成本公式,得到完整表达式:
$$\begin{align} \mathrm{value}_{t} & = (1-\rho) \times \mathrm{amount} \ & = \left(1 - \frac{\sum(\tau \leq 5)}{\sum(\tau \leq 5) + \sum(\tau > 5) + \sum(\mathrm{default})}\right) \times \mathrm{amount} \ & = \frac{\sum(\tau > 5) + \sum(\mathrm{default})}{\sum(\tau \leq 5) + \sum(\tau > 5) + \sum(\mathrm{default})} \times \mathrm{amount} \end{align}$$
风险敏感性分析
从公式可以看出风险成本对各因素的敏感性:
- $\sum(\tau \leq 5) \uparrow$ → 状况变好 → $\mathrm{value}_{t} \downarrow$
- $\sum(\tau > 5) \uparrow$ → 状况变差 → $\mathrm{value}_{t} \uparrow$
- $\sum(\mathrm{default}) \uparrow$ → 状况变差 → $\mathrm{value}_{t} \uparrow$
实际应用场景
时间维度
实际应用中,需要在多个时间点计算风险成本:
- 时间点:$t = 6, 12, 18, 24\ \mathrm{month}$
- 逾期标准:逾期5天和逾期30天两种标准
风险成本矩阵
最终形成用户风险成本评估表:
{r echo=FALSE, message=FALSE, warning=FALSE} library(tidyverse) tibble::tribble( ~`用户ID`, ~`逾期金额`, ~`逾期天数`, ~`6个月风险成本`, ~`12个月风险成本`, ~`18个月风险成本`, ~`24个月风险成本`, "A001", "10,000", "3", "800", "1,200", "1,500", "1,800", "A002", "15,000", "10", "3,000", "4,500", "5,200", "6,000", "A003", "8,000", "0", "200", "300", "400", "500", "A004", "20,000", "25", "8,000", "12,000", "14,000", "16,000 ) %>% knitr::kable()
风险成本组合
总共需要估算8个风险成本指标:
- 逾期标准:5天、30天
- 时间维度:6个月、12个月、18个月、24个月
处理规则:如果某个时间点尚未到达,则对应单元格留空,并记录用户首次成交时间作为参考。
概念理解
好坏分类法
将借款行为分为两类:
- 好借款:还款日延后5天内完成还款
- 坏借款:还款日延后5天以上或完全不还
因此,回款率可以理解为:
$$\rho = \frac{\text{好借款金额}}{\text{好借款金额} + \text{坏借款金额}}$$
产品维度考量
为什么需要考虑产品维度?
因为同一用户可能同时持有多个产品,不同产品的还款表现可能差异很大。例如:
- 产品A:逾期不超过5天
- 产品B:逾期超过5天
在这种情况下,回款率应该基于产品级别计算:
$$1-\rho = \frac{\text{所有产品逾期金额总和}}{\text{所有产品借款金额总和}}$$
展示时:以用户为单位汇总展示结果。
技术实现要点
数据处理规则
- 时间判断:对每个产品(
listingid)的最后还款日取最大值 - 逾期判断:基于
paymentdate - max(duedate)进行逾期分类 - 分类标准:
- 逾期 ≤ 5天:好借款
- 逾期 > 5天:坏借款
计算逻辑
这种分层计算方法能够更准确地反映用户的实际风险状况,避免因单一产品表现而误判整体风险水平。
总结
风险成本定义是信贷风控体系中的重要基础,通过量化违约概率和损失金额,为风险管理决策提供数据支持。合理的风险成本计算能够帮助金融机构更准确地评估用户信用风险,优化信贷策略。