风险成本定义为,针对每个userid,
其中, 是该用户在时间时刻的风险成本。 是估算的回款率, 是该用户在时间时刻的逾期金额。 表达了用户不还的概率。
表示逾期5天或五天以内或没有逾期。
- 衡量整体样本中,时,还款金额的总额,这是加总的概念。
- 衡量整体样本中,时,还款金额的总额,这是加总的概念。
- 衡量整体样本中,不还款金额的总额,这是加总的概念。
整合公式,
显然,
- ,状况变好,。
- ,状况变差,。
- ,状况变差,。
使用中,
欧巴要求,,站在这些时点去看,计算风险成本,上面算的是基于逾期5天看的,理论上再计算逾期30天的。
最后会形成一张表,
userid | 逾期金额 | 逾期天数 | 基于6个月的风险成本 | 基于12个月的风险成本 | 基于18个月的风险成本 | 基于24个月的风险成本 |
---|---|---|---|---|---|---|
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
其中逾期金额和逾期天数汇总后用来估算。
风险成本一共估算8个:
- 逾期5天、逾期30天
- 6个月、12个月、18个月、24个月
如果6个月、12个月、18个月、24个月的时间还没有发生,就写空,并且保留每个userid第一次成交的时间,形成解释。
公式理解,
实际上,我们我们将借款金额分为好和坏两种, 为了说明方便,我们一个用户的生命周期以两年为限。 在的时刻,每次还款日延续5天内的还款,我们都认为是好的, 每次还款日延续5天后或者不还的,我们都认为是坏的。 因此
还是要按照产品来看,
为什么? 因为一个人可以同时借入两种产品,一种逾期超过五天,另外一种逾期不超过5天。
但是展示的时候,以一个userid展示结果。
因此对每个listingid的最后一次duedate取max,小于定义的nowdate, 而不是对每个useridid的最后一次duedate取max,
- 然后取每个listingid的属于好的
listingid
, - 然后取每个listingid的属于不好的
listingid
。