1 min read

欧巴要求的风险成本定义

风险成本定义为,针对每个userid,

valuet=(1ρ)×amount

其中, valuet是该用户在时间t时刻的风险成本。 ρ是估算的回款率, amount是该用户在时间t时刻的逾期金额。 1ρ表达了用户不还的概率。

ρ=(τ5)(τ5)+(τ5)+()

τ5表示逾期5天或五天以内或没有逾期。

  • (τ5)衡量整体样本中,τ5时,还款金额的总额,这是加总的概念。
  • (τ5)衡量整体样本中,τ>5)时,还款金额的总额,这是加总的概念。
  • ()衡量整体样本中,不还款金额的总额,这是加总的概念。

整合公式,

valuet=(1ρ)×amount=(1(τ5)(τ5)+(τ5)+())×amount=(τ5)+()(τ5)+(τ5)+()×amount

显然,

  • (τ5),状况变好,valuet
  • (τ5),状况变差,valuet
  • (),状况变差,valuet

使用中,

欧巴要求,t=6,12,18,24 month,站在这些时点去看,计算风险成本,上面算的是基于逾期5天看的,理论上再计算逾期30天的。


最后会形成一张表,

userid 逾期金额 逾期天数 基于6个月的风险成本 基于12个月的风险成本 基于18个月的风险成本 基于24个月的风险成本

其中逾期金额和逾期天数汇总后用来估算ρ

风险成本一共估算8个:

  • 逾期5天、逾期30天
  • 6个月、12个月、18个月、24个月

如果6个月、12个月、18个月、24个月的时间还没有发生,就写空,并且保留每个userid第一次成交的时间,形成解释。


公式理解,

实际上,我们我们将借款金额分为好和坏两种, 为了说明方便,我们一个用户的生命周期以两年为限。 在t=2的时刻,每次还款日延续5天内的还款,我们都认为是好的, 每次还款日延续5天后或者不还的,我们都认为是坏的。 因此ρ=+


还是要按照产品来看,

为什么? 因为一个人可以同时借入两种产品,一种逾期超过五天,另外一种逾期不超过5天。 1ρ=listingidlistingid

但是展示的时候,以一个userid展示结果。

因此对每个listingid的最后一次duedate取max,小于定义的nowdate, 而不是对每个useridid的最后一次duedate取max

  • 然后取每个listingid的paymentdatemax(duedate)<5属于好的listingid
  • 然后取每个listingid的paymentdatemax(duedate)<5属于不好的listingid