从传统信贷的经验决策到因果推断,实验中存在数据偏差的问题。比如给结清用户降价后,复借发起率确实提升,但发起用户中提前结清(高流失)和逾期比例的对比,计算是存在偏差的。问题核心在于,直接对比实验组与对照组的发起人群,会陷入中介效应带来的暴露非随机问题——这正是因果推断中常见问题之一。
一、实验场景与中介效应理论
复借实验契合 Baron and Kenny 定义的间接效应框架,即“曝光→中介变量→结果”。明确各环节的理论对应,是规避偏差的基础。
自变量(曝光)是是否给予用户降价优惠:实验组为曝光组(享受降价),对照组为未曝光组(无降价)。实验初期通过倾向得分匹配(PSM)/随机实验保证两组用户特征均衡,这符合Stuart (2021) 提出的“曝光随机分配”前提。
中介变量是用户是否发起复借:它是连接降价优惠与后续还款行为的关键路径,也是间接效应的核心载体。Celli (2022) 强调,中介变量与曝光、结果的关系都可能存在混杂,这正是我们实验的核心隐患。
因变量(结果)是复借发起用户的后续行为:包括提前结清、逾期和正常还款三类。这里必须遵循“曝光→中介→结果”的时间顺序,否则整个分析会失去意义(Stuart, 2021)。
二、偏差根源:三个层面的混淆问题
纠结发起人群对比是否靠谱,本质是实验设计违背了中介分析的时间顺序与可忽略性(控制混杂)两大前提,具体体现在三方面,与Celli (2022) 指出的中介分析混杂控制不足一致。
1. 中介变量的选择偏差:破坏曝光随机的传导性
PSM仅保证了降价曝光的初始随机,但复借发起是用户自主选择的结果,并非随机分配,这直接导致两组发起人群的基线特征失衡。
实验组发起用户包含两类人:一是有刚性资金需求、受降价激励的真实需求用户;二是无刚性需求、仅因优惠参与的机会主义用户——这类用户本身就倾向提前结清,与降价无关。而对照组发起用户,几乎都是无优惠仍主动复借的强刚性需求用户,还款意愿和稳定性天然更强。
此时直接对比两组发起人群的指标,差异并非来自降价,而是来自人群先天特征差异,这正是中介变量-结果关系存在未控制混淆的典型表现(Stuart, 2021)。
2. 时间顺序的破坏:忽略非发起人群的价值
Baron and Kenny 强调,中介分析需完整考虑曝光对中介的影响。若仅聚焦发起人群,会隐性排除未发起人群的信息,导致无法区分降价的两个核心效应:一是对复借发起概率的直接效应(实验目标已覆盖);二是对发起后行为的条件效应(我们关注的重点)。缺少未发起人群作为参照,第二个效应的识别就会失去锚点,偏差自然被放大。
3. 模型依赖性风险:单一分析的局限性
Baron and Kenny 的方法存在模型依赖性——改变分析模型,结果可能完全不同(Stuart, 2021)。若仅采用发起人群对比这一单一模型,等同于默认发起人群是随机的,这一假设与用户自主选择的现实不符,结论失真也就不足为奇。
三、解决方案:实现无偏识别
核心思路遵循因果中介分析(Causal mediation methods)逻辑,区别于传统中介分析,它更强调 Rubin 的潜在结果模型,通过先对齐中介变量偏差,再分析结果差异解决问题,具体分三步落地。
1. 双重PSM:控制中介变量与曝光的混淆
在初始PSM保证曝光随机的基础上,增加一轮针对是否发起复借的PSM匹配,实现发起人群的基线均衡。匹配维度需覆盖同时影响复借发起和后续还款的核心特征,比如历史提前结清次数、征信评分、近3个月资金需求、历史逾期记录等。
匹配后会得到四组均衡样本:实验组发起用户、实验组未发起用户、对照组发起用户、对照组未发起用户。这一步彻底解决了发起人群非随机的核心问题。
2. 分层差异对比:剥离降价的净效应
基于四组样本,采用因果中介分析的经典框架计算净效应,公式逻辑契合Rubin潜在结果模型:
降价净效应 = [实验组发起用户结果率 - 实验组未发起用户结果率] - [对照组发起用户结果率 - 对照组未发起用户结果率]
通过组内差异(发起vs未发起)排除用户自身特征影响,再通过组间差异(实验组vs对照组)剥离降价的真实效应,控制了中介变量-结果、曝光-中介变量的双重混淆。
3. 引入交互项:弥补交互作用考虑不足
Wen (2014) 指出,中介效应与调节效应的区别在于,前者解释机制,后者解释条件依赖性。在分析中加入“降价×复借发起”的交互项,可验证两个关键问题:降价对提前结清的影响是否仅在发起人群中显著;复借发起的筛选作用是否会放大或缩小降价效应。这一步能弥补Baron and Kenny方法忽略交互作用的缺陷。
结语
实验目标中通过PSM保证暴露随机仅解决了降价与复借发起之间的随机问题,未覆盖复借发起与后续结果的随机问题,需补充双重PSM或交互项分析。
对比提前结清或逾期率时,不能仅聚焦发起人群,需纳入未发起人群作为参照,通过组内与组间的双重差异对比实现无偏识别。
信贷实验的核心是因果中介效应而非传统中介效应,需用Rubin潜在结果模型的思路替代单一路径分析,降低模型依赖性风险。
参考文献
Celli, V. (2022). Causal mediation analysis in economics: Objectives, assumptions, models. Journal of Economic Surveys, 36, 214–234. https://doi.org/10.1111/joes.12452
Stuart, E. A., Schmid, I., Nguyen, T., Sarker, E., Pittman, A., Benke, K., Rudolph, K., Badillo-Goicoechea, E., & Leoutsakos, J.-M. (2021). Assumptions not often assessed or satisfied in published mediation analyses in psychology and psychiatry. Epidemiologic Reviews, 43(1), 48–52.
温忠麟, & 叶宝娟. (2014). 中介效应分析:方法和模型发展. 心理科学进展, 22(5), 731–745.