我们就以 “分析某辅导班是否真的提分” 为例,一步步拆解潜在结果框架,同时用因果推断:的逻辑来说明 $p$ 值的意义:
1. 先明确 “潜在结果”:每个人都有两种 “可能的成绩”
假设班里有 $n = 100$ 个学生,对于任意一个学生 $\mathrm{A}$ 来说,存在两个 “潜在成绩”:
-
事实结果 ($Y_1$):如果 $\mathrm{A}$ 报了辅导班,最终考的分数(比如 $85$ 分,这是可观测值);
-
反事实结果 ($Y_0$):如果 $\mathrm{A}$ 没报辅导班,本该考的分数(比如 $78$ 分,这是反事实值,需通过建模估计)。
我们真正关注的 “辅导班效果” 是个体处理效应 $\tau_{\mathrm{A}} = Y_1 - Y_0$(例如 $85 - 78 = 7$ 分)。但现实中每个学生只能处于一种状态(报班或不报班),因此需要通过 “可比性” 构建反事实。
2. 解决 “可比性”:排除 “非处理因素导致的差异”
简单对比报班组平均成绩 $\bar{Y}_1 = 82$ 分和没报班组平均成绩 $\bar{Y}_0 = 70$ 分,得出 “提分 $12$ 分” 的结论存在内生性问题。内生性源于混杂变量 $\mathrm{X}$(如学习态度、基础水平等),导致:
$\mathrm{E}[Y_1 - Y_0 | \mathrm{X}] \neq \mathrm{E}[Y_1 | \mathrm{X}, \mathrm{T}=1] - \mathrm{E}[Y_0 | \mathrm{X}, \mathrm{T}=0]$
其中 $\mathrm{T}$ 为处理变量($\mathrm{T}=1$ 表示报班,$\mathrm{T}=0$ 表示未报班)。
为解决该问题,需基于倾向得分匹配(PSM)实现 “条件独立性假设”:
$(Y_1, Y_0) \perp \mathrm{T} | \mathrm{X}$
具体操作是从 “没报班组” 中找到与 “报班组学生” 协变量 $\mathrm{X}$(如性别、基础分、学习时长)完全匹配的个体。例如,若报班学生 $\mathrm{A}$ 的特征向量 $\mathrm{X}{\mathrm{A}} = (70 \text{ 分基础}, 3 \text{ 小时/天})$,则寻找满足 $\mathrm{X}{\mathrm{A}’} = \mathrm{X}_{\mathrm{A}}$ 的未报班学生 $\mathrm{A}’$,用 $\mathrm{A}’$ 的成绩作为 $\mathrm{A}$ 的反事实结果。
3. 用概率论验证:差异是否 “偶然”
在因果推断:中,通过 $p$ 值检验零假设 $H_0: \mathrm{E}[Y_1 - Y_0] = 0$。假设匹配后得到两组各 $m = 50$ 人的可比样本:
-
报班组平均成绩:$\bar{Y}_1 = 83$ 分;
-
匹配后未报班组平均成绩:$\bar{Y}_0 = 76$ 分;
-
组间平均处理效应:$\hat{\tau} = \bar{Y}_1 - \bar{Y}_0 = 7$ 分。
$p$ 值定义为在零假设成立时,观测到 $\vert \bar{Y}_1 - \bar{Y}_0 \vert \geq 7$ 的概率:
$p = \mathrm{P}(\vert \bar{Y}_1 - \bar{Y}_0 \vert \geq 7 | H_0)$
若 $p = 0.03 < 0.05$,根据小概率原理拒绝零假设,认为 $7$ 分的差异具有统计学显著性,支持辅导班存在真实提分效果。
整个分析过程通过 “条件独立下的反事实替代” 控制混杂因素,并借助 $p$ 值完成因果效应的显著性检验。