1 min read

P 值的统计学定义与本质(三)

我们就以 “分析某辅导班是否真的提分” 为例,一步步拆解潜在结果框架,同时用因果推断的逻辑来说明 \(p\) 值的意义:

1. 先明确 “潜在结果”:每个人都有两种 “可能的成绩”

假设班里有 \(n = 100\) 个学生,对于任意一个学生 \(\mathrm{A}\) 来说,存在两个 “潜在成绩”:

  • 事实结果 (\(Y_1\)):如果 \(\mathrm{A}\) 报了辅导班,最终考的分数(比如 \(85\) 分,这是可观测值);

  • 反事实结果 (\(Y_0\)):如果 \(\mathrm{A}\) 没报辅导班,本该考的分数(比如 \(78\) 分,这是反事实值,需通过建模估计)。

我们真正关注的 “辅导班效果” 是个体处理效应 \(\tau_{\mathrm{A}} = Y_1 - Y_0\)(例如 \(85 - 78 = 7\) 分)。但现实中每个学生只能处于一种状态(报班或不报班),因此需要通过 “可比性” 构建反事实。

2. 解决 “可比性”:排除 “非处理因素导致的差异”

简单对比报班组平均成绩 \(\bar{Y}_1 = 82\) 分和没报班组平均成绩 \(\bar{Y}_0 = 70\) 分,得出 “提分 \(12\) 分” 的结论存在内生性问题。内生性源于混杂变量 \(\mathrm{X}\)(如学习态度、基础水平等),导致:

\(\mathrm{E}[Y_1 - Y_0 | \mathrm{X}] \neq \mathrm{E}[Y_1 | \mathrm{X}, \mathrm{T}=1] - \mathrm{E}[Y_0 | \mathrm{X}, \mathrm{T}=0]\)

其中 \(\mathrm{T}\) 为处理变量(\(\mathrm{T}=1\) 表示报班,\(\mathrm{T}=0\) 表示未报班)。

为解决该问题,需基于倾向得分匹配(PSM)实现 “条件独立性假设”:

\((Y_1, Y_0) \perp \mathrm{T} | \mathrm{X}\)

具体操作是从 “没报班组” 中找到与 “报班组学生” 协变量 \(\mathrm{X}\)(如性别、基础分、学习时长)完全匹配的个体。例如,若报班学生 \(\mathrm{A}\) 的特征向量 \(\mathrm{X}_{\mathrm{A}} = (70 \text{ 分基础}, 3 \text{ 小时/天})\),则寻找满足 \(\mathrm{X}_{\mathrm{A}'} = \mathrm{X}_{\mathrm{A}}\) 的未报班学生 \(\mathrm{A}'\),用 \(\mathrm{A}'\) 的成绩作为 \(\mathrm{A}\) 的反事实结果。

3. 用概率论验证:差异是否 “偶然”

在因果推断中,通过 \(p\) 值检验零假设 \(H_0: \mathrm{E}[Y_1 - Y_0] = 0\)。假设匹配后得到两组各 \(m = 50\) 人的可比样本:

  • 报班组平均成绩:\(\bar{Y}_1 = 83\) 分;

  • 匹配后未报班组平均成绩:\(\bar{Y}_0 = 76\) 分;

  • 组间平均处理效应:\(\hat{\tau} = \bar{Y}_1 - \bar{Y}_0 = 7\) 分。

\(p\) 值定义为在零假设成立时,观测到 \(\vert \bar{Y}_1 - \bar{Y}_0 \vert \geq 7\) 的概率:

\(p = \mathrm{P}(\vert \bar{Y}_1 - \bar{Y}_0 \vert \geq 7 | H_0)\)

\(p = 0.03 < 0.05\),根据小概率原理拒绝零假设,认为 \(7\) 分的差异具有统计学显著性,支持辅导班存在真实提分效果。

整个分析过程通过 “条件独立下的反事实替代” 控制混杂因素,并借助 \(p\) 值完成因果效应的显著性检验。