"P 值的：统计学定义与本质（三）因果推断：框架

我们就以 “分析某辅导班是否真的提分” 为例，一步步拆解潜在结果框架，同时用因果推断：的逻辑来说明 $p$ 值的意义：

1. 先明确 “潜在结果”：每个人都有两种 “可能的成绩”

假设班里有 $n = 100$ 个学生，对于任意一个学生 $\mathrm{A}$ 来说，存在两个 “潜在成绩”：

事实结果 ($Y_1$)：如果 $\mathrm{A}$ 报了辅导班，最终考的分数（比如 $85$ 分，这是可观测值）；
反事实结果 ($Y_0$)：如果 $\mathrm{A}$ 没报辅导班，本该考的分数（比如 $78$ 分，这是反事实值，需通过建模估计）。

我们真正关注的 “辅导班效果” 是个体处理效应 $\tau_{\mathrm{A}} = Y_1 - Y_0$（例如 $85 - 78 = 7$ 分）。但现实中每个学生只能处于一种状态（报班或不报班），因此需要通过 “可比性” 构建反事实。

2. 解决 “可比性”：排除 “非处理因素导致的差异”

简单对比报班组平均成绩 $\bar{Y}_1 = 82$ 分和没报班组平均成绩 $\bar{Y}_0 = 70$ 分，得出 “提分 $12$ 分” 的结论存在内生性问题。内生性源于混杂变量 $\mathrm{X}$（如学习态度、基础水平等），导致：

$\mathrm{E}[Y_1 - Y_0 | \mathrm{X}] \neq \mathrm{E}[Y_1 | \mathrm{X}, \mathrm{T}=1] - \mathrm{E}[Y_0 | \mathrm{X}, \mathrm{T}=0]$

其中 $\mathrm{T}$ 为处理变量（$\mathrm{T}=1$ 表示报班，$\mathrm{T}=0$ 表示未报班）。

为解决该问题，需基于倾向得分匹配（PSM）实现 “条件独立性假设”：

$(Y_1, Y_0) \perp \mathrm{T} | \mathrm{X}$

具体操作是从 “没报班组” 中找到与 “报班组学生” 协变量 $\mathrm{X}$（如性别、基础分、学习时长）完全匹配的个体。例如，若报班学生 $\mathrm{A}$ 的特征向量 $\mathrm{X}{\mathrm{A}} = (70 \text{ 分基础}, 3 \text{ 小时/天})$，则寻找满足 $\mathrm{X}{\mathrm{A}’} = \mathrm{X}_{\mathrm{A}}$ 的未报班学生 $\mathrm{A}’$，用 $\mathrm{A}’$ 的成绩作为 $\mathrm{A}$ 的反事实结果。

3. 用概率论验证：差异是否 “偶然”

在因果推断：中，通过 $p$ 值检验零假设 $H_0: \mathrm{E}[Y_1 - Y_0] = 0$。假设匹配后得到两组各 $m = 50$ 人的可比样本：

报班组平均成绩：$\bar{Y}_1 = 83$ 分；
匹配后未报班组平均成绩：$\bar{Y}_0 = 76$ 分；
组间平均处理效应：$\hat{\tau} = \bar{Y}_1 - \bar{Y}_0 = 7$ 分。

$p$ 值定义为在零假设成立时，观测到 $\vert \bar{Y}_1 - \bar{Y}_0 \vert \geq 7$ 的概率：

$p = \mathrm{P}(\vert \bar{Y}_1 - \bar{Y}_0 \vert \geq 7 | H_0)$

若 $p = 0.03 < 0.05$，根据小概率原理拒绝零假设，认为 $7$ 分的差异具有统计学显著性，支持辅导班存在真实提分效果。

整个分析过程通过 “条件独立下的反事实替代” 控制混杂因素，并借助 $p$ 值完成因果效应的显著性检验。