1 min read

p-value p值理解

事件、概率的分析

\[P(D \text{ is true}|H_0 \text{ is true}) \neq P(H_0 \text{ is true}|D \text{ is true})\]

参考石川,Harvey (2017)。 假设原假设\(H_0\)和备择假设\(H_1\),发生事件是\(D\)。 p值等于 \(H_0 \text{ is true}\)的情况下,\(D\)发生的概率。 即: \(P(D \text{ is true}|H_0 \text{ is true})\)。 并非\(P(H_0 \text{ is true}|D \text{ is true})\), 当我们观测到\(D\)发生时,\(H_0\)为真的概率。 但是这本身是我们想要的,\(D\)相当于解释变量,\(H_0\)相当于被解释变量。

两者不同,在贝叶斯公式我们就可以清楚的知道,这里举一个极端的例子。 一个人上班,设为\(H\),这个人坐电梯,设为\(D\)。 我们知道一个人因为上班\(H\)而坐电梯\(D\)的概率\(P(D \text{ is true}|H \text{ is true})\)很高,比如0.9; 但是 我们知道一个人因为坐电梯\(D\)而上班\(H\)的概率\(P(H \text{ is true}|D \text{ is true})\)就不一定那么高了,很可能是回家。 因此两者是不同的。1

再举一个例子, 我们假设一个因子\(D\)可以实现超额收益\(H_1\), 那么我们的原假设\(H_0 \text{: 因子不产生超额收益}\)

\[\text{p-value} = P(D \text{ is true}|H_0 \text{ is true})\]

\(\text{p-value}\)越小越好。 但是实际上我们想知道的是\(P(H_0 \text{ is true}|D \text{ is true})\),即因子\(D\)存在时, \(H_0 \text{ is true}\)有超额收益。2

Bayesianized p-value

\[\text{MBF (minimum Bayes factor)} = \frac{\log(\frac{1}{\text{p-value}}) \cdot \text{p-value}}{e} \sim \text{p-value} \sim P(D|H_0)\]

\[\text{prior odds} = \frac{P(H_0)}{P(H_1)} \sim P(H_0)\]

\[\text{MBF} \times \text{prior odds} \sim P(D|H_0) \cdot P(H_0) \sim P(D) \sim P(H_0|D) \to \text{我们想要的}\]

\[\text{Bayesianized p-value} = \frac{\text{MBF} \times \text{prior odds}}{1+\text{MBF} \times \text{prior odds}}\]

\(\text{prior odds}\)作为先验概率,如果很小,即\(P(H_0)\)很小,那么\(P(H_0|D)\)也应该小,\(\text{Bayesianized p-value}\)小,这样make sense。

直观理解,\(P(H_0)\)小也会影响\(\text{Bayesianized p-value}\)小,也能帮助推断。

举例:

  • 第一个例子:有一个音乐家声称可以完美的区分莫扎特和海顿的乐谱。我们将 10 张乐谱给他辨识,他全部正确。
  • 第二个例子:有一个常年喝茶的老妇人,她声称可以说出一杯加了奶的热茶中,奶是先于茶还是后于茶加入杯中的。同样,我们将 10 杯请她辨识,她全部正确。
  • 第三个例子:有一个酒馆老板,号称酒精赐予他预测未来的神力。我们让他猜扔硬币的正反面,结果他也是 10 次全对。

分别的\(H_0\)都是不能区分,但是显然

  • 第一个\(P(H_0)\)很高,因为是音乐家\(\to \text{Bayesianized p-value 高}\)
  • 第二个\(P(H_0)\)可以,因为是常年喝茶\(\to \text{Bayesianized p-value 可以}\)
  • 第三个\(P(H_0)\)不高,因为感觉像骗子\(\to \text{Bayesianized p-value 不高}\)

参考文献

Harvey, Campbell R. 2017. “Presidential Address: The Scientific Outlook in Financial Economics.” Journal of Finance 72 (4).

张五常. 2014. 张五常经济解释系列:科学说需求+收入与成本+受价与觅价+制度的选择(套装). 中信出版社.


  1. 但是我们显然更加关心第二个,因为我们能够通过坐电梯就可以推测出一个人上班的话,那么这个模型就是有解释力的,第一个虽然概率高,但是是套套逻辑。 (张五常 2014)

  2. 假设\(D\)独立地很少发生,\(\text{p-value} = P(D \text{ is true}|H_0 \text{ is true})\)很小, 但是并不意味着\(D \text{ is true}\)一旦发生,就会导致\(H_0 \text{ is true}\)很小,因此\(H_0 \text{ is true}\)很大,可能两者都小。 因此当\(D\)是个小概率事件时,无论我们得到了多低的\(\text{p-value}\),我们拒绝\(H_0\)而错误的概率\(fpr\)也是非常高的。 因此缺失值很多、偶尔出现正常值的变量,一般都显著。