1 min read

通过anova检验,理解$R^2$、$R_{adj.}^2$、$F$值

term df sumsq meansq statistic p.value
class 3 236.5644 78.854810 21.73467 0
Residuals 791 2869.8003 3.628066 NA NA

首先class相当于一个分类变量,类似于回归中的xResiduals是未解释部分,类似于回归中的μ^df=3是因为这里有四类,去掉一个对照组,失去了三个自由度。 791是剩余的自由度(n-1-k)。

sumsq表示波动,236.5644是解释部分,2869.8003是未解释部分,因此,

R2=236.5644236.5644+2869.8003

其中meansq = sumsqdf。 这里的

F=78.8548103.628066

根据这个特性,

Radj.2=12869.8003791236.5644+2869.8003791+3

感觉和F值很类似啊,都是求单位自由度的波动。 因为都是考虑了波动和自由度的两个因素。