Which “mean” to use and when? - Cross Validated 介绍了三种平均数使用的方式。 如果skew严重,建议使用中位数。 否则我们来讨论三种的方式的数学逻辑。
数学逻辑
假设我们使用\(x_i = y_i\),我们计算\(\bar y = \frac{1}{n}\sum y_i\),然后用\(\bar y \to \bar x\),这就是算数平均数。
假设我们使用\(\log(x_i) = y_i\),我们计算\(\bar y = \frac{1}{n} \sum y_i\),然后用\(\bar y \to \log(\bar x)\), 然后
\[\begin{alignat}{2} \bar x & = e^{\bar y } \\ & = e^{\frac{1}{n} \sum y_i} \\ & = e^{\frac{1}{n} \sum \log{x_i}} \\ & = (x_1 \cdots x_n)^{\frac{1}{n}} \end{alignat}\]
这就是几何平均数。 跟形象的例子,参考
假设我们使用\(\frac{1}{x_i} = y_i\),我们计算\(\bar y = \frac{1}{n} \sum y_i\),然后用\(\bar y \to \frac{1}{\bar x})\), 然后
\[\begin{alignat}{2} \bar x & = \frac{1}{\bar y} \\ & = \frac{1}{\frac{1}{n}\sum y_i} \\ & = \frac{1}{\frac{1}{n}\sum \frac{1}{x_i}}\\ & = \frac{n}{\sum{\frac{1}{x_i}}} \end{alignat}\]
这就是调和平均数。
总结,因此我们主要假设
\[x_i \xrightarrow{f(x_i)} y_i \xrightarrow{\bar y = \frac{1}{n}\sum y_i} \bar y \xrightarrow{f^{-1}(y_i)}\bar x\]
一般来说,\(\forall x_i > 0\),那么\(HM < GM < AM\) (\(调和 < 几何 < 算数\))
物理逻辑
我们知道\(d = v \times t\) 我们实验n次,假设每次d不变,
\[\begin{alignat}{2} d = d_i & = v_i \times t_i \\ \sum_{i=1}^n d = \sum_{i=1}^n d_i & = \sum_{i=1}^n v_i \times t_i \\ \to nd & = \sum_{i=1}^n \bar v \times t_i \\ \bar v & = \frac{nd}{\sum_{1=i}^n t_i} \\ & = \frac{n}{\sum_{1=i}^n\frac{1}{\frac{d}{t_i}}} \\ & = \frac{n}{\sum_{1=i}^n\frac{1}{v_i}} \\ \end{alignat}\]
同样地,假设时间不变, 那么推出来就是算数平均数。