1 min read

学习笔记:三种平均数使用的方式 学习笔记

学习笔记 系列导航

1 Hive/Impala 学习笔记 2017-12-04
2 KS 学习笔记 2017-12-06
3 datacamp pandas DataFrames 学习笔记 2017-12-11
4 datacamp pandas Merging DataFrames 学习笔记 2017-12-13
5 Databases in Python 学习笔记 2017-12-14
6 Data Visualization with Python 学习笔记 2017-12-16
7 Exploratory data analysis in Python 学习笔记 2017-12-17
8 Statistical Thinking in Python (Part-2) 学习笔记 2017-12-18
9 list comprehensions in Python 学习笔记 2017-12-19
10 无监督学习:Unsupervised Learning in Python 学习笔记 2017-12-20
11 学习笔记:Deep Learning in Python 学习笔记 2017-12-22
12 学习笔记:Python 学习的流水笔记 2017-12-25
13 学习笔记:Network Analysis in Python Part 1 学习笔记 2017-12-27
14 学习笔记:XGBoost using Python 学习笔记 2017-12-28
15 学习笔记:Supervised Learning with scikit-learn 学习笔记 2017-12-30
16 学习笔记:Boosting理论部分 学习笔记 2018-01-02
17 学习笔记:Machine Learning with the Experts School Budgets 学习笔记 2018-01-02
18 学习笔记:犯罪心理解析 2018-01-02
19 学习笔记:决策树理论部分 学习笔记 2018-01-03
20 学习笔记:Shell 学习笔记 2018-01-04
21 学习笔记:客户价值定价 学习笔记 2018-01-04
22 学习笔记:Introduction to Git for Data Science 学习笔记 2018-01-06
23 学习笔记:线性代数 整理笔记 2018-01-08
24 学习笔记:退火算法 学习笔记 2018-01-09
25 学习笔记:Fahrenheit 911 视频笔记 2018-01-18
26 学习笔记:pandas debugging 学习笔记 2018-01-19
27 学习笔记:brilliant.org概率论导论 学习笔记 2018-01-22
28 学习笔记:Machine Learning with Tree-Based Models in R 学习笔记 2018-01-22
29 学习笔记:Building Web Applications in R with Shiny 学习笔记 2018-01-25
30 学习笔记:Inference for Numerical Data 学习笔记 2018-01-26
31 学习笔记:Support Vector Machines SVM 学习笔记 2018-01-26
32 学习笔记:Introduction to DataCamp Projects 学习笔记 2018-01-28
33 学习笔记:Working with Web Data in R 学习笔记 2018-01-28
34 学习笔记:戒律的复活 每周六更新 2018-01-29
35 学习笔记:Communicating with Data in the Tidyverse 学习笔记 2018-01-31
36 学习笔记:Kaggle R Tutorial on Machine Learning 学习笔记 2018-02-01
37 学习笔记:Kaggle Python Tutorial on Machine Learning 学习笔记 2018-02-02
38 技术:ggridges 山峦图 学习笔记 2018-02-02
39 技术:XGBoost 学习笔记 2018-02-02
40 学习笔记:圆桌派 第三季 视频笔记 2018-02-05
41 学习笔记:基础与技巧整理 2018-02-25
42 集成学习R SuperLearner包学习笔记 2018-03-04
43 学习笔记:英语学习积累:词汇、表达与语法整理 2018-04-09
44 技术:原理与应用学习笔记 2018-04-29
45 学习笔记:魏剑峰英语学习笔记:表达与语法整理 2018-05-02
46 技术:方法与实践学习笔记 2018-05-12
47 无监督学习:主成分分析(PCA)原理与实现学习笔记 2018-05-17
48 技术:特征筛选学习笔记 2018-05-29
49 学习笔记:Planet Money播客学习笔记:经济学话题解析 2018-06-05
50 基础算法系列梯度下降算法详解:原理与优化学习笔记 2018-07-11
51 技术:统计建模学习笔记 2018-07-24
52 技术:指标设计学习笔记 2018-09-20
53 技术:安装与使用基础学习笔记 2018-11-07
54 📈 ggplot 设计思路 学习笔记 2019-12-26
55 🧩 Python 函数编写学习笔记 2019-12-31
56 技术:特征工程之目标编码学习笔记 2020-01-20
57 📚 词向量 学习笔记 2020-07-04
58 主题模型:学习笔记 2020-07-04
59 学习笔记:WSJ 学习笔记 2020-10-19
60 健身:学习笔记 2025-08-19

Which “mean” to use and when? - Cross Validated 介绍了三种平均数使用的方式。 如果skew严重,建议使用中位数。 否则我们来讨论三种的方式的数学逻辑。

数学逻辑

假设我们使用xi = yi,我们计算$\bar y = \frac{1}{n}\sum y_i$,然后用 → ,这就是算数平均数。

假设我们使用log (xi) = yi,我们计算$\bar y = \frac{1}{n} \sum y_i$,然后用 → log (), 然后

$$\begin{alignat}{2} \bar x & = e^{\bar y } \\ & = e^{\frac{1}{n} \sum y_i} \\ & = e^{\frac{1}{n} \sum \log{x_i}} \\ & = (x_1 \cdots x_n)^{\frac{1}{n}} \end{alignat}$$

这就是几何平均数。 跟形象的例子,参考

假设我们使用$\frac{1}{x_i} = y_i$,我们计算$\bar y = \frac{1}{n} \sum y_i$,然后用$\bar y \to \frac{1}{\bar x})$, 然后

$$\begin{alignat}{2} \bar x & = \frac{1}{\bar y} \\ & = \frac{1}{\frac{1}{n}\sum y_i} \\ & = \frac{1}{\frac{1}{n}\sum \frac{1}{x_i}}\\ & = \frac{n}{\sum{\frac{1}{x_i}}} \end{alignat}$$

这就是调和平均数。

总结,因此我们主要假设

$$x_i \xrightarrow{f(x_i)} y_i \xrightarrow{\bar y = \frac{1}{n}\sum y_i} \bar y \xrightarrow{f^{-1}(y_i)}\bar x$$

一般来说,xi > 0,那么HM < GM < AM ( <  < )

物理逻辑

我们知道d = v × t 我们实验n次,假设每次d不变,

$$\begin{alignat}{2} d = d_i & = v_i \times t_i \\ \sum_{i=1}^n d = \sum_{i=1}^n d_i & = \sum_{i=1}^n v_i \times t_i \\ \to nd & = \sum_{i=1}^n \bar v \times t_i \\ \bar v & = \frac{nd}{\sum_{1=i}^n t_i} \\ & = \frac{n}{\sum_{1=i}^n\frac{1}{\frac{d}{t_i}}} \\ & = \frac{n}{\sum_{1=i}^n\frac{1}{v_i}} \\ \end{alignat}$$

同样地,假设时间不变, 那么推出来就是算数平均数。

学习笔记 系列导航

1 Hive/Impala 学习笔记 2017-12-04
2 KS 学习笔记 2017-12-06
3 datacamp pandas DataFrames 学习笔记 2017-12-11
4 datacamp pandas Merging DataFrames 学习笔记 2017-12-13
5 Databases in Python 学习笔记 2017-12-14
6 Data Visualization with Python 学习笔记 2017-12-16
7 Exploratory data analysis in Python 学习笔记 2017-12-17
8 Statistical Thinking in Python (Part-2) 学习笔记 2017-12-18
9 list comprehensions in Python 学习笔记 2017-12-19
10 无监督学习:Unsupervised Learning in Python 学习笔记 2017-12-20
11 学习笔记:Deep Learning in Python 学习笔记 2017-12-22
12 学习笔记:Python 学习的流水笔记 2017-12-25
13 学习笔记:Network Analysis in Python Part 1 学习笔记 2017-12-27
14 学习笔记:XGBoost using Python 学习笔记 2017-12-28
15 学习笔记:Supervised Learning with scikit-learn 学习笔记 2017-12-30
16 学习笔记:Boosting理论部分 学习笔记 2018-01-02
17 学习笔记:Machine Learning with the Experts School Budgets 学习笔记 2018-01-02
18 学习笔记:犯罪心理解析 2018-01-02
19 学习笔记:决策树理论部分 学习笔记 2018-01-03
20 学习笔记:Shell 学习笔记 2018-01-04
21 学习笔记:客户价值定价 学习笔记 2018-01-04
22 学习笔记:Introduction to Git for Data Science 学习笔记 2018-01-06
23 学习笔记:线性代数 整理笔记 2018-01-08
24 学习笔记:退火算法 学习笔记 2018-01-09
25 学习笔记:Fahrenheit 911 视频笔记 2018-01-18
26 学习笔记:pandas debugging 学习笔记 2018-01-19
27 学习笔记:brilliant.org概率论导论 学习笔记 2018-01-22
28 学习笔记:Machine Learning with Tree-Based Models in R 学习笔记 2018-01-22
29 学习笔记:Building Web Applications in R with Shiny 学习笔记 2018-01-25
30 学习笔记:Inference for Numerical Data 学习笔记 2018-01-26
31 学习笔记:Support Vector Machines SVM 学习笔记 2018-01-26
32 学习笔记:Introduction to DataCamp Projects 学习笔记 2018-01-28
33 学习笔记:Working with Web Data in R 学习笔记 2018-01-28
34 学习笔记:戒律的复活 每周六更新 2018-01-29
35 学习笔记:Communicating with Data in the Tidyverse 学习笔记 2018-01-31
36 学习笔记:Kaggle R Tutorial on Machine Learning 学习笔记 2018-02-01
37 学习笔记:Kaggle Python Tutorial on Machine Learning 学习笔记 2018-02-02
38 技术:ggridges 山峦图 学习笔记 2018-02-02
39 技术:XGBoost 学习笔记 2018-02-02
40 学习笔记:圆桌派 第三季 视频笔记 2018-02-05
41 学习笔记:基础与技巧整理 2018-02-25
42 集成学习R SuperLearner包学习笔记 2018-03-04
43 学习笔记:英语学习积累:词汇、表达与语法整理 2018-04-09
44 技术:原理与应用学习笔记 2018-04-29
45 学习笔记:魏剑峰英语学习笔记:表达与语法整理 2018-05-02
46 技术:方法与实践学习笔记 2018-05-12
47 无监督学习:主成分分析(PCA)原理与实现学习笔记 2018-05-17
48 技术:特征筛选学习笔记 2018-05-29
49 学习笔记:Planet Money播客学习笔记:经济学话题解析 2018-06-05
50 基础算法系列梯度下降算法详解:原理与优化学习笔记 2018-07-11
51 技术:统计建模学习笔记 2018-07-24
52 技术:指标设计学习笔记 2018-09-20
53 技术:安装与使用基础学习笔记 2018-11-07
54 📈 ggplot 设计思路 学习笔记 2019-12-26
55 🧩 Python 函数编写学习笔记 2019-12-31
56 技术:特征工程之目标编码学习笔记 2020-01-20
57 📚 词向量 学习笔记 2020-07-04
58 主题模型:学习笔记 2020-07-04
59 学习笔记:WSJ 学习笔记 2020-10-19
60 健身:学习笔记 2025-08-19