统计学:集中趋势 - 平均数、中位数与众数

📍 集中趋势 - 数据的"重心"在哪里?

当我们有大量数据时,我们想要一个数字来代表它们全部。有三种主要方法:

📊

平均数

各值之和除以它们的数量

受极端值影响

⚖️

中位数

排序后位于中间的值

不受极端值影响

🏆

众数

出现最频繁的值

可能有多个

🔢 工资示例

7 名员工的收入:8,000 | 9,000 | 9,000 | 10,000 | 11,000 | 12,000 | 100,000(总经理)

度量计算结果
平均数(8+9+9+10+11+12+100)/7 × 100022,714 $
中位数第四个值(7 个中的中间值)10,000 $
众数出现次数最多的值9,000 $

⚠️ 请注意!

平均数(22,714)不代表任何人!7 人中有 6 人的收入低于它。

当存在极端值时 - 中位数能更好地代表"典型员工"。

💡 何时使用每种度量?

情况推荐的度量
对称分布,无极端值平均数
有极端值 / 非对称分布中位数
分类数据(颜色、职业)众数