📍 集中趋势 - 数据的"重心"在哪里?
当我们有大量数据时,我们想要一个数字来代表它们全部。有三种主要方法:
📊
平均数
各值之和除以它们的数量
受极端值影响
⚖️
中位数
排序后位于中间的值
不受极端值影响
🏆
众数
出现最频繁的值
可能有多个
🔢 工资示例
7 名员工的收入:8,000 | 9,000 | 9,000 | 10,000 | 11,000 | 12,000 | 100,000(总经理)
| 度量 | 计算 | 结果 |
|---|---|---|
| 平均数 | (8+9+9+10+11+12+100)/7 × 1000 | 22,714 $ |
| 中位数 | 第四个值(7 个中的中间值) | 10,000 $ |
| 众数 | 出现次数最多的值 | 9,000 $ |
⚠️ 请注意!
平均数(22,714)不代表任何人!7 人中有 6 人的收入低于它。
当存在极端值时 - 中位数能更好地代表"典型员工"。
💡 何时使用每种度量?
| 情况 | 推荐的度量 |
|---|---|
| 对称分布,无极端值 | 平均数 ✅ |
| 有极端值 / 非对称分布 | 中位数 ✅ |
| 分类数据(颜色、职业) | 众数 ✅ |