统计学
第 6 页:集中趋势量度 - 第二部分(中位数与众数)
🏆 众数 (Mode)
众数 = 在数据中出现次数最多的值
符号:Mo(来自单词 Mode)
📊 离散变量的众数:
✏️ 例子 1:分数:70、85、85、90、85、70、95
70 出现 2 次
85 出现 3 次 ← 最多!
90 出现 1 次
95 出现 1 次
众数:85
💡 特殊情况:
| 情况 | 例子 | 结果 |
|---|---|---|
| 双众数 | 70、70、85、85、90 | 两个众数:70 和 85 |
| 多众数 | 70、70、85、85、90、90 | 三个众数 |
| 无众数 | 70、75、80、85、90 | 都只出现一次 - 无众数 |
📊 连续变量的众数(分组):
众数组 = 频数最高的组
| 组 | 频数 |
|---|---|
| 50-59 | 4 |
| 60-69 | 8 |
| 70-79 | 12 ← 最高 |
| 80-89 | 10 |
| 90-99 | 6 |
众数组:70-79
有时将组中值作为众数报告:74.5
📍 中位数 (Median)
中位数 = 数据从小到大排序后的中间值
符号:Me(来自单词 Median)
📊 离散数据的中位数 - n 为奇数:
✏️ 例子 2:7 个分数:65、78、82、70、90、85、75
步骤 1:从小到大排序
65、70、75、78、82、85、90
步骤 2:找出中间值
中位数的位置 = \(\frac{n+1}{2} = \frac{7+1}{2} = 4\)
位置 4 处的值是 78
中位数:78
📊 离散数据的中位数 - n 为偶数:
✏️ 例子 3:6 个分数:65、78、82、70、90、85
步骤 1:排序
65、70、78、82、85、90
步骤 2:有两个中间值
位置:\(\frac{n}{2} = 3\) 和 \(\frac{n}{2}+1 = 4\)
数值:78 和 82
步骤 3:取两者的平均
\(Me = \frac{78 + 82}{2} = 80\)
中位数:80
💡 中位数位置公式总结:
| n | 中位数的位置 |
|---|---|
| 奇数 | 位置 \(\frac{n+1}{2}\) 处的值 |
| 偶数 | 位置 \(\frac{n}{2}\) 和 \(\frac{n}{2}+1\) 的数值的平均 |
📊 频数表中的中位数
✏️ 例子 4:兄弟姐妹数(n = 30)
| 兄弟姐妹数 (x) | 频数 (f) | 累积频数 (F) |
|---|---|---|
| 0 | 3 | 3 |
| 1 | 12 | 15 ← 这里! |
| 2 | 10 | 25 |
| 3 | 4 | 29 |
| 4 | 1 | 30 |
n = 30(偶数) → 中位数的位置:15 和 16
在 F 列中查找位置 15 和 16 "落在"哪里:
F = 3(包括位置 1-3)
F = 15(包括位置 4-15) ← 位置 15 在这里
F = 25(包括位置 16-25) ← 位置 16 在这里
位置 15 → x = 1,位置 16 → x = 2
\(Me = \frac{1 + 2}{2} = 1.5\)
中位数:1.5
📊 分组数据的中位数(连续)
线性插值公式:
\(Me = L + \frac{\frac{n}{2} - F_{prev}}{f_{Me}} \cdot h\)
| 符号 | 含义 |
|---|---|
| L | 中位数所在的组的真实下限 |
| n/2 | 中位数的位置 |
| Fprev | 中位数所在的组前一组的累积频数 |
| fMe | 中位数所在的组的频数 |
| h | 组距 |
✏️ 例子 5:40 名学生的分数
| 组 | f | F |
|---|---|---|
| 50-59 | 4 | 4 |
| 60-69 | 8 | 12 |
| 70-79 ← 中位数所在的组 | 12 | 24 |
| 80-89 | 10 | 34 |
| 90-99 | 6 | 40 |
步骤 1:中位数的位置 = n/2 = 40/2 = 20
步骤 2:找出中位数所在的组
F = 12 还未到达位置 20
F = 24 已包含 → 中位数所在的组是 70-79
步骤 3:代入公式
L = 69.5,Fprev = 12,fMe = 12,h = 10
\(Me = 69.5 + \frac{20 - 12}{12} \times 10 = 69.5 + \frac{8}{12} \times 10 = 69.5 + 6.67 = 76.17\)
中位数:76.17
⚖️ 集中趋势量度的比较
| 均值 | 中位数 | 众数 | |
|---|---|---|---|
| 测量什么 | 重心 | 中间值 | 最常见的 |
| 对极端值敏感? | 是! | 否 | 否 |
| 使用于... | 对称分布 | 不对称分布 | 定性变量 |
| 唯一性? | 总是唯一 | 总是唯一 | 可以有多个 |
✏️ 极端值影响的例子:
薪水:8000、9000、10000、11000、100000
均值:27,600 $(由于极端值而偏向)
中位数:10,000 $(代表性更好)
众数:无(全都不同)
💡 考试技巧
众数:最常见的
中位数:先排序!
极端值?优先用中位数
📝 第 6 页总结
众数 = 最常见 | 中位数 = 中间值
中位数对极端值稳健,均值不是