统计学:中位数与众数 - 集中趋势量度

统计学

第 6 页:集中趋势量度 - 第二部分(中位数与众数)

🏆 众数 (Mode)

众数 = 在数据中出现次数最多的值

符号:Mo(来自单词 Mode)

📊 离散变量的众数:

✏️ 例子 1:分数:70、85、85、90、85、70、95

70 出现 2 次

85 出现 3 次 ← 最多!

90 出现 1 次

95 出现 1 次

众数:85

💡 特殊情况:

情况 例子 结果
双众数 70、70、85、85、90 两个众数:70 和 85
多众数 70、70、85、85、90、90 三个众数
无众数 70、75、80、85、90 都只出现一次 - 无众数

📊 连续变量的众数(分组):

众数组 = 频数最高的组

频数
50-59 4
60-69 8
70-79 12 ← 最高
80-89 10
90-99 6

众数组:70-79

有时将组中值作为众数报告:74.5

📍 中位数 (Median)

中位数 = 数据从小到大排序后的中间

符号:Me(来自单词 Median)

📊 离散数据的中位数 - n 为奇数:

✏️ 例子 2:7 个分数:65、78、82、70、90、85、75

步骤 1:从小到大排序

65、70、75、78、82、85、90

步骤 2:找出中间值

中位数的位置 = \(\frac{n+1}{2} = \frac{7+1}{2} = 4\)

位置 4 处的值是 78

中位数:78

📊 离散数据的中位数 - n 为偶数:

✏️ 例子 3:6 个分数:65、78、82、70、90、85

步骤 1:排序

65、70、78、82、85、90

步骤 2:有两个中间值

位置:\(\frac{n}{2} = 3\)\(\frac{n}{2}+1 = 4\)

数值:78 和 82

步骤 3:取两者的平均

\(Me = \frac{78 + 82}{2} = 80\)

中位数:80

💡 中位数位置公式总结:

n 中位数的位置
奇数 位置 \(\frac{n+1}{2}\) 处的值
偶数 位置 \(\frac{n}{2}\)\(\frac{n}{2}+1\) 的数值的平均

📊 频数表中的中位数

✏️ 例子 4:兄弟姐妹数(n = 30)

兄弟姐妹数 (x) 频数 (f) 累积频数 (F)
0 3 3
1 12 15 ← 这里!
2 10 25
3 4 29
4 1 30

n = 30(偶数) → 中位数的位置:15 和 16

在 F 列中查找位置 15 和 16 "落在"哪里:

F = 3(包括位置 1-3)

F = 15(包括位置 4-15) ← 位置 15 在这里

F = 25(包括位置 16-25) ← 位置 16 在这里

位置 15 → x = 1,位置 16 → x = 2

\(Me = \frac{1 + 2}{2} = 1.5\)

中位数:1.5

📊 分组数据的中位数(连续)

线性插值公式:

\(Me = L + \frac{\frac{n}{2} - F_{prev}}{f_{Me}} \cdot h\)

符号 含义
L 中位数所在的组的真实下限
n/2 中位数的位置
Fprev 中位数所在的组前一组的累积频数
fMe 中位数所在的组的频数
h 组距

✏️ 例子 5:40 名学生的分数

f F
50-59 4 4
60-69 8 12
70-79 ← 中位数所在的组 12 24
80-89 10 34
90-99 6 40

步骤 1:中位数的位置 = n/2 = 40/2 = 20

步骤 2:找出中位数所在的组

F = 12 还未到达位置 20

F = 24 已包含 → 中位数所在的组是 70-79

步骤 3:代入公式

L = 69.5,Fprev = 12,fMe = 12,h = 10

\(Me = 69.5 + \frac{20 - 12}{12} \times 10 = 69.5 + \frac{8}{12} \times 10 = 69.5 + 6.67 = 76.17\)

中位数:76.17

⚖️ 集中趋势量度的比较

  均值 中位数 众数
测量什么 重心 中间值 最常见的
对极端值敏感? 是!
使用于... 对称分布 不对称分布 定性变量
唯一性? 总是唯一 总是唯一 可以有多个

✏️ 极端值影响的例子:

薪水:8000、9000、10000、11000、100000

均值:27,600 $(由于极端值而偏向)

中位数:10,000 $(代表性更好)

众数:无(全都不同)

💡 考试技巧

众数:最常见的

中位数:先排序!

极端值?优先用中位数

📝 第 6 页总结

众数 = 最常见 | 中位数 = 中间值

中位数对极端值稳健,均值不是