统计学:均值 - 集中趋势量度

统计学

第 5 页:集中趋势量度 - 第一部分(均值)

📊 什么是集中趋势量度?

集中趋势量度是用来描述一组数据的"中心"或"中间"位置的数值。

三种主要的集中趋势量度:

📊

均值

📍

中位数

🏆

众数

📊 算术平均 - 原始数据

均值=所有数据之和除以数据个数

\(\bar{x} = \frac{\sum x_i}{n} = \frac{x_1 + x_2 + ... + x_n}{n}\)

✏️ 例子 1:

5 名学生的分数:70、85、90、75、80

\(\bar{x} = \frac{70 + 85 + 90 + 75 + 80}{5} = \frac{400}{5} = 80\)

均值:80

💡 符号:

  • \(\bar{x}\)(x 上加横线)= 样本均值
  • \(\mu\)(μ - mu)= 总体均值

⚖️ 加权平均 - 从频数表

当数据为频数表形式时,使用加权平均:

\(\bar{x} = \frac{\sum (x_i \cdot f_i)}{\sum f_i} = \frac{\sum (x_i \cdot f_i)}{n}\)

✏️ 例子 2:30 名学生的兄弟姐妹数

兄弟姐妹数 (x) 频数 (f) x · f
0 3 0 × 3 = 0
1 12 1 × 12 = 12
2 10 2 × 10 = 20
3 4 3 × 4 = 12
4 1 4 × 1 = 4
合计 n = 30 Σ(xf) = 48

\(\bar{x} = \frac{48}{30} = 1.6\)

均值:1.6 个兄弟姐妹

📊 分组数据的均值(连续)

当数据分组时,使用组中值(\(x_i\))作为代表:

\(\bar{x} = \frac{\sum (x_i \cdot f_i)}{n}\)

其中 \(x_i\) = 组中值

✏️ 例子 3:40 名学生的分数

组中值 (xᵢ) 频数 (fᵢ) xᵢ · fᵢ
50-59 54.5 4 218
60-69 64.5 8 516
70-79 74.5 12 894
80-89 84.5 10 845
90-99 94.5 6 567
合计 n = 40 3040

\(\bar{x} = \frac{3040}{40} = 76\)

均值:76

⚠️ 注意:

这是近似均值 - 我们不知道每组中的具体值,所以使用组中值作为代表。

📋 均值的性质

性质 说明 例子
加常数 每个数据加 k → 均值增加 k \(\bar{x} = 80\),加 5 → \(\bar{x}_{new} = 85\)
乘以常数 每个数据乘以 k → 均值乘以 k \(\bar{x} = 80\),乘以 2 → \(\bar{x}_{new} = 160\)
偏差之和 数据与均值之差的总和 = 0 \(\sum (x_i - \bar{x}) = 0\)
对极端值敏感 极端值会影响均值 10、10、10、100 → 均值 = 32.5

⚖️ 一般加权平均

✏️ 例子 4:计算最终分数

考试(60%):85,作业(25%):90,出勤(15%):100

\(\bar{x} = \frac{85 \times 60 + 90 \times 25 + 100 \times 15}{60 + 25 + 15}\)

\(\bar{x} = \frac{5100 + 2250 + 1500}{100} = \frac{8850}{100} = 88.5\)

最终分数:88.5

✏️ 例子 5:两个班级的均值

第一班:25 名学生,均值 78

第二班:30 名学生,均值 82

整体均值是多少?

\(\bar{x} = \frac{25 \times 78 + 30 \times 82}{25 + 30} = \frac{1950 + 2460}{55} = \frac{4410}{55} = 80.18\)

整体均值:80.18

注意:不是 (78+82)/2 = 80,因为两个班级人数不同!

💡 考试技巧

原始数据: \(\frac{\sum x}{n}\)

频数表: \(\frac{\sum xf}{n}\)

分组数据:使用组中值

📝 第 5 页总结

\(\bar{x} = \frac{\sum x_i \cdot f_i}{n}\)

分组数据中:\(x_i\) = 组中值