统计学:离散程度量度 - 极差、方差、标准差

统计学

第 7 页:离散程度量度

📊 什么是离散程度量度?

离散程度量度描述数据在中心周围的分散集中程度。

为什么这很重要?

A 组 - 集中 均值 = 80 小离散 B 组 - 分散 均值 = 80 大离散

两组数据有相同的均值,但完全不同!

1️⃣ 极差 (Range)

极差 = 最大值减去最小值

\(R = x_{max} - x_{min}\)

✏️ 例子:

分数:65、72、78、85、92

\(R = 92 - 65 = 27\)

极差:27

💡 优点和缺点:

✅ 优点

  • 计算简单
  • 容易理解

❌ 缺点

  • 对极端值敏感
  • 不考虑所有数据

📐 与均值的偏差

偏差 = 每个数据与均值的距离

\(d_i = x_i - \bar{x}\)

✏️ 例子:数据:4、6、8、10、12(均值 = 8)

xᵢ 偏差 (xᵢ - x̄)
4 4 - 8 = -4
6 6 - 8 = -2
8 8 - 8 = 0
10 10 - 8 = +2
12 12 - 8 = +4
总和 0

⚠️ 偏差之和永远等于 0!

所以它不能作为离散程度的量度...

2️⃣ 方差 (Variance)

方差 = 偏差平方的均值

(平方是为了去掉负号)

📋 方差的公式:

数据类型 公式
原始数据 \(S^2 = \frac{\sum (x_i - \bar{x})^2}{n}\)
频数表 \(S^2 = \frac{\sum f_i(x_i - \bar{x})^2}{n}\)
简化公式 \(S^2 = \frac{\sum x_i^2}{n} - \bar{x}^2\)

✏️ 例子:数据:4、6、8、10、12(均值 = 8)

xᵢ xᵢ - x̄ (xᵢ - x̄)²
4 -4 16
6 -2 4
8 0 0
10 +2 4
12 +4 16
总和 40

\(S^2 = \frac{40}{5} = 8\)

方差:8

3️⃣ 标准差 (Standard Deviation)

标准差 = 方差的平方根

(返回原始单位)

\(S = \sqrt{S^2} = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}\)

✏️ 例子的延续:

\(S = \sqrt{8} = 2.83\)

标准差:2.83

💡 标准差表示什么?

  • 标准差小 → 数据接近均值(集中)
  • 标准差大 → 数据远离均值(分散)
  • 标准差 = 0 → 所有数据相等!

✏️ 完整例子 - 从频数表

20 名学生的兄弟姐妹数:

x f x·f x - x̄ (x - x̄)² f(x - x̄)²
0 2 0 -1.5 2.25 4.5
1 8 8 -0.5 0.25 2
2 6 12 0.5 0.25 1.5
3 4 12 1.5 2.25 9
合计 20 30     17

均值: \(\bar{x} = \frac{30}{20} = 1.5\)

方差: \(S^2 = \frac{17}{20} = 0.85\)

标准差: \(S = \sqrt{0.85} = 0.92\)

📋 方差与标准差的性质

操作 对方差的影响 对标准差的影响
每个数据加 k 不变 不变
每个数据乘以 k 乘以 k² 乘以 |k|

✏️ 例子:

原始数据:均值 = 50,标准差 = 10

  • 每个数据加 20 → 均值 = 70,标准差 = 10(不变)
  • 每个数据乘以 3 → 均值 = 150,标准差 = 30(乘以 3)

💡 考试技巧

极差:max - min

方差:偏差平方的均值

标准差:方差的平方根

加法:不改变标准差

📝 第 7 页总结

极差 = max - min

\(S^2 = \frac{\sum(x-\bar{x})^2}{n}\) | \(S = \sqrt{S^2}\)