统计学
第 7 页:离散程度量度
📊 什么是离散程度量度?
离散程度量度描述数据在中心周围的分散或集中程度。
为什么这很重要?
两组数据有相同的均值,但完全不同!
1️⃣ 极差 (Range)
极差 = 最大值减去最小值
\(R = x_{max} - x_{min}\)
✏️ 例子:
分数:65、72、78、85、92
\(R = 92 - 65 = 27\)
极差:27
💡 优点和缺点:
|
✅ 优点
|
❌ 缺点
|
📐 与均值的偏差
偏差 = 每个数据与均值的距离
\(d_i = x_i - \bar{x}\)
✏️ 例子:数据:4、6、8、10、12(均值 = 8)
| xᵢ | 偏差 (xᵢ - x̄) |
|---|---|
| 4 | 4 - 8 = -4 |
| 6 | 6 - 8 = -2 |
| 8 | 8 - 8 = 0 |
| 10 | 10 - 8 = +2 |
| 12 | 12 - 8 = +4 |
| 总和 | 0 |
⚠️ 偏差之和永远等于 0!
所以它不能作为离散程度的量度...
2️⃣ 方差 (Variance)
方差 = 偏差平方的均值
(平方是为了去掉负号)
📋 方差的公式:
| 数据类型 | 公式 |
|---|---|
| 原始数据 | \(S^2 = \frac{\sum (x_i - \bar{x})^2}{n}\) |
| 频数表 | \(S^2 = \frac{\sum f_i(x_i - \bar{x})^2}{n}\) |
| 简化公式 | \(S^2 = \frac{\sum x_i^2}{n} - \bar{x}^2\) |
✏️ 例子:数据:4、6、8、10、12(均值 = 8)
| xᵢ | xᵢ - x̄ | (xᵢ - x̄)² |
|---|---|---|
| 4 | -4 | 16 |
| 6 | -2 | 4 |
| 8 | 0 | 0 |
| 10 | +2 | 4 |
| 12 | +4 | 16 |
| 总和 | 40 | |
\(S^2 = \frac{40}{5} = 8\)
方差:8
3️⃣ 标准差 (Standard Deviation)
标准差 = 方差的平方根
(返回原始单位)
\(S = \sqrt{S^2} = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n}}\)
✏️ 例子的延续:
\(S = \sqrt{8} = 2.83\)
标准差:2.83
💡 标准差表示什么?
- 标准差小 → 数据接近均值(集中)
- 标准差大 → 数据远离均值(分散)
- 标准差 = 0 → 所有数据相等!
✏️ 完整例子 - 从频数表
20 名学生的兄弟姐妹数:
| x | f | x·f | x - x̄ | (x - x̄)² | f(x - x̄)² |
|---|---|---|---|---|---|
| 0 | 2 | 0 | -1.5 | 2.25 | 4.5 |
| 1 | 8 | 8 | -0.5 | 0.25 | 2 |
| 2 | 6 | 12 | 0.5 | 0.25 | 1.5 |
| 3 | 4 | 12 | 1.5 | 2.25 | 9 |
| 合计 | 20 | 30 | 17 |
均值: \(\bar{x} = \frac{30}{20} = 1.5\)
方差: \(S^2 = \frac{17}{20} = 0.85\)
标准差: \(S = \sqrt{0.85} = 0.92\)
📋 方差与标准差的性质
| 操作 | 对方差的影响 | 对标准差的影响 |
|---|---|---|
| 每个数据加 k | 不变 | 不变 |
| 每个数据乘以 k | 乘以 k² | 乘以 |k| |
✏️ 例子:
原始数据:均值 = 50,标准差 = 10
- 每个数据加 20 → 均值 = 70,标准差 = 10(不变)
- 每个数据乘以 3 → 均值 = 150,标准差 = 30(乘以 3)
💡 考试技巧
极差:max - min
方差:偏差平方的均值
标准差:方差的平方根
加法:不改变标准差
📝 第 7 页总结
极差 = max - min
\(S^2 = \frac{\sum(x-\bar{x})^2}{n}\) | \(S = \sqrt{S^2}\)