统计学:离散度量(离散程度)

📏 离散度量(Dispersion Measures)

离散度量描述数据围绕中心分散到何种程度。离散程度越大,数据就越多样。

离散程度比较 - 平均数相同的两组 A 组 - 离散程度小 数据:68, 70, 72, 74, 76 s = 3.16 B 组 - 离散程度大 数据:50, 60, 72, 84, 94 s = 17.89

📐 1. 极差(Range)

极差 = 最大值 − 最小值

R = x_max − x_min
示例:数据:12, 15, 18, 22, 25, 30
R = 30 − 12 = 18
⚠️ 缺点:极差只受两个极端值的影响,而不受其余数据分布的影响。

📊 2. 方差(Variance)- s²

方差度量对平均数的偏差平方的平均数
它显示数据平均而言距中心有多"远"。
样本方差:

s² = Σ(xᵢ − x̄)² / (n−1) = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)

计算步骤:

步骤 1:计算平均数 x̄
步骤 2:计算每个数值对平均数的偏差:(xᵢ − x̄)
步骤 3:把每个偏差平方:(xᵢ − x̄)²
步骤 4:把所有的平方相加:Σ(xᵢ − x̄)²
步骤 5:除以 (n−1):s² = Σ(xᵢ − x̄)² / (n−1)
完整示例:数据:2, 4, 6, 8, 10
xᵢ xᵢ − x̄ (xᵢ − x̄)²
2 6 −4 16
4 6 −2 4
6 6 0 0
8 6 +2 4
10 6 +4 16
求和 40
x̄ = (2+4+6+8+10)/5 = 30/5 = 6
s² = 40 / (5−1) = 40/4 = 10

📉 3. 标准差(Standard Deviation)- s

标准差 = √方差

s = √s² = √[Σ(xᵢ − x̄)² / (n−1)]
承接上一个示例:
s = √10 = 3.16
为什么用标准差?
• 方差以平方单位来度量(例如:米²)
• 标准差以与数据相同的单位来度量 — 更容易解释!

🔄 方差的简便公式

s² = [Σxᵢ² − (Σxᵢ)²/n] / (n−1)

或:s² = [Σxᵢ² − n·x̄²] / (n−1)
使用简便公式的示例:数据:2, 4, 6, 8, 10

Σxᵢ = 2+4+6+8+10 = 30
Σxᵢ² = 4+16+36+64+100 = 220
n = 5

s² = [220 − (30)²/5] / (5−1) = [220 − 180] / 4 = 40/4 = 10

📊 4. 变异系数(CV)

变异系数使我们能够比较单位不同或平均数不同的各组之间的离散程度。
CV = (s / x̄) × 100%
示例:比较婴儿与成人之间的体重离散程度:

婴儿: x̄ = 4 千克,s = 0.8 千克 → CV = 0.8/4 × 100 = 20%
成人: x̄ = 70 千克,s = 10 千克 → CV = 10/70 × 100 = 14.3%

结论:婴儿的相对离散程度更大!

📈 5. 线性变换

当进行线性变换 y = a + bx 时:
集中趋势度量 平均数: ȳ = a + b·x̄ 中位数: Me_y = a + b·Me_x (受 a 和 b 影响) 离散度量 标准差: s_y = |b|·s_x 方差: s²_y = b²·s²_x (只受 |b| 影响,不受 a 影响)
⚠️ 重要的记忆点:
• 加上一个常数(a)不改变离散度量
• 乘以一个常数(b)会改变 — 标准差乘以 |b|,方差乘以 b²

📋 公式总结

度量 公式 单位
极差 R = x_max − x_min 与数据相同
样本方差 s² = Σ(xᵢ−x̄)² / (n−1) 单位²
标准差 s = √s² 与数据相同
变异系数 CV = s/x̄ × 100% 百分比(无单位)
💡 考试提示:
• 如果题目要求方差 — 答案会是一个相对较大的数(以单位²计)
• 如果题目要求标准差 — 答案会是方差的平方根
• 始终检查:分母里是 n 还是 n−1?(样本 = n−1,总体 = N)

 

OpenBook © 2025 © רוית הלפנבאום