📏 离散程度 - 数据有多"分散"?
两个平均数都是 80 的班级可能完全不同!一个班所有人都在 80 左右,另一个班既有 50 也有 100。离散程度告诉我们数据离平均数有多"远"。
📊 可视化对比
A 班 - 平均数 80,标准差 = 5
75 | 77 | 79 | 80 | 81 | 83 | 85
📍 紧密聚集在平均数周围
B 班 - 平均数 80,标准差 = 15
50 | 65 | 75 | 80 | 85 | 95 | 110
📍 远远分散于平均数之外
🔢 各种度量
| 度量 | 定义 | 优点/缺点 |
|---|---|---|
| 极差 | 最大值 - 最小值 | 简单,但受极端值影响 |
| 四分位距 | Q3 - Q1 | ✅ 对极端值稳健 |
| 方差 | 偏差平方的平均数 | 单位为平方 |
| 标准差 | √方差 | ✅ 与数据相同的单位 |
🧮 方差与标准差的公式
方差(总体)
\(\sigma^2 = \frac{\sum(x_i - \mu)^2}{N}\)
方差(样本)
\(S^2 = \frac{\sum(x_i - \bar{x})^2}{n-1}\)
💡 为什么样本要用 n-1?
因为计算样本方差时,x̄ 已经"适应了"数据本身,所以方差算出来偏小。除以 n-1 修正了这一点。
🎯 标准分(Z-score)
\(Z = \frac{x - \bar{x}}{S}\)
告诉我们该值离平均数有多少个标准差。
- Z = 0 → 正好在平均数上
- Z = 1 → 高于平均数一个标准差
- Z = -2 → 低于平均数两个标准差