统计学:离散程度 - 极差、方差与标准差

📏 离散程度 - 数据有多"分散"?

两个平均数都是 80 的班级可能完全不同!一个班所有人都在 80 左右,另一个班既有 50 也有 100。离散程度告诉我们数据离平均数有多"远"

📊 可视化对比

A 班 - 平均数 80,标准差 = 5

75 | 77 | 79 | 80 | 81 | 83 | 85

📍 紧密聚集在平均数周围

B 班 - 平均数 80,标准差 = 15

50 | 65 | 75 | 80 | 85 | 95 | 110

📍 远远分散于平均数之外

🔢 各种度量

度量定义优点/缺点
极差最大值 - 最小值简单,但受极端值影响
四分位距Q3 - Q1✅ 对极端值稳健
方差偏差平方的平均数单位为平方
标准差√方差✅ 与数据相同的单位

🧮 方差与标准差的公式

方差(总体)

\(\sigma^2 = \frac{\sum(x_i - \mu)^2}{N}\)

方差(样本)

\(S^2 = \frac{\sum(x_i - \bar{x})^2}{n-1}\)

💡 为什么样本要用 n-1?

因为计算样本方差时,x̄ 已经"适应了"数据本身,所以方差算出来偏小。除以 n-1 修正了这一点。

🎯 标准分(Z-score)

\(Z = \frac{x - \bar{x}}{S}\)

告诉我们该值离平均数有多少个标准差

  • Z = 0 → 正好在平均数上
  • Z = 1 → 高于平均数一个标准差
  • Z = -2 → 低于平均数两个标准差