📊 有序变量的斯皮尔曼相关系数
斯皮尔曼相关系数(rₛ)度量两个有序变量之间单调关联的强度。
该度量基于秩(ranks),而不是基于原始数值。
📐 斯皮尔曼公式
rₛ = 1 − (6·Σdᵢ²) / (n·(n²−1))
其中:dᵢ = 第 i 个观测的秩差
其中:dᵢ = 第 i 个观测的秩差
📝 计算步骤
步骤 1:将 X 的取值从 1 到 n 排秩(Rₓ)
步骤 2:将 Y 的取值从 1 到 n 排秩(Rᵧ)
步骤 3:计算秩差:d = Rₓ − Rᵧ
步骤 4:对每个观测计算 d²
步骤 5:代入公式
示例:数学的秩与英语的秩之间是否存在关联?
计算:
n = 5
rₛ = 1 − (6 × 4) / (5 × (25−1))
rₛ = 1 − 24 / 120
rₛ = 1 − 0.2 = 0.8
解释:数学与英语两个秩之间存在很强的正向关联。
| 学生 | 数学(Rₓ) | 英语(Rᵧ) | d = Rₓ−Rᵧ | d² |
|---|---|---|---|---|
| A | 1 | 2 | -1 | 1 |
| B | 2 | 1 | 1 | 1 |
| C | 3 | 4 | -1 | 1 |
| D | 4 | 3 | 1 | 1 |
| E | 5 | 5 | 0 | 0 |
| Σd² | 4 | |||
n = 5
rₛ = 1 − (6 × 4) / (5 × (25−1))
rₛ = 1 − 24 / 120
rₛ = 1 − 0.2 = 0.8
解释:数学与英语两个秩之间存在很强的正向关联。
🔄 同分秩(Ties)的处理
当存在相同的取值时,赋予它们平均秩:
例如:若两个取值本应得到秩 3 和秩 4,则两者都得到 (3+4)/2 = 3.5
带相同取值的示例:
X 的取值:10, 20, 20, 30, 40
X 的取值:10, 20, 20, 30, 40
| X 的值 | 原始秩 | 最终秩 |
|---|---|---|
| 10 | 1 | 1 |
| 20 | 2 | 2.5 |
| 20 | 3 | 2.5 |
| 30 | 4 | 4 |
| 40 | 5 | 5 |
📊 数值的解读
| rₛ 的值 | 方向 | 强度 |
|---|---|---|
| +1 | 完全正向 | 秩完全相同 |
| +0.7 至 +1 | 正向 | 非常强 |
| +0.5 至 +0.7 | 正向 | 强 |
| +0.3 至 +0.5 | 正向 | 中等 |
| 0 至 +0.3 | 正向 | 弱 |
| 0 | - | 无单调关联 |
| -0.3 至 0 | 负向 | 弱 |
| -0.5 至 -0.3 | 负向 | 中等 |
| -0.7 至 -0.5 | 负向 | 强 |
| -1 至 -0.7 | 负向 | 非常强 |
| -1 | 完全负向 | 秩完全相反 |
💡 何时使用斯皮尔曼?
- 当变量是有序变量(有顺序但间距不相等)
- 当想要度量单调关联(不必是线性的)
- 当存在极端值(outliers):斯皮尔曼比皮尔逊更稳健
- 当数据不服从正态分布
OpenBook © 2025 © רוית הלפנבאום