统计学:有序变量的斯皮尔曼相关系数

📊 有序变量的斯皮尔曼相关系数

斯皮尔曼相关系数(rₛ)度量两个有序变量之间单调关联的强度。

该度量基于(ranks),而不是基于原始数值。

单调关联 vs 线性关联 正向单调 rₛ = +1 负向单调 rₛ = -1 无单调关联 rₛ ≈ 0

📐 斯皮尔曼公式

rₛ = 1 − (6·Σdᵢ²) / (n·(n²−1))

其中:dᵢ = 第 i 个观测的秩差

📝 计算步骤

步骤 1:将 X 的取值从 1 到 n 排秩(Rₓ)
步骤 2:将 Y 的取值从 1 到 n 排秩(Rᵧ)
步骤 3:计算秩差:d = Rₓ − Rᵧ
步骤 4:对每个观测计算 d²
步骤 5:代入公式
示例:数学的秩与英语的秩之间是否存在关联?
 
学生 数学(Rₓ) 英语(Rᵧ) d = Rₓ−Rᵧ
A 1 2 -1 1
B 2 1 1 1
C 3 4 -1 1
D 4 3 1 1
E 5 5 0 0
Σd² 4
计算:
n = 5
rₛ = 1 − (6 × 4) / (5 × (25−1))
rₛ = 1 − 24 / 120
rₛ = 1 − 0.2 = 0.8

解释:数学与英语两个秩之间存在很强的正向关联。

🔄 同分秩(Ties)的处理

当存在相同的取值时,赋予它们平均秩:

例如:若两个取值本应得到秩 3 和秩 4,则两者都得到 (3+4)/2 = 3.5

带相同取值的示例:
X 的取值:10, 20, 20, 30, 40
 
X 的值 原始秩 最终秩
10 1 1
20 2 2.5
20 3 2.5
30 4 4
40 5 5

📊 数值的解读

rₛ 的值 方向 强度
+1 完全正向 秩完全相同
+0.7 至 +1 正向 非常强
+0.5 至 +0.7 正向
+0.3 至 +0.5 正向 中等
0 至 +0.3 正向
0 - 无单调关联
-0.3 至 0 负向
-0.5 至 -0.3 负向 中等
-0.7 至 -0.5 负向
-1 至 -0.7 负向 非常强
-1 完全负向 秩完全相反
💡 何时使用斯皮尔曼?
  • 当变量是有序变量(有顺序但间距不相等)
  • 当想要度量单调关联(不必是线性的)
  • 当存在极端值(outliers):斯皮尔曼比皮尔逊更稳健
  • 当数据不服从正态分布

OpenBook © 2025 © רוית הלפנבאום