统计学:线性变换 - 平均数与标准差

📐 线性变换

当对数据加上一个常数或乘以一个常数时,平均数与标准差会发生什么变化?

🎯 为什么这很重要?

线性变换是对所有数据值都进行同一种变化。例如:

  • 加上奖金:每位员工的工资都增加 $500
  • 货币转换:所有金额都从一种货币换算到另一种(乘以 3.6)
  • 温度转换:从摄氏度到华氏度:\(F = 1.8C + 32\)
  • 分数调整:老师给每位学生加 5 分

核心问题:这种变化如何影响平均数、中位数、标准差与方差?

📚 定义:什么是线性变换?

如果原始数据是 \(x_1, x_2, \ldots, x_n\)

新数据:\(y_i = a + b \cdot x_i\)

符号 含义 示例
a 所加的常数(平移) +$500 奖金,+5 分
b 所乘的常数(改变比例) ×3.6 (货币换算→), ×1.8 (摄氏度→华氏度)

💡 重要的特殊情况:

  • 如果 \(b = 1\):只是加常数 → \(y = a + x\)
  • 如果 \(a = 0\):只是乘常数 → \(y = b \cdot x\)

⭐ 核心规则:变换公式

如果 \(y = a + b \cdot x\),那么:

指标 公式 用文字表述
平均数 \(\bar{y} = a + b \cdot \bar{x}\) 同时受 a 和 b 影响
中位数 \(Me_y = a + b \cdot Me_x\) 同时受 a 和 b 影响
标准差 \(s_y = |b| \cdot s_x\) 只受 |b| 影响,不受 a 影响!
方差 \(s_y^2 = b^2 \cdot s_x^2\) 只受 b² 影响,不受 a 影响!

⚠️ 最重要的规则:

加上常数(a)不会改变离散度!

标准差与方差不受加常数的影响

🧠 为什么加常数不改变离散度?

让我们用简单的方式来思考:

想象一排站立的 5 个人。

如果所有人都向右跳 3 米 — 任意两人之间的距离都不变!

所有人都移动了相同的量,所以离散度保持不变。

平移之前:

📍2 📍5 📍8 📍11 📍14

平均数 = 8,标准差 = 4.47

所有人 +10 之后:

📍12 📍15 📍18 📍21 📍24

平均数 = 18,标准差 = 4.47

相比之下,乘以常数时 — 人与人之间的距离变大!

乘法之前:

📍2 📍5 📍8 📍11 📍14

平均数 = 8,标准差 = 4.47

所有人 ×3 之后:

📍6 📍15 📍24 📍33 📍42

平均数 = 24,标准差 = 13.42 (= 3 × 4.47)

📝 示例 1:给每个分数加 5 分

原始分数:70, 80, 90, 60, 100

变换:\(y = 5 + x\)(也就是说:\(a = 5, \; b = 1\))

指标 之前 (x) 计算 之后 (y)
平均数 80 \(5 + 1 \times 80\) 85 ✅
中位数 80 \(5 + 1 \times 80\) 85 ✅
标准差 14.14 \(|1| \times 14.14\) 14.14(未变!)
方差 200 \(1^2 \times 200\) 200(未变!)

📝 示例 2:工资货币换算(×3.6)

原始工资:2000, 3000, 4000, 5000, 6000

变换:\(y = 3.6 \cdot x\)(也就是说:\(a = 0, \; b = 3.6\))

指标 原货币 (x) 计算 换算后 (y)
平均数 $4,000 \(0 + 3.6 \times 4000\) $14,400
中位数 $4,000 \(0 + 3.6 \times 4000\) $14,400
标准差 $1,581 \(|3.6| \times 1581\) $5,692
方差 $²2,500,000 \(3.6^2 \times 2500000\) $²32,400,000

📝 示例 3:摄氏度转华氏度

摄氏温度:10°, 20°, 30°, 40°, 50°

变换:\(F = 32 + 1.8 \cdot C\)(也就是说:\(a = 32, \; b = 1.8\))

指标 摄氏 (x) 计算 华氏 (y)
平均数 30°C \(32 + 1.8 \times 30 = 32 + 54\) 86°F
标准差 15.81°C \(|1.8| \times 15.81\) 28.46°F
方差 250 °C² \(1.8^2 \times 250 = 3.24 \times 250\) 810 °F²

💡 请注意:这个 32(=a)改变了平均数,但没有改变标准差。只有 1.8(=b)改变了标准差!

📋 总结表格:什么时候改变什么?

操作 平均数 / 中位数 标准差 方差
加上常数 a
(y = a + x)
✅ 是
增加 a
❌ 否
保持不变
❌ 否
保持不变
乘以常数 b
(y = b·x)
✅ 是
乘以 b
✅ 是
乘以 |b|
✅ 是
乘以 b²
两者
(y = a + b·x)
✅ 是
a + b·平均数
✅ 是
|b|·标准差
✅ 是
b²·方差

🎓 典型考试题

题目:某班级分数的平均数是 72,标准差是 8。
老师决定进行变换:新分数 = 10 + 1.2 × 旧分数。
求新分数的平均数与标准差。

解答:

数据:\(\bar{x} = 72, \; s_x = 8, \; a = 10, \; b = 1.2\)

新平均数:
\(\bar{y} = a + b \cdot \bar{x} = 10 + 1.2 \times 72 = 10 + 86.4 = 96.4\)

新标准差:
\(s_y = |b| \cdot s_x = |1.2| \times 8 = 9.6\)

答案:新平均数 = 96.4,新标准差 = 9.6

⚠️ 常见错误

❌ 错误 ✅ 正确
"加了 5,所以标准差也增加了 5" 加上常数完全不改变标准差!
"乘以 3,所以方差也乘以 3" 方差乘以 = 9,不是 b!
"新标准差 = a + b·旧标准差" 新标准差 = |b|·标准差(没有 a!)

📝 总结

线性变换:\(y = a + b \cdot x\)

集中量数(平均数、中位数)— 受 ab 影响

离散量数(标准差、方差)— |b| 影响

🔑 加上常数不改变离散度!