统计学:集中趋势度量(中心位置)

📊 集中趋势度量(中心位置)

集中趋势度量描述数据分布的"中心" — 一个典型的或有代表性的值。

📈 1. 平均数(Mean)- x̄

平均数 = 数值之和 ÷ 数值个数

x̄ = (Σxᵢ) / n = (x₁ + x₂ + ... + xₙ) / n
示例:5 名学生的成绩:70、80、85、90、100

x̄ = (70 + 80 + 85 + 90 + 100) / 5 = 425 / 5 = 85

加权平均数(根据频数表)

x̄ = (Σfᵢ·xᵢ) / n = (f₁·x₁ + f₂·x₂ + ...) / Σfᵢ
示例:成绩的频数表:
成绩 (x) 频数 (f) f·x
60 2 120
70 5 350
80 8 640
90 4 360
100 1 100
总计 n=20 Σf·x=1570
x̄ = 1570 / 20 = 78.5

⚖️ 2. 中位数(Median)- Me

中位数是把已排序的数据分成两个相等部分的值:
50% 的数值小于它,50% 的数值大于它。
在已排序的数据中查找中位数 n 为奇数 3 5 7 9 12 n=5 → 位置 (5+1)/2 = 3 Me = 7 n 为偶数 2 4 6 8 10 15 n=6 → 位置 3 和 4 Me = (6+8)/2 = 7
n 为奇数: Me = 位于 (n+1)/2 处的数值

n 为偶数: Me = 两个中间数值的平均数 = (x_{n/2} + x_{n/2+1}) / 2

🏆 3. 众数(Mode)- Mo

众数是具有最高频数的数值 — 出现次数最多的数值。
示例:
• 数据:2, 3, 3, 3, 5, 7 → Mo = 3(出现 3 次)
• 数据:1, 2, 2, 3, 3, 4 → Mo = 2 与 3(双众数)
• 数据:1, 2, 3, 4, 5 → 没有众数(每个数值都出现一次)

⚖️ 各度量之间的比较

分布形状对集中趋势度量的影响 对称 Me = x̄ = Mo 右偏(+) Mo Me Mo < Me < x̄ 左偏(-) Me Mo x̄ < Me < Mo
度量 优点 缺点 何时使用?
平均数 x̄ 使用全部数据
在样本中稳定
受极端值影响 对称分布
没有异常值
中位数 Me 对极端值稳健
适用于顺序变量
没有使用全部信息 存在极端值
非对称分布
众数 Mo 适用于所有量表
易于查找
可能不唯一
不稳定
分类变量
⚠️ 记住:
平均数对极端值敏感 — 一个观测值就能显著改变它!
中位数稳健 — 不受极端值影响
• 当存在强烈的非对称时,中位数能更好地代表"中心"
💡 经典示例:
10 名员工的薪资:8,000 | 9,000 | 9,500 | 10,000 | 10,500 | 11,000 | 11,500 | 12,000 | 15,000 | 100,000(首席执行官)

平均数:$19,650(因首席执行官而被拉偏!)
中位数:$10,750(更具代表性)
众数:没有(每个数值都出现一次)

🔧 特殊公式

两个组的平均数

x̄_总 = (n₁·x̄₁ + n₂·x̄₂) / (n₁ + n₂)

修改某个数值后修正平均数

x̄_新 = x̄_旧 + (新值 - 旧值) / n
示例:10 个成绩的平均数是 80。发现一个成绩 70 被错误地记成了 90。
x̄_新 = 80 + (90 - 70) / 10 = 80 + 2 = 82

OpenBook © 2025 © רוית הלפנבאום