统计学:集中趋势度量(中心位置)

📊 集中趋势度量(中心位置)

集中趋势度量描述数据分布的"中心" — 一个典型的或有代表性的值。

📈 1. 平均数(Mean)- x̄

平均数 = 数值之和 ÷ 数值个数

x̄ = (Σxᵢ) / n = (x₁ + x₂ + ... + xₙ) / n

示例:5 名学生的成绩:70、80、85、90、100

x̄ = (70 + 80 + 85 + 90 + 100) / 5 = 425 / 5 = 85

加权平均数(根据频数表)

x̄ = (Σfᵢ·xᵢ) / n = (f₁·x₁ + f₂·x₂ + ...) / Σfᵢ

示例:成绩的频数表:

成绩 (x)	频数 (f)	f·x
60	2	120
70	5	350
80	8	640
90	4	360
100	1	100
总计	n=20	Σf·x=1570

x̄ = 1570 / 20 = 78.5

⚖️ 2. 中位数(Median)- Me

中位数是把已排序的数据分成两个相等部分的值:
50% 的数值小于它,50% 的数值大于它。

n 为奇数: Me = 位于 (n+1)/2 处的数值

n 为偶数: Me = 两个中间数值的平均数 = (x_{n/2} + x_{n/2+1}) / 2

🏆 3. 众数(Mode)- Mo

众数是具有最高频数的数值 — 出现次数最多的数值。

示例:
• 数据:2, 3, 3, 3, 5, 7 → Mo = 3(出现 3 次)
• 数据:1, 2, 2, 3, 3, 4 → Mo = 2 与 3(双众数)
• 数据:1, 2, 3, 4, 5 → 没有众数(每个数值都出现一次)

⚖️ 各度量之间的比较

度量	优点	缺点	何时使用?
平均数 x̄	使用全部数据在样本中稳定	受极端值影响	对称分布没有异常值
中位数 Me	对极端值稳健适用于顺序变量	没有使用全部信息	存在极端值非对称分布
众数 Mo	适用于所有量表易于查找	可能不唯一不稳定	分类变量

⚠️ 记住:
• 平均数对极端值敏感 — 一个观测值就能显著改变它!
• 中位数稳健 — 不受极端值影响
• 当存在强烈的非对称时,中位数能更好地代表"中心"

💡 经典示例:
10 名员工的薪资:8,000 | 9,000 | 9,500 | 10,000 | 10,500 | 11,000 | 11,500 | 12,000 | 15,000 | 100,000(首席执行官)

• 平均数:$19,650(因首席执行官而被拉偏!)
• 中位数:$10,750(更具代表性)
• 众数:没有(每个数值都出现一次)

🔧 特殊公式

两个组的平均数

x̄_总 = (n₁·x̄₁ + n₂·x̄₂) / (n₁ + n₂)

修改某个数值后修正平均数

x̄_新 = x̄_旧 + (新值 - 旧值) / n

示例:10 个成绩的平均数是 80。发现一个成绩 70 被错误地记成了 90。
x̄_新 = 80 + (90 - 70) / 10 = 80 + 2 = 82