📊 集中趋势度量(中心位置)
集中趋势度量描述数据分布的"中心" — 一个典型的或有代表性的值。
📈 1. 平均数(Mean)- x̄
平均数 = 数值之和 ÷ 数值个数
x̄ = (Σxᵢ) / n = (x₁ + x₂ + ... + xₙ) / n
x̄ = (Σxᵢ) / n = (x₁ + x₂ + ... + xₙ) / n
示例:5 名学生的成绩:70、80、85、90、100
x̄ = (70 + 80 + 85 + 90 + 100) / 5 = 425 / 5 = 85
x̄ = (70 + 80 + 85 + 90 + 100) / 5 = 425 / 5 = 85
加权平均数(根据频数表)
x̄ = (Σfᵢ·xᵢ) / n = (f₁·x₁ + f₂·x₂ + ...) / Σfᵢ
示例:成绩的频数表:
x̄ = 1570 / 20 = 78.5
| 成绩 (x) | 频数 (f) | f·x |
|---|---|---|
| 60 | 2 | 120 |
| 70 | 5 | 350 |
| 80 | 8 | 640 |
| 90 | 4 | 360 |
| 100 | 1 | 100 |
| 总计 | n=20 | Σf·x=1570 |
⚖️ 2. 中位数(Median)- Me
中位数是把已排序的数据分成两个相等部分的值:
50% 的数值小于它,50% 的数值大于它。
50% 的数值小于它,50% 的数值大于它。
n 为奇数: Me = 位于 (n+1)/2 处的数值
n 为偶数: Me = 两个中间数值的平均数 = (x_{n/2} + x_{n/2+1}) / 2
n 为偶数: Me = 两个中间数值的平均数 = (x_{n/2} + x_{n/2+1}) / 2
🏆 3. 众数(Mode)- Mo
众数是具有最高频数的数值 — 出现次数最多的数值。
示例:
• 数据:2, 3, 3, 3, 5, 7 → Mo = 3(出现 3 次)
• 数据:1, 2, 2, 3, 3, 4 → Mo = 2 与 3(双众数)
• 数据:1, 2, 3, 4, 5 → 没有众数(每个数值都出现一次)
• 数据:2, 3, 3, 3, 5, 7 → Mo = 3(出现 3 次)
• 数据:1, 2, 2, 3, 3, 4 → Mo = 2 与 3(双众数)
• 数据:1, 2, 3, 4, 5 → 没有众数(每个数值都出现一次)
⚖️ 各度量之间的比较
| 度量 | 优点 | 缺点 | 何时使用? |
|---|---|---|---|
| 平均数 x̄ | 使用全部数据 在样本中稳定 |
受极端值影响 | 对称分布 没有异常值 |
| 中位数 Me | 对极端值稳健 适用于顺序变量 |
没有使用全部信息 | 存在极端值 非对称分布 |
| 众数 Mo | 适用于所有量表 易于查找 |
可能不唯一 不稳定 |
分类变量 |
⚠️ 记住:
• 平均数对极端值敏感 — 一个观测值就能显著改变它!
• 中位数稳健 — 不受极端值影响
• 当存在强烈的非对称时,中位数能更好地代表"中心"
• 平均数对极端值敏感 — 一个观测值就能显著改变它!
• 中位数稳健 — 不受极端值影响
• 当存在强烈的非对称时,中位数能更好地代表"中心"
💡 经典示例:
10 名员工的薪资:8,000 | 9,000 | 9,500 | 10,000 | 10,500 | 11,000 | 11,500 | 12,000 | 15,000 | 100,000(首席执行官)
• 平均数:$19,650(因首席执行官而被拉偏!)
• 中位数:$10,750(更具代表性)
• 众数:没有(每个数值都出现一次)
10 名员工的薪资:8,000 | 9,000 | 9,500 | 10,000 | 10,500 | 11,000 | 11,500 | 12,000 | 15,000 | 100,000(首席执行官)
• 平均数:$19,650(因首席执行官而被拉偏!)
• 中位数:$10,750(更具代表性)
• 众数:没有(每个数值都出现一次)
🔧 特殊公式
两个组的平均数
x̄_总 = (n₁·x̄₁ + n₂·x̄₂) / (n₁ + n₂)
修改某个数值后修正平均数
x̄_新 = x̄_旧 + (新值 - 旧值) / n
示例:10 个成绩的平均数是 80。发现一个成绩 70 被错误地记成了 90。
x̄_新 = 80 + (90 - 70) / 10 = 80 + 2 = 82
x̄_新 = 80 + (90 - 70) / 10 = 80 + 2 = 82
OpenBook © 2025 © רוית הלפנבאום