正态分布
正态分布介绍与基本性质
📊 离散型变量与连续型变量
离散型变量
两个相邻数值之间没有其他数值
例子:孩子数量、汽车数量
1 个孩子、2 个孩子、3 个孩子……
连续型变量
两个数值之间存在无穷多个可能的数值
例子:身高、体重、温度
1.70 米、1.705 米、1.7052 米……
🔔 什么是正态分布?
正态分布是世界上最熟悉的分布,描述自然界与社会中的众多现象。
也称为:"钟形曲线" 或 "高斯分布"
💡 服从正态分布的现象例子:
- 人口的身高
- 新生儿出生体重
- 标准化考试成绩(SAT、高考)
- 体温
- 测量误差
⭐ 正态分布的性质
1️⃣ 对称
分布关于平均值对称 — 完美的镜像
2️⃣ 平均值 = 中位数 = 众数
所有的集中量都在同一点 — 分布的中央
3️⃣ 密度从中心向两侧递减
距离平均值越远,数值的集中度越低
4️⃣ 总面积等于 100%
曲线与 x 轴之间的面积等于 1(或 100%)
5️⃣ 两侧各 50%
50% 的数值在平均值之上,50% 在其之下
📐 决定正态分布的两个参数
每个正态分布仅由两个参数决定:
\(\mu\)(或 \(\bar{x}\))
平均值
决定分布在 x 轴上的位置
\(\sigma\)(或 S)
标准差
决定钟形的宽度(离散程度)
标准差越大 → 钟形越宽、越低
标准差越小 → 钟形越窄、越高
🔄 对称性法则
关于平均值对称的面积相等!
💡 例子:
如果平均值是 100:
- 95 与 100 之间的面积 = 100 与 105 之间的面积
- 90 以下的面积 = 110 以上的面积
📈 面积即概率/百分比
💡 重要关系:
在正态分布中,曲线下方的面积表示:
- 群体的百分比
- 取得某值的概率/可能性
- 相对频率
✏️ 例子:
如果身高 170 到 180 厘米之间的面积是 0.30(或 30%),意味着:
- 30% 的群体身高在 170 到 180 之间
- 随机一人的身高在这范围内的概率是 0.30
🔢 表示形式的转换:
| 形式 | 例子 |
|---|---|
| 小数 | 0.30 |
| 百分比 | 30% |
| 概率 | P = 0.30 |
📊 68-95-99.7 法则(经验法则)
| 区间 | 数值占比 |
|---|---|
| \(\mu \pm 1\sigma\) | ≈ 68% |
| \(\mu \pm 2\sigma\) | ≈ 95% |
| \(\mu \pm 3\sigma\) | ≈ 99.7% |
📝 总结
正态分布 = 对称钟形曲线
平均值 = 中位数 = 众数(在中央)
面积 = 概率 = 百分比
68-95-99.7 法则