正态分布 - 正态分布介绍与基本性质

正态分布

正态分布介绍与基本性质

📊 离散型变量与连续型变量

离散型变量

两个相邻数值之间没有其他数值

例子:孩子数量、汽车数量

1 个孩子、2 个孩子、3 个孩子……

连续型变量

两个数值之间存在无穷多个可能的数值

例子:身高、体重、温度

1.70 米、1.705 米、1.7052 米……

🔔 什么是正态分布?

正态分布是世界上最熟悉的分布,描述自然界与社会中的众多现象。

也称为:"钟形曲线" 或 "高斯分布"

平均值 = 中位数 = 众数 50% 50%

💡 服从正态分布的现象例子:

  • 人口的身高
  • 新生儿出生体重
  • 标准化考试成绩(SAT、高考)
  • 体温
  • 测量误差

⭐ 正态分布的性质

1️⃣ 对称

分布关于平均值对称 — 完美的镜像

2️⃣ 平均值 = 中位数 = 众数

所有的集中量都在同一点 — 分布的中央

3️⃣ 密度从中心向两侧递减

距离平均值越远,数值的集中度越低

4️⃣ 总面积等于 100%

曲线与 x 轴之间的面积等于 1(或 100%)

5️⃣ 两侧各 50%

50% 的数值在平均值之上,50% 在其之下

📐 决定正态分布的两个参数

每个正态分布仅由两个参数决定:

\(\mu\)(或 \(\bar{x}\))

平均值

决定分布在 x 轴上的位置

\(\sigma\)(或 S)

标准差

决定钟形的宽度(离散程度)

S 大 S 小 平均值

标准差越大 → 钟形越宽、越低

标准差越小 → 钟形越窄、越高

🔄 对称性法则

平均值 面积 A 面积 B

关于平均值对称的面积相等!

💡 例子:

如果平均值是 100:

  • 95 与 100 之间的面积 = 100 与 105 之间的面积
  • 90 以下的面积 = 110 以上的面积

📈 面积即概率/百分比

💡 重要关系:

在正态分布中,曲线下方的面积表示:

  • 群体的百分比
  • 取得某值的概率/可能性
  • 相对频率

✏️ 例子:

如果身高 170 到 180 厘米之间的面积是 0.30(或 30%),意味着:

  • 30% 的群体身高在 170 到 180 之间
  • 随机一人的身高在这范围内的概率是 0.30

🔢 表示形式的转换:

形式 例子
小数 0.30
百分比 30%
概率 P = 0.30

📊 68-95-99.7 法则(经验法则)

μ -1σ +1σ -2σ +2σ 68% 95% 99.7%
区间 数值占比
\(\mu \pm 1\sigma\) ≈ 68%
\(\mu \pm 2\sigma\) ≈ 95%
\(\mu \pm 3\sigma\) ≈ 99.7%

📝 总结

正态分布 = 对称钟形曲线

平均值 = 中位数 = 众数(在中央)

面积 = 概率 = 百分比

68-95-99.7 法则