统计学:中心与离散度量 — 基本概念

📊 统计学的基本概念

🎯 什么是统计学?

统计学是数学的一个分支,研究数据的收集、整理、分析与解释

它分为两个主要领域:

  • 描述统计学:对数据进行描述与总结(图表、平均值、偏差)
  • 推断统计学:从样本对总体作出推断

👥 总体与样本

总体(N) 样本(n) 总体: 想要研究的 全部个体 样本: 从总体中选取的 一个子集
示例:
想要检查一所大学所有学生的平均成绩(总体 = 30,000)。
选取一个包含 500 名学生的样本并检查他们的成绩。

📏 变量的类型

变量 定性变量(分类) 定量变量(数值) 名义 顺序(次序) 离散 连续 眼睛颜色 性别、宗教 军衔 满意度 子女数量 房间数量 身高、体重 温度
变量类型 定义 示例 允许的运算
名义 没有顺序的类别 颜色、性别、宗教 仅众数
顺序 有顺序的类别 军衔、满意度 众数、中位数
离散 仅整数值 子女数量、房间数量 所有运算
连续 区间内的任意值 身高、体重、时间 所有运算
⚠️ 重要的区分:
  • 离散:可以计数(0、1、2、3……)— "有多少个?"
  • 连续:可以测量(1.5、2.73……)— "有多少?"

📐 测量量表

名义 顺序 区间 比率 测量层次递增(信息更多) 不同/相同 + 顺序 + 距离 + 绝对零点
每种量表的示例:
  • 名义:足球运动员的号码(梅西 = 10)— 没有数学意义
  • 顺序:比赛中的名次(第一、第二……)— 有顺序,没有固定的距离
  • 区间:摄氏温度 — 有距离,没有真正的零点(0°C ≠ 没有热量)
  • 比率:身高、体重、收入 — 有真正的零点(0 千克 = 没有重量)

📋 概念总结

概念 符号 解释
总体规模 N 整个总体中的个体数量
样本规模 n 被选入样本的个体数量
参数 θ(西塔) 总体的特征(通常未知)
统计量 θ̂(西塔帽) 从样本计算出的参数估计值
记住:从样本(n)对总体(N)作出推断

OpenBook © 2025 © רוית הלפנבאום