统计学导论:总体与样本、变量与数据

统计学

第 1 页:基础概念

📊 什么是统计学?

统计学是数学的一个分支,涉及数据的收集、整理、分析和展示,并由此得出结论。

💡 为什么重要?

  • 基于数据进行决策
  • 识别趋势和模式
  • 组间比较
  • 预测未来现象

👥 总体与样本

总体 样本 总体 = 所有项目 我们想研究的 样本 = 总体的一部分 被选来检测的
总体 样本
我们想研究的所有项目/人员 从总体中被选来检测的一部分
例如:以色列所有学生 例如:被选出的 500 名学生
通常太大无法完整检测 必须代表总体

✏️ 例子:

研究 总体 可能的样本
高考分数 所有高考考生 1000 名考生
产品质量 工厂所有产品 100 件抽检产品
选举民调 所有具有投票权者 1200 名公民

📋 统计变量

变量是我们在总体中研究/测量的特性。

总体中的每个个体都有该变量的某个值。

✏️ 变量示例:

  • 学生身高(以厘米为单位)
  • 考试分数(0-100)
  • 兄弟姐妹数
  • 眼睛颜色
  • 婚姻状况

🔀 变量类型

变量 定性(分类) 定量(数值) 离散(计数) 连续(测量) 颜色、性别、宗教、 婚姻状况 子女数、房间数、 分数(整数) 身高、体重、 温度、时间
类型 定义 例子
定性 描述特性,不能进行算术运算 眼睛颜色、性别、居住城市
定量离散 仅取整数值(计数) 子女数、事故数
定量连续 区间内任意值(测量) 身高、体重、时间

💡 如何区分离散与连续?

离散:问"多少个?"(计数)- 答案是整数

连续:问"有多大?"(测量)- 可以是任何数

📝 其他概念

概念 定义 例子
数据/观测值 对某个个体测量/记录的值 小明的身高:175 厘米
变量的其中一个可能值 变量"兄弟姐妹数"中:0、1、2、3...
极差 最高值与最低值之间的差 分数 60-95 → 极差 = 35
n 样本/总体中的项目数 n = 50(测了 50 名学生)

✏️ 综合例题

研究:研究中国高中生的睡眠习惯

  • 总体:中国所有高中生
  • 样本:来自 10 所学校的 200 名学生
  • n = 200

可能的变量:

变量 类型
夜间睡眠时长 定量连续
夜间醒来次数 定量离散
睡眠质量(好/中/差) 定性

💡 考试技巧

定性:不能计算平均值!

离散:计数(多少个?)

连续:测量(有多大?)

📝 第 1 页总结

总体 = 全部 | 样本 = 代表性的一部分

变量:定性 / 定量(离散或连续)