假设检验
假设检验。用于练习并加深对假设检验理解的题目。在线统计学练习,配有完整解答和分步详细讲解。
假设检验练习——H₀ 与 H₁、第一类和第二类错误 (α 与 β)、p 值、z 检验和 t 检验、单尾与双尾、统计功效。完整的推断统计学。
主题:原假设与备择假设 (H₀, H₁)、第一类与第二类错误 (α, β)、p 值、显著性水平。
什么是零假设(H₀)?
💡 解释:
H₀: 默认主张: "无效应/无差异"。假定为真除非证据相反 ✅
什么是备择假设(H₁)?
💡 解释:
H₁: 想证明的(效应/差异/变化)。仅当反对 H₀ 的证据足够时才接受 ✅
什么是 I 型错误?
💡 解释:
I 型错误 (α): 假阳性 —— 无效应却宣称有。概率由 α 控制(典型 0.05)✅
什么是 II 型错误?
💡 解释:
II 型错误 (β): 假阴性 —— 未检测到真实效应。Power = 1 - β(检测能力)✅
什么是 p 值?
💡 解释:
p 值: 假设 H₀ 为真时,观察到数据(或更极端)的概率。不是 P(H₀ 真)✅
什么是显著水平(α)?
💡 解释:
α: 预设阈值(典型 0.05)。若 p 值 < α → 拒 H₀。α = P(I 型错误)✅
"拒绝 H₀" 与 "接受 H₁" 的区别?
💡 解释:
等价: 拒绝 H₀ ⟺ 接受 H₁。但: 从不"证明"H₁ —— 只提供反对 H₀ 的证据 ✅
"不拒绝 H₀" 是什么意思?
💡 解释:
注意: "不拒绝 H₀" ≠ "H₀ 为真"。仅意味着证据不足以拒绝 ✅
什么是双尾检验(Two-tailed)?
💡 解释:
双尾: 过大或过小都拒 H₀。α 分布两尾(各 α/2)✅
什么是右侧单尾检验?
💡 解释:
右侧单尾: 仅当值大时拒 H₀。全部 α 集中在右尾 ✅
何时对均值用 z 检验?
💡 解释:
用 z 当: (1) 总体 σ 已知,或 (2) n ≥ 30(由 CLT s ≈ σ)。否则用 t ✅
均值检验统计量 z 的公式:
💡 解释:
z = (统计量 - 假设值) / SE = (x̄ - μ₀)/(σ/√n)。衡量 x̄ 距 μ₀ 多少个 SE ✅
H₀: μ=50,x̄=52,σ=10,n=100。z 是?
💡 解释:
SE = 10/√100 = 1。z = (52-50)/1 = 2 ✅
z=2,双尾。p 值(约)?
💡 解释:
双尾: p = 2·P(Z>2) ≈ 2·0.0228 ≈ 0.046 ✅
p 值=0.03,α=0.05。决策?
💡 解释:
p = 0.03 < α = 0.05 → 拒 H₀。反对 H₀ 证据充分 ✅
p 值=0.08,α=0.05。决策?
💡 解释:
p = 0.08 > α = 0.05 → 不拒 H₀。证据不足 ✅
统计显著与实际显著的区别?
💡 解释:
差异可能统计上显著(p 小)但实际上微不足道。n 巨大时,微小差异也能 p<0.05 ✅
H₁: μ>50(单尾),z=1.8。p 值?
💡 解释:
单尾: p = P(Z>1.8) ≈ 0.036。(不像双尾乘 2)✅
α=0.01 vs α=0.05 是什么意思?
💡 解释:
α 越小 → 拒绝区越小 → 越难拒 H₀ → I 型错误更少,但 II 型错误更多 ✅
n 增大时,p 值如何变化?
💡 解释:
n↑ → SE↓ → |z|↑ → p↓。数据越多越易检测真实效应 ✅
H₀: μ=100,H₁: μ≠100,x̄=105,σ=20,n=64,α=0.05。决策?
💡 解释:
SE = 20/8 = 2.5。z = (105-100)/2.5 = 2。双尾: |z|=2 > 1.96 → 拒 H₀ ✅
双尾检验 α=0.05 的拒绝区?
💡 解释:
双尾 α=0.05 → 每尾 α/2=0.025 → 拒当 |z| > 1.96 ✅
计算 z=2.5 的 p 值(双尾):
💡 解释:
双尾: p = 2·P(Z>2.5) = 2·0.0062 = 0.0124。(右尾 0.0062 + 左尾 0.0062)✅
右侧单尾 H₁: μ>μ₀,α=0.05:
💡 解释:
右侧单尾 α=0.05 → α 全在右尾 → 拒当 z > 1.645 ✅
左侧单尾 H₁: μ<μ₀:
💡 解释:
左侧单尾 α=0.05 → α 全在左尾 → 拒当 z < -1.645 ✅
比较: 双尾 vs 单尾,同 α=0.05:
💡 解释:
双尾 α=0.05: |z|>1.96。单尾 α=0.05: z>1.645。单尾临界值更小(方向正确时更易拒绝)✅
95% CI 与双尾 α=0.05 检验的关系?
💡 解释:
基本对偶: 95% CI 含 μ₀ ⟺ α=0.05 时不拒 H₀。同一硬币的两面 ✅
z=1.5,双尾 p 值?
💡 解释:
P(Z>1.5) ≈ 0.0668。双尾: p = 2·0.0668 ≈ 0.134。(>0.05 → 不拒)✅
双尾检验中 H₀ 的接受区?
💡 解释:
双尾 α=0.05: 接受 H₀ 当 -1.96 ≤ z ≤ 1.96(中心 95%)。区间外: 拒绝 ✅
比较右尾与左尾,同 |z|:
💡 解释:
标准正态分布对称: P(Z>z) = P(Z<-z)。例: P(Z>1.96) = P(Z<-1.96) = 0.025 ✅
z 变得很大(z→∞)时,p 值如何?
💡 解释:
z 很大 → x̄ 距 μ₀ 很远 → H₀ 下极不可能 → p 值 → 0 → 拒绝的极强证据 ✅
比较 α=0.01 vs α=0.05 vs α=0.10:
💡 解释:
α=0.01 → 允许 1% 错拒(很严)。α=0.10 → 允许 10%(宽)。α 越小越严 ✅
n 如何影响 x̄ 的分布:
💡 解释:
SE(x̄) = σ/√n。n↑ → SE↓ → x̄ 分布更集中于 μ。数据越多越精确 ✅
H₀: μ=50,x̄=53,σ=15,n=225。算 z:
💡 解释:
SE = 15/√225 = 15/15 = 1。z = (53-50)/1 = 3。|z|=3 >> 1.96 → 强拒绝 ✅
x̄ 远离 μ₀ 时 p 值如何?
💡 解释:
x̄ 距 μ₀ 越远 → |z| 越大 → 尾部越极端 → p 值越小 → 反对 H₀ 证据越强 ✅
比较两个结果: z₁=1.8 vs z₂=2.1(双尾,α=0.05):
💡 解释:
双尾 α=0.05 临界: |z|=1.96。z₁=1.8 < 1.96 → 不拒。z₂=2.1 > 1.96 → 拒。z 的微小差异可改变决策 ✅
假设检验中 z=0 是什么意思?
💡 解释:
z = (x̄-μ₀)/SE = 0 → x̄ = μ₀。数据与 H₀ 完全一致。p 值最大。绝不拒绝 ✅
假设检验的 4 种可能结果:
💡 解释:
2×2 矩阵: H₀ 真×拒(I 错),H₀ 真×不拒(✓),H₀ 假×拒(✓),H₀ 假×不拒(II 错)✅
α 与 β 如何相关?
💡 解释:
基本权衡: 减小 α(少拒)→ 接受区变大 → II 型错误增多 → β 增大。只有增大 n 能同时减少两者 ✅
同时减小 α 和 β 的好方法?
💡 解释:
n↑ → SE↓ → 分布更窄 → 两个错误区(α 和 β)都减小。n 是唯一可直接控制的变量 ✅
图示比较: α=0.05 右、左、双尾:
💡 解释:
单尾临界 1.645 < 双尾 1.96。但双尾要求 |z| 更大 → 统计量绝对值上更严 ✅
σ 增大时(对 z 的影响):
💡 解释:
z = (x̄-μ₀)/(σ/√n)。σ↑ → 分母↑ → |z|↓。总体变异性越大 → 越难检测差异 ✅
z-test 总结: 5 步是?
💡 解释:
流程: (1) 设 H₀, H₁, α;(2) 算 z;(3) 求 p 值;(4) 比较 p 与 α;(5) 决策并解释 ✅
何时用 t 检验代替 z?
💡 解释:
用 t 当 σ 未知(真实情况)。改用样本 s,引入更多不确定性 ✅
均值 t 统计量的公式:
💡 解释:
t = (x̄-μ₀)/(s/√n)。与 z 相同但用 s 代替 σ ✅
t-test 中的 df(自由度)是什么?
💡 解释:
单样本 df = n-1。算 s 时用了 x̄,"消耗"1 个自由度 ✅
比较 t 分布与正态分布:
💡 解释:
t 比 z 尾部更重 → 极端值概率更大 → 临界值更大 → 更保守 ✅
n=16,x̄=52,s=8,H₀: μ=50,α=0.05(双尾)。算 t:
💡 解释:
SE = 8/√16 = 2。t = (52-50)/2 = 1。df = 16-1 = 15。临界 t(15, 0.025) ≈ 2.131 → |t|=1 < 2.131 → 不拒 ✅
为何 t 临界值比 z 大?
💡 解释:
s 是 σ 的有误差估计 → 不确定性更高 → t 分布更宽 → 临界值更大 ✅
df 增大时,t 临界值如何?
💡 解释:
df ↑ → s 更好估计 σ → t 分布接近正态 → t* 接近 z*。极限 df=∞ 时: t=z ✅
df=20,α=0.05 双尾。t 临界值?(约)
💡 解释:
t 表(df=20, α/2=0.025): t* ≈ ±2.086。比 z*=1.96 大,因尾部更重 ✅
n=25,x̄=105,s=15,H₀: μ=100,α=0.05 双尾。决策?
💡 解释:
SE = 15/√25 = 3。t = (105-100)/3 ≈ 1.67。df=24, t*(24, 0.025) ≈ 2.064。|t|=1.67 < 2.064 → 不拒 ✅
大 n 在 t-test 中的优势?
💡 解释:
大 n: (a) SE 小 → 功效高,(b) df 大 → t≈z,(c) s 更好估计 σ,(d) 正态假设不那么关键(CLT)✅
n 何时足够大可用 z 代替 t?
💡 解释:
实用规则: n ≥ 30 → t ≈ z。n 较小时用 t。部分教材建议始终用 t(更保守)✅
比较: 同一样本上 z-test vs t-test:
💡 解释:
同 α 时,t* > z* 总是成立。所以 t 更严 —— 更难拒 H₀。反映用 s 的额外不确定性 ✅
n=10,t=2.5,df=9,双尾。p 值(约)?
💡 解释:
t 表(df=9): t=2.262 对应 α=0.05(双尾),t=2.821 对应 α=0.02。2.5 在两者之间,p ≈ 0.03-0.04 ✅
n 如何影响 z 与 t 的选择?
💡 解释:
n 小且 σ 未知: 必须用 t。n 大时,t ≈ z,两者都行。选择取决于 σ 和 n ✅
n 小且 σ 未知时若用 z 会发生什么?
💡 解释:
z* 比 t* 小,所以会比应有的更频繁拒 H₀。实际 I 型错误率会超过名义 α ✅
右侧单尾 t-test,df=15,α=0.05:
💡 解释:
t 表(df=15, α=0.05 单尾): t* = 1.753。双尾时 2.131(α/2=0.025)✅
t-test 总结: 与 z 的主要区别?
💡 解释:
关键区别: (1) SE 用 s 而非 σ,(2) 用 t 分布 df=n-1,(3) 临界值更大 → 更保守 ✅
n=12,x̄=48,s=6,H₀: μ=50,H₁: μ<50,α=0.05。决策?
💡 解释:
SE = 6/√12 ≈ 1.73。t = (48-50)/1.73 ≈ -1.15。df=11,左侧单尾 t* = -1.796。t=-1.15 > -1.796 → 不拒 ✅
t-test 相对 z-test 的优势?
💡 解释:
实际中几乎从不知道总体 σ。t 允许用样本 s,这是现实的。所以 z-test 实际罕见 ✅
t 很大是什么意思?
💡 解释:
|t| 大 → x̄ 相对 SE 距 μ₀ 很远 → H₀ 下极不可能 → p 小 → 强证据拒绝 ✅
n=8,t=-2.5,df=7,左侧单尾,α=0.05。决策?
💡 解释:
左侧单尾临界 t*(df=7, α=0.05) = -1.895。t = -2.5 < -1.895 → 拒 H₀。证据表明 μ < μ₀ ✅
总结: 各检验何时用?
💡 解释:
规则: σ 已知 → z(罕);σ 未知 → t(常)。n ≥ 30 时两者结果相近 ✅
何时对比例用 z 检验?
💡 解释:
正态近似条件: np₀ ≥ 10 且 n(1-p₀) ≥ 10(H₀ 下期望至少 10 成功和 10 失败)✅
比例 z 统计量公式:
💡 解释:
z = (p̂ - p₀)/√(p₀(1-p₀)/n)。注意: SE 用 p₀(非 p̂),因为在 H₀ 下计算 ✅
n=200,x=120,H₀: p=0.5。p̂ 和 z?
💡 解释:
p̂ = 120/200 = 0.6。SE = √(0.5·0.5/200) = √0.00125 ≈ 0.0354。z = (0.6-0.5)/0.0354 ≈ 2.83 ✅
比例检验: p̂ 是什么?
💡 解释:
p̂ = 样本比例 = 成功数 / 样本量。是 p 的点估计 ✅
为何 SE 用 p₀ 而非 p̂?
💡 解释:
检验中假定 H₀ 为真,所以 p 真值为 p₀。故 SE = √(p₀(1-p₀)/n)。CI 中用 p̂ ✅
n=100,p̂=0.35,H₀: p=0.4,α=0.05 双尾。决策?
💡 解释:
SE = √(0.4·0.6/100) ≈ 0.049。z = (0.35-0.4)/0.049 ≈ -1.02。双尾: |z|=1.02 < 1.96 → 不拒 ✅
在曲线上展示: 双尾比例检验:
💡 解释:
结构与均值 z-test 相同: H₀ 下 p̂ 分布近似正态。临界值相同: |z|>1.96(α=0.05 双尾)✅
右侧单尾 H₁: p>p₀。何时拒 H₀?
💡 解释:
右侧单尾 α=0.05: 拒当 z > 1.645(α 全在右尾)✅
n=400,x=180,H₀: p=0.5,H₁: p<0.5,α=0.05。决策?
💡 解释:
p̂ = 180/400 = 0.45。SE = √(0.5·0.5/400) = 0.025。z = (0.45-0.5)/0.025 = -2。左侧单尾临界: -1.645。z=-2 < -1.645 → 拒 H₀ ✅
比例 SE 与均值 SE 的区别?
💡 解释:
比例: SE = √(p₀(1-p₀)/n) —— 取决于 p₀。均值: SE = σ/√n —— 取决于 σ。结构不同,虽原理相同 ✅
比例最大 SE 是?
💡 解释:
p(1-p) 在 p=0.5 时最大(为 0.25)。所以接近 0.5 的比例检验更难拒绝(SE 大)✅
p₀ 如何影响检验功效?
💡 解释:
p₀ 接近 0.5 → SE 大 → 难拒。p₀ 极端(接近 0 或 1)→ SE 小 → 给定偏差易拒 ✅
n=50,x=35,H₀: p=0.5。验证条件:
💡 解释:
np₀ = 50·0.5 = 25 ≥ 10 ✓。n(1-p₀) = 50·0.5 = 25 ≥ 10 ✓。两个都满足 ✅
n=20,p₀=0.2。条件满足吗?
💡 解释:
np₀ = 20·0.2 = 4 < 10 ❌。n(1-p₀) = 20·0.8 = 16 ≥ 10 ✓。第一个条件不满足 —— 不能用正态近似 ✅
比较: 比例 CI vs 假设检验:
💡 解释:
CI: SE 用 p̂(估计)。检验: SE 用 p₀(假定 H₀ 真)。这是根本区别 ✅
比例 z 检验总结 —— 步骤是?
💡 解释:
(1) 验 np₀≥10 和 n(1-p₀)≥10;(2) p̂=x/n;(3) z=(p̂-p₀)/√(p₀(1-p₀)/n);(4) p 值;(5) 与 α 比较并决策 ✅
什么是检验功效(Power)?
💡 解释:
Power = 检验检测真实效应的能力。P(拒 H₀ | H₁ 真) = 1 - β ✅
图示: α, β 和 Power:
💡 解释:
两个分布: H₀ 下(μ₀)—— α 在临界值右侧;H₁ 下(μ₁)—— β 在左侧,Power 在右侧(1-β)✅
n 增大时,Power 如何?
💡 解释:
n↑ → SE↓ → 分布更窄 → 重叠减少 → β↓ → Power↑。大 n = 检测力强 ✅
α 增大时,Power 如何?
💡 解释:
α 大 → 拒绝区大 → 易拒 H₀ → Power↑。但: I 型错误也增多 —— 权衡 ✅
什么是效应量?如何影响 Power?
💡 解释:
效应量 = 真实效应大小。越大(μ₁ 距 μ₀ 远),越易检测 → Power 越大。小效应难识别 ✅
最低可接受 Power 是?
💡 解释:
约定: Power ≥ 0.8 被视为充足。意味着真实效应存在时有 80% 概率检测到 ✅
如何提高 Power?
💡 解释:
4 种方法: (1) 增 n,(2) 增 α(权衡),(3) 若合理则用单尾,(4) 减小 σ(更好设计)✅
Power 曲线: Power 关于 n:
💡 解释:
Power(n) 曲线单调递增,趋近 1。n 小 → Power 低;n 大 → Power → 1。特征"S 形" ✅
功效分析与假设检验的区别?
💡 解释:
Power 分析 = 收集前,算所需 n。假设检验 = 收集后,分析数据 ✅
Power=0.7 意味着:
💡 解释:
Power=0.7 → β=0.3 → 30% 概率漏检真实效应。低于标准 0.8 —— 应增 n ✅
为何研究规划中 Power 很重要?
💡 解释:
无 Power 分析: (1) 对象太少 → 研究白做;(2) 对象太多 → 浪费资源。找平衡 = 高效科学 ✅
比较: 单尾 vs 双尾 Power:
💡 解释:
单尾把 α 集中在一尾 → 临界值小 → 易拒 → Power 大。但仅当知方向时 ✅
什么是"妥协功效"?
💡 解释:
实际中不总能达到 Power=0.8。预算、时间、对象限制 n → 接受较低 Power,并声明此局限 ✅
Power 总结: 影响因素是?
💡 解释:
5 个可控/可观察因素: (1) n, (2) α, (3) 效应量, (4) σ(变异性), (5) 单尾/双尾 ✅
研究前 Power 分析: 需要什么数据?
💡 解释:
计算所需 n: (1) α(典型 0.05),(2) 期望 Power(典型 0.8),(3) 预期效应量(文献),(4) σ 估计 ✅
综合总结: 假设检验类型?
💡 解释:
3 主要检验: (1) 均值 z-test(σ 已知),(2) 均值 t-test(σ 未知),(3) 比例 z-test ✅
何时用何种检验?决策图:
💡 解释:
决策图: 是均值还是比例?若均值: σ 已知?→ z,否则 → t。若比例: z(验条件)✅
比较所有公式:
💡 解释:
共同结构: 统计量 = (观察值 - 假设值)/SE。唯一区别: SE 公式。一个思想 —— 三种应用 ✅
临界值比较(α=0.05 双尾):
💡 解释:
z(α=0.025)=1.96。t(df=5, α=0.025)=2.571。t(df=20, α=0.025)=2.086。t(df=∞)=z=1.96。有限 df 时 t 总更大 ✅
错误总结: α, β, Power:
💡 解释:
完整矩阵: 2 决策 × 2 自然状态 = 4 结果。2 个正确(P=1-α 和 P=Power),2 个错误(α 和 β)。Power = 1-β ✅
完整流程: 从设计到决策:
💡 解释:
科学流程: (1) Power 分析定 n,(2) 收集数据,(3) 选检验,(4) 算统计量和 p 值,(5) 决策与解释 ✅
CI 与假设检验的关系?
💡 解释:
基本对偶: 95% CI 含 μ₀ ⟺ α=0.05 时不拒 H₀。同一硬币两面 —— 互补工具 ✅
假定(assumptions)的重要性?
💡 解释:
假定(正态性、独立性、大 n)是检验的基础。违反时 p 值无效,结论错误。必须事先验证 ✅
总结: 主要信息是?
💡 解释:
综合总结: (1) 选正确检验,(2) 验条件和假定,(3) 懂 p 值和 α,(4) 考虑 Power 和 n ✅
🎉 恭喜!你完成了考试 12 🎉
💡 解释:
🎉 恭喜!完成了106 题假设检验: 基础、z-test、t-test、比例、Power 分析。你现在是专家了! 🌟