本科

本科概率与统计人物


假设检验


理解假设检验对于统计数据分析非常重要,特别是当你需要根据定量证据做出明智决策时。假设检验是一种方法,可以帮助你确定样本数据中是否有足够的证据来推断某个条件在整个群体中成立。

什么是假设?

在进入假设检验之前,理解假设是什么很重要。简单来说,假设是关于群体参数的陈述或假设。在统计学领域,假设通常是关于群体均值或比例的陈述。

例如,假设一家工厂声称他们的灯泡平均寿命为1000小时。你的假设可能是,“灯泡的平均寿命是1000小时。”

假设的类型

假设检验中有两种主要类型的假设:

1. 原假设 (H0)

原假设是一个普遍的陈述,指出两个测量现象之间没有关系或组之间没有关联。它是指示没有效应或差异的默认或基本假设。以灯泡示例为例,原假设是:

H0: μ = 1000

它表示灯泡的平均寿命为1000小时。

2. 备择假设 (Ha 或 H1)

备择假设是反驳原假设的陈述。它表明存在效应或差异。根据我们的示例,备择假设可能是:

Ha: μ ≠ 1000

这表明灯泡的平均寿命不是1000小时。

假设检验的步骤

假设检验遵循一个结构化的过程。以下是其通常的逐步指南:

1. 陈述假设

你首先陈述原假设和备择假设。这些通常是关于群体参数的陈述。

2. 确定显著性水平 (α)

显著性水平,通常表示为α,表示在原假设为真时拒绝它的概率。常见的显著性水平有0.05,0.01和0.10。

3. 选择合适的检验

选择最适合你的数据和假设的统计检验。t检验和z检验常用于比较均值,而卡方检验则用于类别数据。

4. 计算检验统计量

使用样本数据计算检验统计量,这是一个标准化值,用于衡量观察到的数据与在原假设下预期的数据之间的差异程度。

5. 确定p值或临界值

p值表示在原假设下观察到检验结果的概率。如果p值小于α,则拒绝原假设。或者,如果使用临界值方法,则将检验统计量与来自概率分布的临界值进行比较。

6. 做出决策

根据p值或临界值比较,决定是拒绝还是不拒绝原假设。

7. 得出结论

将统计判断转化为研究问题背景下的结论。

视觉示例

让我们想象一个简单的均值差假设检验如下的情景:

想象一个数据分布示例:

H 0 H A 0 1

在这个图中,两个分布图(蓝色和红色)代表了原假设和备择假设的可能值。重叠区域代表我们可能无法拒绝原假设的共同点。

假设检验的示例

示例1:单样本t检验

假设我们想知道某种新药是否改变了体温。平均体温为98.6°F。给30人服用药物后,记录的平均体温为98.4°F,标准差为0.5°F。

步骤1:陈述假设。

H0: μ = 98.6
Ha: μ ≠ 98.6

步骤2:确定显著性水平。

α = 0.05

步骤3:选择检验。

使用单样本t检验,因为群体标准差未知,且样本量较小。

步骤4:计算检验统计量 (t)。

t = (98.4 - 98.6) / (0.5/√30) = -2.19

步骤5:使用t分布确定p值。

对于df = 29,假设使用双尾检验,p值 ≈ 0.036。

步骤6:做出决策。

由于p值(0.036) < α (0.05),拒绝原假设。

步骤7:结论。

我们有足够的证据表明该药物影响体温。

假设检验的重要性

假设检验在医学、社会科学、农业、商业等各个领域中在决策中发挥着至关重要的作用。通过依赖于统计证据,它在解决感兴趣的问题时消除了猜测的需要。

假设检验中的错误

我们必须明白,假设检验不提供确定性。它带有错误的风险:

1. 一类错误

当原假设为真但我们错误拒绝它时,会发生这种错误。一类错误的概率由选择的α水平表示。

2. 二类错误

当原假设为假但我们未能拒绝它时,会发生二类错误。二类错误发生的概率由β表示。

检验的效能

检验的效能是指它正确拒绝错误的原假设的概率。增加样本量或效应量可以帮助增加检验的效能。

结论

假设检验是一个提供正式结构以测试想法和理论的宝贵工具。虽然它不提供绝对证明,但它确实指导基于证据的决策,帮助分析师和科学家得出结论,并以一定的确定性做出预测。


本科 → 6.2.3


U
username
0%
完成于 本科


评论