仮説検定
統計学でデータを分析する際、特に定量的な証拠に基づいて情報に基づいた意思決定を行う必要があるときに、仮説検定を理解することは重要です。仮説検定は、ある条件が全体の集団に対して真であると推測するのに十分な証拠がデータのサンプルにあるかどうかを判断する方法です。
仮説とは何か?
仮説検定に入る前に、仮説が何であるかを理解することが重要です。簡単に言えば、仮説とは、集団のパラメータに関する陳述や仮定です。統計学の分野では、仮説はしばしば集団の平均や割合に関する陳述です。
例えば、ある工場が自社の電球が平均で1,000時間もつと主張するとしましょう。あなたの仮説は、「電球の平均寿命は1,000時間であるかもしれない」です。
仮説の種類
仮説検定には主に2つのタイプの仮説があります:
1. 帰無仮説 (H0)
帰無仮説とは、2つの測定された現象間に関係がない、またはグループ間に関連がないことを示す一般的な陳述です。これは影響や差異がないことを示すデフォルトまたは基本的な仮説です。電球の例では、帰無仮説は次のとおりです:
H0: μ = 1000
電球の平均寿命が1000時間であると示しています。
2. 対立仮説 (Ha または H1)
対立仮説は帰無仮説を否定する陳述です。影響や差異があることを示唆しています。私たちの例では、対立仮説は次のようになります:
Ha: μ ≠ 1000
これは、電球の平均寿命が1000時間ではないことを示しています。
仮説検定のステップ
仮説検定は構造化されたプロセスに従い、以下は典型的なステップバイステップガイドです:
1. 仮説を設定する
はじめに、帰無仮説と対立仮説を設定します。これらは通常、母集団パラメータの観点で述べられます。
2. 有意水準 (α) を決定する
有意水準は、帰無仮説が真である場合にそれを棄却する確率を示します。一般的な有意水準は0.05、0.01、0.10です。
3. 適切なテストを選択する
データと仮説に最も適した統計テストを選びます。Tテストやzテストは平均の比較に、カイ二乗テストはカテゴリカルデータに用いられます。
4. テスト統計量を計算する
サンプルデータを使用して、観測データと帰無仮説の下で期待されるものとの違いの程度を測定する標準化された値であるテスト統計量を計算します。
5. p値または臨界値を決定する
p値は、帰無仮説の下でテスト結果を観察する確率を示します。p値がαより小さい場合、帰無仮説は棄却されます。代わりに臨界値アプローチが使用される場合、テスト統計量を確率分布の臨界値と比較します。
6. 決定を下す
p値または臨界値の比較に基づいて、帰無仮説を棄却するか棄却しないか決定します。
7. 結論を導く
統計的な判断を研究課題の文脈で結論に変換します。
視覚的な例
平均の差異のための簡単な仮説テストのシナリオを想像してみましょう:
データ分布の例を想像してください:
この図では、青色と赤色の2つの分布が帰無仮説と対立仮説の可能な値を表しています。重なり合う領域は、帰無仮説を棄却しない可能性のある共通の基盤を表しています。
仮説検定の例
例1: 1サンプルt検定
新しい薬が体温を変えるかどうかを知りたいとします。平均体温は98.6°Fです。30人に薬を投与した後、平均体温は98.4°F、標準偏差は0.5°Fと記録されました。
ステップ1: 仮説を設定します。
H0: μ = 98.6
Ha: μ ≠ 98.6
ステップ2: 有意水準を決定します。
α = 0.05
ステップ3: テストを選択します。
母集団の標準偏差が未知であり、サンプルサイズが小さいため、1サンプルt検定を使用します。
ステップ4: テスト統計量 (t) を計算します。
t = (98.4 - 98.6) / (0.5/√30) = -2.19
ステップ5: t分布を使用してp値を求めます。
自由度df = 29の場合、2尾検定でp値 ≈ 0.036。
ステップ6: 決定を下します。
p値 (0.036) < α (0.05) なので、帰無仮説は棄却されます。
ステップ7: 結論。
薬が体温に影響を与えることを示唆するのに十分な証拠があります。
仮説検定の重要性
仮説検定は、医療、社会科学、農業、ビジネスなど様々な分野での意思決定において極めて重要な役割を果たしています。統計的証拠に基づくことで、関心のある問題の解決において推測を排除します。
仮説検定の誤り
仮説検定が確実性を提供しないことを理解しなければなりません。これは誤りのリスクを伴うものです:
1. 第一種の誤り
この誤りは帰無仮説が真であるにもかかわらず、誤ってそれを棄却する場合に発生します。第一種の誤りの確率は選択されたαレベルで表されます。
2. 第二種の誤り
帰無仮説が偽であるにもかかわらず、それを棄却しない場合、第二種の誤りが発生します。第二種の誤りが起こる確率はβで表されます。
検定の力
検定の力は、帰無仮説が偽である場合にそれを正しく棄却する能力です。サンプルサイズや効果の大きさを増やすことが、検定の力を増加させるのに役立ちます。
結論
仮説検定は、アイデアや理論をテストするための正式な構造を提供する非常に貴重なツールです。確実な証明を提供するわけではありませんが、証拠に基づく意思決定を導くことで、アナリストや科学者が確信を持って結論を導き、予測を行うのを助けます。