確率変数
導入
確率論と統計学では、確率変数は基本的な概念として機能します。これはさまざまな値を取り、その各値に関連付けられた確率を持つ数量を表します。確率変数を理解することは、確率の研究において重要です。なぜなら、確率変数はランダムな事象を構造化された方法でモデル化および分析するのに役立つからです。
確率変数の定義
確率変数とは、基本的にはサンプル空間の各結果に数値を割り当てる関数です。サンプル空間はランダムな実験のすべての可能な結果の集合です。たとえば、6面サイコロを振る場合、サンプル空間は{1, 2, 3, 4, 5, 6}
です。
確率変数の種類
確率変数は一般的に2つの主要なタイプに分類されます:
- 離散確率変数: これらの変数は限られた数の異なる値を取ります。これの例としては、サイコロを振った結果が挙げられます。これは
1, 2, 3, 4, 5,
または6
のいずれかになります。 - 連続確率変数: これらの変数は無限の可能な値を取ります。たとえば、1日の正確な降水量は任意の非負の実数です。
視覚例: 離散確率変数
コイントスを2回行う単純なランダム実験を考えてみましょう。サンプル空間は以下の通りです:
{HH, HT, TH, TT}
出た表の数を表す確率変数X
を定義します。X
は0, 1, 2の値を取ることができます。
X
の確率分布は次のように視覚化できます:
視覚例: 連続確率変数
連続確率変数の例として、森林のランダムに選ばれた木の高さを表す確率変数Y
を考えてみます。この確率変数は、ある範囲内の任意の値を取ることができます。
Y
の確率分布はしばしば滑らかな曲線として表されます:
曲線の下の任意の2点間の面積は、その範囲内で確率変数が落ちる確率を表します。
確率質量関数 (PMF) と確率密度関数 (PDF)
確率変数は、可能な値に関連する確率を記述する関数によって特徴付けられます。離散確率変数の場合、これは確率質量関数(PMF) によって表されます。連続確率変数には確率密度関数(PDF) が使用されます。
確率質量関数 (PMF)
離散確率変数 X
の PMF は関数 p(x)
で、サンプル空間内の各値 x
についての確率 P(X = x)
を与えます。
確率密度関数 (PDF)
連続確率変数 Y
の PDF は関数 f(y)
で、Y
が区間 [a, b]
に入る確率は、その区間に対する f(y)
の積分で表されます:
P(a ≤ Y ≤ b) = ∫ a b f(y) dy
確率変数の特性
確率変数には、その挙動を要約し理解するのに役立つ特性があります。これには、期待値、分散、および標準偏差が含まれます。
期待値
ある確率変数の期待値または平均は、中心傾向の指標です。PMF p(x)
を持つ離散確率変数 X
の期待値 E(X)
は:
e(x) = Σ x * p(x)
PDF f(y)
を持つ連続確率変数 Y
の期待値 E(Y)
は:
e(y) = ∫ y * f(y) dy
分散と標準偏差
分散は、確率変数の値が平均を中心にどれだけ広がっているかの指標です。X
の分散は次のように与えられます:
Var(X) = E((X - E(X))^2)
標準偏差は分散の平方根であり、確率変数と同じ単位で広がりの指標を示します。
例: 離散確率変数の計算
公正な6面サイコロを振る結果を表す確率変数 Y
を考えます。Y
の値は 1, 2, 3, 4, 5,
および 6
で、それぞれの確率は 1/6
です。
Y
の期待値は次のとおりです:
E(Y) = (1 + 2 + 3 + 4 + 5 + 6) * (1/6) = 3.5
例: 連続確率変数の計算
0
から 3
の範囲で均一分布に従う確率変数 Z
を考えます。PDF は次のように定義されます:
f(z) = 1/3, for 0 ≤ z ≤ 3
Z
の期待値は次のとおりです:
e(z) = ∫ 0 3 z * (1/3) dz
この積分を解くと E(Z) = 1.5
が得られます。
結論
確率変数は確率と統計学の重要な構成要素であり、ランダムな現象を測定し分析する手段を提供します。確率変数の特徴と特性を理解することは、不確実性とランダムさが存在する実世界の問題を広範囲に探求するために必要なツールを提供します。