期待値と分散
はじめに
確率と統計の世界では、ランダムな出来事がどのように振る舞うかを理解することが重要です。これらの振る舞いを理解するのに役立つ基本的な概念には「期待値」と「分散」があります。これらの概念は、ランダム変数、つまりランダムな出来事の数値的な結果である変数の特性を要約することを可能にします。
期待値: 期待値
期待値は、E(X)
として表記されることが多い確率の中心的な概念です。これはランダム実験を何度も繰り返したときに予想される平均的な結果を表しています。これは、ランダム変数のすべての可能な値の「加重平均」として考えることができ、各可能な値はその発生確率に応じて重み付けされます。
整数値のランダム変数X
の期待値を計算するには、次の式を使用します:
E(X) = Σ [x * P(x)]
ここで、x
はX
の各可能な値を表し、P(x)
はX
がx
に等しい確率です。連続ランダム変数の場合、この式には総和の代わりに積分が含まれます。
例1: 公平なサイコロを投げる
公平な6面サイコロを投げる簡単な例を考えてみましょう。ランダム変数X
はサイコロの出る目を表し、その可能な値は1, 2, 3, 4, 5, 6で、それぞれの確率は1/6
です。このランダム変数の期待値は次のように計算されます:
E(X) = 1 * (1/6) + 2 * (1/6) + 3 * (1/6) + 4 * (1/6) + 5 * (1/6) + 6 * (1/6)
これを解くと、期待値は次のようになります:
E(X) = 3.5
サイコロが正確に3.5を示すとは期待できませんが、この値は多数のサイコロを振るときに予想される「平均」結果を表しています。
例2: 連続ランダム変数の期待値
連続ランダム変数の場合、期待値は積分を用いて計算されます。ランダム変数X
が確率密度関数(PDF)f(x)
を持つとしましょう。期待値は次の式で与えられます:
E(X) = ∫ x * f(x) dx
X
が区間[a, b]上で一様分布に従うと仮定します。PDFはf(x) = 1 / (b - a)
です。期待値は次の通りです:
E(X) = ∫ (x / (ba)) dx, from a to b
これにより次の結果が得られます:
E(X) = (b + a) / 2
分散: 変動性の測定
期待値はポイント推定を提供しますが、この平均値の周りの変動がどれくらいあるかは教えてくれません。分散はランダム変数の可能な値のこの広がりや変動性の測定値です。
ランダム変数X
の分散は、Var(X)
またはσ²
で表され、期待値からのX
の二乗偏差の期待値として定義されます。分散の式は次の通りです:
Var(X) = E[(X - E(X))²]
この式を分解してみましょう:
- まず、期待値
E(X)
を計算します。 - 次に、
E(X)
から各値x_i
の偏差を見つけます。これはx_i - E(X)
です。 - これらの偏差を二乗し、非負にします。
- 各二乗偏差にその確率
P(x_i)
を掛けます。 - これらの重み付けされた二乗偏差を合計して
Var(X)
を得ます。
例3: サイコロを振る分散
前述の公平なサイコロを振る例を用いて、分散を求めてみましょう。
E(X) = 3.5
を思い出してください。分散は次のように計算されます:
Var(X) = (1 - 3.5)² * (1/6) + (2 - 3.5)² * (1/6) + ... + (6 - 3.5)² * (1/6)
計算すると次のようになります:
Var(X) = 17.5 / 6 ≈ 2.92
この分散値は、期待値3.5の周りでサイコロの出る目がどのくらい「散らばっている」かを測定します。
例4: 連続ランダム変数の分散
連続ランダム変数の場合、分散は次の通りで与えられます:
Var(X) = ∫ (x - E(X))² * f(x) dx
X
が前の例のように一様分布していると仮定すると、E(X) = (b+a)/2
が既に見つかっています。分散は次の通りです:
Var(X) = ∫ [(x - (b+a)/2)² * f(x)] dx, from a to b
期待値と分散の特性
期待値の特性
- 線形性: 期待演算子は線形であり、定数
a
およびb
があるとき、E(aX + bY) = aE(X) + bE(Y)
であり、ここでX
とY
はランダム変数です。 - 定数の期待値: 定数
c
の場合、E(c) = c
となります。 - ランダム変数の和:
X
とY
がランダム変数である場合、E(X+Y) = E(X) + E(Y)
となります。
分散の特性
- 定数の分散: 定数の分散は0です。その値は変わらないからです。
- 加法性:
X
とY
が独立したランダム変数である場合、Var(X+Y) = Var(X) + Var(Y)
- スケーリング:
Var(aX) = a²Var(X)
であり、a
は定数です。
結論
期待値と分散は確率と統計の基本的な概念です。これらはランダム変数を要約し理解する方法を提供します。期待値は「平均」結果を示し、分散はこの平均から予想される変動の程度を示します。これらの概念を習得することは、確率や統計に関連する分野を深く掘り下げたいと考える人にとって重要です。