平均、中央値、最頻値
統計の世界では、データを理解することが重要な要素の一つです。大量の数値に直面したときには、それらの数値を1つの代表的な値に要約する方法があると便利です。このデータの要約は、我々に一般的なパターンを理解するのを助けます。中心傾向の3つの最も一般的な指標は、平均、中央値、最頻値です。これらの指標は、データの異なる側面を要約する単一の数値でデータセットを説明するのに役立ちます。
意味
平均は、多くの人が「平均値」と呼んでいるものです。数値の平均について話すとき、全ての値を合計してから、値の数で割ります。平均は、データのバランスや中心点を提供します。
平均の計算
平均を計算するには、この式に従ってください:
平均 = (全てのデータ値の合計) / (データ値の数)
例えば、データセット:2, 4, 6, 8, 10 を考えてみましょう。
ステップ1: 全ての数を合計します:
2 + 4 + 6 + 8 + 10 = 30
ステップ2: 値の数(この場合は5)で割ります:
平均 = 30 / 5 = 6
したがって、データセットの平均は6です。
平均の視覚化
各数値をスケール上の均等に広がった重りと想像してください。平均はスケールが平衡する点です。
中央値
中央値は、順位を付けたデータセットの中央の値です。この数値より大きい数が半分、小さい数が半分になります。中央値は、特に外れ値を含んだり偏ったデータセットの場合に役立ちます。なぜなら、中央値は平均のように極端な値に影響を受けないからです。
中央値の計算
中央値を見つけるには:
- データ値を小さい順に並べます。
- データ値の数が奇数の場合、中央値は中央の値です。
- データ値の数が偶数の場合、中央値は2つの中央の値の平均です。
奇数の値の例:
データセット:3, 1, 9, 12, 7
ステップ1: データをこの順に並べます:1, 3, 7, 9, 12
ステップ2: 中央の値を特定します:7
偶数の値の例:
データセット:8, 3, 5, 10
ステップ1: データをこの順に並べます:3, 5, 8, 10
ステップ2: 2つの中央の数(5と8)の平均を求めます:
中央値 = (5 + 8) / 2 = 6.5
したがって、データセットの値が奇数の時には、中央値は実際のデータポイントの1つですが、偶数の時には、中央値は2つのデータポイントの間にあります。
中央値の視覚化
中央値がデータをどのように2つの等しい部分に分割するかを理解するのに役立つ例です。
モード
最頻値は、データセットの中で最も頻繁に出現する値です。データのセットには1つの最頻値がある場合もあれば、複数の最頻値がある場合もあります。また、最頻値がない場合もあります。最頻値は、データが数値でない場合、カテゴリーデータを要約する良い方法になることがあります。
最頻値を見つける
最頻値を見つけるには、最も頻繁に現れる数を探してください。
例えば、データセット:4, 5, 4, 6, 7, 4, 9,
数値4は最も頻繁に出現するため、最頻値は4です。
いくつかのデータセットでは、2つ以上の最頻値が見つかることがあります:
データセット:2, 3, 5, 3, 5, 8
3と5の両方が2回現れ、他のどの値よりも頻繁に出現するため、2つの最頻値があります:3と5。このタイプのデータセットは二峰性と呼ばれます。
数字が繰り返されない場合は、データセットには最頻値がありません。
最頻値の視覚化
この図は、最も頻繁に現れる値を示すことで、最頻値を強調しています。
平均、中央値、最頻値の比較
これらの指標はデータについて異なる情報を提供し、どの指標を選ぶかはデータセットの特定の特性に依存します。
- 平均:極端な値(外れ値)が含まれないデータセットや偏りのないデータセットに最適です。データセット内のすべての値を考慮します。
- 中央値:偏っているデータセットや外れ値がある場合に有用です。中央の位置のみを考慮し、実際の値は考慮しません。
- 最頻値:データセット内の最も一般的なアイテムを識別するのに便利で、カテゴリーデータに効果的です。
実用例
10人の学生のクラスのテストマークを見ていると想像してください:75, 80, 90, 100, 85, 95, 70, 60, 85, 100。これらのマークの平均、中央値、最頻値を見つけましょう。
平均:
合計: 75 + 80 + 90 + 100 + 85 + 95 + 70 + 60 + 85 + 100 = 840 学生の数: 10 平均 = 840 / 10 = 84
平均のマークは84です。
中央値:
順番に並べる:60, 70, 75, 80, 85, 85, 90, 95, 100, 100
学生の数は偶数なので、中央のマーク(85, 85)の平均を求めます:
中央値 = (85 + 85) / 2 = 85
平均のマークは85です。
最頻値:
数値85と100は両方とも2回出現し、最頻値です。
結論
中心傾向の指標 - 平均、中央値、最頻値 - は、データセットに関する重要な洞察を提供します。これらの指標を理解することによって、多くのデータを要約し理解することができます。各指標はそれぞれの長所を持ち、特定の状況においてより適しており、統計分析で正確な結論を導き出すのに役立ちます。