散布度(dispersion)
散布度
『散布度』とは、データのばらつきや広がりを示す指標になります。
データがどれだけ中心からばらついているかを表し、データの分布の広がりや集中度を理解するのに役立ちます。
散布度の主な指標には、『範囲』、『分散』、『標準偏差』などがあります。
- 範囲(range)
範囲とは、データの最大値と最小値の差を示す指標になります。
例えば、テスト得点が以下のような10人の生徒の場合、
60、70、70、80、80、80、90、90、90、100
範囲は、最大値−最小値 = 100 − 60 = 40点になります。
このように、範囲は、単純で直感的に理解しやすく、データ全体の広がりを捉えるのに役立ちます。
しかし、外れ値(極端に大きいまたは小さい値)に影響を受けやすいという欠点があります。- 分散(variance)
分散とは、データの各値が平均値からどれだけ離れているかを示す指標になります。
分散は、各データの値と『平均値』の差を二乗して平均した値です。例えば、テスト得点が以下のような10人の生徒の場合、
60、70、70、80、80、80、90、90、90、100
- 分散では、まず平均値を計算します。
- 平均値 =(60+70+70+80+80+80+90+90+90+100)/ 10 = 800 / 10 = 80
- 次に、各データの値と平均値の差を二乗して、その平均を計算します。
- 分散 = ((60−80)2+(70−80)2×2+(80−80)2×3+(90−80)2×3+(100−80)2) / 10 =1300 / 10 = 130
分散は、130点になります。
このように、分散は、値が大きいほど、データが平均から離れて分散していることを意味します。
また、標準偏差を計算するために使用されることが多く、直接的に使用されることは少ない傾向があります。- 分散では、まず平均値を計算します。
- 標準偏差(SD:standard deviation)
標準偏差とは、データのばらつきの大きさを示す指標です。
標準偏差は分散の平方根の値になります。例えば、テスト得点が以下のような10人の生徒の場合、
60、70、70、80、80、80、90、90、90、100
標準偏差は、√130 ≒ 11.4点になります。
このように標準偏差は、元の単位と同じデータの単位(例えば、点数ならば点数)で示されるため、直感的に理解しやすく、広く使用されています。
また、実務や研究でよく使用される指標であり、データのばらつきを評価する際に一般的に使用されています。
参考・引用文献
\この記事を書いた人/
臨床心理士・公認心理師
上岡 晶
Ueoka Sho
精神科・心療内科での勤務を経て、2023年から「オンラインカウンセリングおはぎ」を開業しました。私のカウンセリングを受けてくださる方が少しでも望まれる生活を送れるように、一緒に歩んでいきたいと考えています。