[データ入門]さまざまな代表値(3) 最大値・最小値

最大値・最小値

データの代表値として忘れてはならないのが最大値最小値です。

データの中で最も大きな値を最大値、最も小さな値を最小値と呼びます。

意味が単純で感覚的につかみやすく、これといった計算もなく求められるため、広告宣伝等様々な場面で目にする機会があると思います。

意味が感覚的につかみやすすぎるが故にどう使っていいのか分からないということもあるでしょう。

たとえば、あるデータの最小値が1であったとき、そのデータに含まれる値はすべて正であることがわかります。
これは実はデータ解析においてとても大切なことです。

統計処理の中にはデータの性質によっては用いることができないものが幾つかあります。
たとえば以前紹介した幾何平均は、データがすべて正であるときしか使えないのです。
「データを知るために行う処理」がそのデータに用いることが適切なのか、まずはそのチェックから始めなくてはなりません。

範囲(レンジ)

そしてもう一つ、最大値と最小値から求められる範囲(レンジ)という代表値があります。
範囲は最大値から最小値を引いた値で簡易的にデータの散らばりを把握するのに役立ちます。
たとえば次のテストの採点データを見てみましょう。

A B C D E F 平均
国語 77 82 87 83 87 79 82.5
数学 71 60 73 63 86 82 72.5
148 142 160 146 173 161 155

国語の最高点(最大値)は\(87\)点、最低点(最小値)は\(77\)点なので、範囲は\(87-77=10\)点。
数学の最高点は\(86\)点、最低点は\(60\)点なので、範囲は\(86-60=26\)点。
よって、数学の方がより散らばりが大きいと考えられます。
そのため、この二教科の合計点で順位を付けた場合、数学が得意な生徒の方がより上位になることが予想されます。

上の例のデータでEさんがいなかった場合、国語と数学のテストの点数データの範囲はそれぞれどう変化するでしょう?
データ入門7
{{quiz}} {{maxScore}}問中{{userScore}}問正解!
{{title}}
{{image}}
{{content}}

ライター:H.I