「平均値」と「中央値」の違いって?
- どちらも集団の特徴を表すために求める値のこと。
平均値 | データの合計値÷データの個数で求める値。メリットはデータ全体の変化・比較を見るのに向いていること。デメリットは極端なデータがあると、影響を受けてしまうこと。 |
---|---|
中央値 | データを大きさの順に並べたときのちょうど真ん中の値。メリットは極端なデータの影響を受けにくいこと。デメリットはデータ全体の変化・比較を見るのに向かないこと。 |
記事の目次
平均値と中央値の違い
平均値と中央値はどちらも集団の特徴を表すために用いられる数値、つまり代表値だ。「平均」「中央」と似たような言葉がつき、時には値が一致することもある両者だが、本来はまったく別の値を意味している。
求め方
平均値と中央値はまず、求め方が異なる。
平均値の求め方
平均値はデータの合計値を、データの個数で割ることによって計算する。
【例1】テストの点数が以下の場合
データの合計値は540点、データの個数は9なので、平均値は60点(540点÷9人)となる。言い換えるとE さんはちょうど平均点、Aさん~Dさんは平均点以下、Fさん~Iさんは平均点以上ということである。
中央値の求め方
中央値とはデータを大きさの順に並べたとき、ちょうど真ん中にくる値をいう。
【例2】テストの点数が以下の場合(例1と同じ条件)
ちょうど真ん中にくる値は60点のため、中央値はEさんの60点である
平均値や中央値と同様、代表値として用いられるものに最頻値(さいひんち)がある。最頻値とは最も多く現れる値をいう。以下の例を見て理解してほしい。
【例3】テストの点数が以下の場合
この条件のとき、最も多く現れた点数は55点である。よって最頻値は55点といえる。
平均値と中央値のメリット・デメリット
平均値と中央値はどちらが優れているということはなく、それぞれにメリット・デメリットが存在する。
平均値のメリット・デメリット
平均値はデータの合計値と個数から算出するため、すべてのデータを考慮できる。すなわちデータ全体の値の変化を見たり、比較をしたりするのに向いているというメリットがある。
一方で極端なデータがあった場合にはその影響を受けやすいというデメリット(以下で説明)もある。
【例4】テストの点数が以下の場合
データの合計値は420点、データの個数は9なので、平均値は46.6点(420点÷9人)となる。ここで注目したいのはDさんだ。下から4位にもかかわらず、平均点以上となっている。原因はA・B・Cさんが0点という極端な点数を取っていることにある。
すなわちこの状況において、平均値は集団全体の普通や真ん中を示しているとはいえない。平均値が集団の普通・真ん中として機能するのは極端なデータのない、以下のような山の形(=正規分布)となる場合だけである。
中央値のメリット・デメリット
中央値は極端なデータがあっても、その影響を受けにくいというメリット(以下で説明)がある。
一方で中央値は、大小で並べたときにちょうど真ん中にくる値であって、すべてのデータを考慮しているわけではない。よってデータ全体の値の変化を見たり、比較をしたりするのには不向きというデメリットもある。
【例5】テストの点数が以下の場合(例4と同じ条件)
ちょうど中央にくる値はEさんの60点である。A・B・Cさんの0点という極端な点数の影響を排除できることから、この状況で中央値を使えば集団全体の普通や真ん中を示すことができる。
まとめ
平均値 | 中央値 | |
---|---|---|
共通点 | 集団の特徴を表すために用いられる数値(=代表値) | |
メリット | データ全体の値の変化を見たり、比較をしたりするのに向いている | 極端なデータがあっても、その影響を受けにくい |
デメリット | 極端なデータがあった場合にはその影響を受けやすい | データ全体の値の変化を見たり、比較をしたりするのには不向き |