趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

平均とは平らに均すことです(今更ですが…)

平均とは

いまさら書くまでもないことでしょうが、「平均」の辞書的意味についてまだ書いていなかったので復習しておきましょう。

へいきん【平均】 ①不揃いのないようにすること。ならすこと。②つりあいがとれていること。③〔数〕多くの量または数の中間的な値。また、それを求める演算。中間の意味の取り方によって、相加平均(算術平均)・相乗平均(幾何平均)その他がある。ふつう、相加平均をさす。(広辞苑第六版より抜粋)

参考までに英語辞典の意味ものせましょう。

average (adj) 1. calculated by adding several amounts together, finding a total, and dividing the total by the number of amounts
2. typical or normal
3. ordinary; not special
average (noun) 1. the result of adding several amounts together, finding a total, and dividing the total by the number of amounts.
2. a level which is usual (Oxford Advanced Learner's Dictionary 9th edition、抜粋)

どちらも、数学的な意味としては、相加平均(データの総和をデータ数で割る)の意味であるとしています。そのほかに、広辞苑では、不揃いがない、つりあいがとれている、などの意味があります。OALDでは、typical、ordinaryなどの意味、これは「平均的」という日本語の意味とよく対応していますね。

「平均」を訓読みしてみよう

平均は訓読みすると、「平らに均す(ならす)」です。漢字辞典をひくと「平」も「ならす」と読めるらしいのです。さきほどの語釈で言うと、不揃いがない状態にすることと対応しますね。
この意味での「平均」は、小学生の割り算(ある量を等分する計算)と同じように理解できるのではないかと思います。「ジュースを配りたいけど、いきなりコップに注いでいくと多い少ないができるから、割り算して一人分を計算してから注ぎましょう」みたいな。図解してみると、たとえばこんなデータでは。

でこぼこしていて不揃いですね。この位置でそろえたい! というところに線を引いてみましょう。

赤い破線の位置で「平らに均したい」ので、はみ出している部分(ピンク色=偏差が正の値)を、へこんでいる部分(水色=偏差が負の値)に移動してやればいいわけです。が、水色に比べて、ちょっとピンクが多すぎますね。均す位置をもう少し上にしましょう。

ん? こんどは水色が多くなり過ぎましたね。ピンクの部分だけでは、へこんでいる部分が全部うまりそうにありません。もう一度。

こんどはうまくいきそうです。はみ出している部分(ピンク色=偏差が正の値)と、へこんでいる部分(水色=偏差が負の値)がちょうど同じになると、平らに均すことができますね。

偏差の総和が0になればいいのさ

カッコで書き加えたように、はみ出している部分(偏差が正の値)と、へこんでいる部分(偏差が負の値)が等しくなると言うことは、正の偏差の合計と、負の偏差の合計を足すと、ちょうど0になるということです。偏差の総和が0になるのは、当然なんですね。というか、平均(相加平均)というのは偏差の総和が0になるような値なんですね。

つりあいがとれているね

正の偏差の合計と負の偏差の合計とで、つりあいがとれている、という解釈もできますね。でも、「つりあいがとれている」という意味で平均を考える時には、もう一つ別の図で考えたほうがいいかもしれません。そして、その図の方が、データの「分布」という考え方に、より親和的であるように思います。
少々長くなったので、その話は次回に回しましょう。

おまけ

この記事で使った3つの図は Excel で作りました。興味のある方は、次のリンクからお使いください。
平らに均そう.xlsx