趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

シグマくんのはなし #05

前回、総和記号を使って平均を求めるという計算についてお話しました。ここで、平均の意味について少し確認をしておきたいと思います。なお、ここで扱うのは「算術平均」あるいは「相加平均」と呼ばれているものです。その他の平均(相乗平均または幾何平均、調和平均、トリム平均など)については取り扱いません。

「平均」の復習

平均というのは2つのイメージで理解することができます。どちらが良いどちらが悪いという話ではありません。どちらの理解もそれなりに意味があり、どちらの理解も重要だと思います。まずわかりやすいと感じられる方で理解し、その後でもう一方の方も考えて、なるほどこのような見方もできるんだと、二通りの考え方で理解できるようにしておくといいのではないかと思います。

平均とは平らに均すこと

一つ目は、平均という字の通り、平らに均した値としての平均です。
例えば、コップにジュースが注いであります。1つ目のコップには2の目盛りまで、2つ目のコップには6の目盛りまで、3つ目のコップには7の目盛りまでジュースが入っています。これを、3人の子どもを呼んでどうぞと言うと、当然みんな多いのを欲しがりますよね。それでは喧嘩になるので、平等に分けましょうという話になります。こういう時、皆さんならどうするでしょうか。そもそも初めから平等になるように注ぎます、という方がほとんどだとは思いますが。

多い少ないの凸凹をなくそう

ジュースの量が多いコップ、つまり7や6まで入っているコップから、2までしか入っていないコップに少しだけ分けてあげる、というような発想をするかもしれません。これが平均するという計算の基本的な考え方ですね。多いところから少ないところへ移動する。図にするとこんな感じでしょうか。

そうするとだんだん3つが均等になってきます。

集めて配り直そう

これはこれで、結構面倒なので、一度全部回収をして、大きな器に全部ジュースを集めて、ジュースがどれくらいあるかを測ったうえで、それを3で割って、その容量になるように注いでいくという方法もあります。実際にこんなことをするかどうかは分かりませんけども、計算としてはそのような考え方ができるわけです。そうすると、同じような目盛りのついた、もっと背の高いコップを用意して全部まとめてやると、ちょうど2+6+7で15の目盛りまでジュースが入るはずです。だったら、どのコップにも目盛り5まで入るように分けてやればいいとわかるのですね。こんなイメージでしょうか。

これが平均の一つ目の考え方です。つまり、多いところと少ないところの差をなくす、凸凹をなくして平らに均す、集めて均等に配り直す、というイメージで平均というのを捉えることができます。小さい子供には割と分かりやすいのではないかと思います。

平均とは重心を求めること

二つ目は、重心としての平均という考え方です。
小学校か中学校の理科の授業で、てんびんに重りをぶら下げて釣り合いを取るという実験をしたことはないでしょうか。こんな感じのです。(器具の名称としては「実験用てこ」と呼ぶようです。)
www.monotaro.com
今、同じ間隔で重りを下げられるようになっていて、番号がつけてあるとします。そこに、2のところに重りを1個、6のところにも1個、7のところにも1個、3つの重りをぶら下げます。ではどこかの穴に重心を置いて、つまり、どこかの穴にひもを通してぶら下げたときに、ちょうど釣り合うようにしてくださいという課題を出します。ひもを通す場所を、理科の授業では「支点」と呼ぶのだと思いますが、統計学として考えると、その「支点」の位置が「重心」であり、「平均」になるのです。

そうすると、2や7を支点(=重心=平均)にはしないでしょう。重りの下がっている3か所のだいたい真ん中あたり、4か5ですね、この辺りを支点とすると、ちょうど釣り合いそうだなという予想ができるわけですね。実際、この重りの場合は5のところに支点をおくと釣り合います。
これはどう考えればいいかといいますと、2と6と7を足して3で割る確かに5になるんですが、ここでは、重心からの距離を考える、という方法をとってみましょう。

重心は5で、2の位置にある重りは、重心から左側に3目盛りぶん離れています。これを左3と表しましょう。6と7の位置にある重りは、それぞれ重心より右に1目盛り、右に2目盛り離れていますから、それぞれ右1、右2と表すことにしましょう。右左を比べてみると、左側は左3、右側は右1と右2で、合わせて右3ですね。このように、左右で、重心からの距離の合計が等しくなるようにするのです。
ここでは示していませんが、重心をずらすと、距離の合計が等しくなくなることを確かめてみてください。

統計学でより重要なのは「重心」

両方とも重要ですよと言っておきながら、最後に違うことを話すのですが、統計学でより重要なのは「重心」としての平均という考え方だと思います。それぞれのデータが、平均からどれだけ離れているのか、あるいは平均にどれだけ近いのか。データには平均より小さいものと大きいものがあるので、平均との差を計算するとプラスになったりマイナスになったりするのですが、重要なのは「距離」なのですね。上に書いた天秤の話で、天秤を左右逆にしても(あるいは裏側から見ても)、考えていることは同じです。左右が逆になるだけですからね。統計もよく似ていて、平均からどっち側に(プラス側、マイナス側)に離れているかよりも、どれだけ離れているか、が重要なのです。