平均を丸めたら:続きの続き
前回までの式変形を復習しましょう。分身の術を使って、この形までたどり着きました。
では、3つのシグマくんを順にみていきましょう。まず3つ目から。
3つ目のシグマくんは「エヌがくれの術」
3つ目はこんな形をしていますね。
シグマくんの中にあるは、正しい平均値とのずれ()を2乗したものですから、添え字が変わってもいつも同じ値です。こういうときは「エヌがくれの術」が使えるのでした。したがって、
はい、簡単でしたね。
2つ目のシグマくんはまず「まとめ掛けの術」
2つ目はこんな形です。
ごちゃごちゃしていますが、とは、あとからまとめて掛け算できる数です。「まとめ掛けの術」を使って、シグマくんの前に出してしまいましょう。したがって、
はい、ちょっといい感じになりましたね。ここで「あれ」が使えます。何かというと、「偏差の合計は0、偏差の平均も0」が使えます。最後にくっついているは0になるのです。そうすると、
なんと。0になりました。消えました。
え? ほんとに? と思ってしまった方のために、数値の表を貼っておきます。よーくながめて、納得してください。
1つ目のシグマくんは…?
残ったのは1つ目のシグマくんです。この形、どこかで見た覚えがありますよね。余計なカッコを1組はずすと、
データから平均を引いて(つまり「偏差」を計算して)、それを2乗して、合計してnで割る。そうです。これは「分散の定義式」ですね。正しい平均値を使って計算した正しい分散です。ですから、分散の記号で置き換えてしまいましょう。
まとめると
では、ここまでを整理してみましょう。今回の冒頭に書いた式は、こんなふうに簡単になりました。
つまり、こういうことです。
丸めた平均値を使って計算した分散の近似値は、正しく計算された分散の値に比べて、「正しい平均値と丸めた平均値との差()」の2乗だけ、大きくなる。
これ、必ず「大きくなる」のがポイントです。正しい平均値を使った時に、分散は(あらゆる近似値と比較して)最も小さい。平均値がずれればずれるほど、「ズレた分の2乗だけ大きくなる」のです。