分散公式を導く:つづき
前回は、分散の定義式を展開し、シグマくん「分身の術」を使うところまでをお話しました。前回までの式変形を整理しておきましょう。
青い数字は平均値、赤い数字は展開の途中で出てきたもので、データの数値とは区別しましょう。
では、式変形を続けていきましょう。
3つ目のシグマくんを変身させよう
3つ目のシグマくんに注目します。3つ目だけ取り出してみましょう。
一番上の数式部分を見ると、シグマくんの中にはが入っています。という字が使われていると、「あ、変数ね」と思ってしまいますね。でも、その下に示しているように、はデータの平均値で(もちろんデータが変われば変わるので、その意味では変数なんですが)、変化しない値と同じように扱えます。
そう言われてもなんか不安、という方は、に、添え字がついていないことに注目してください。以前にお話したように、添え字はデータの背番号ともいうべきもので、1つ1つのデータを区別するためのものでした。それがついていない、ということは、添え字が変わっても、の値が変わることはない、と考えていいのです。
というわけで、3つ目のシグマくんは、を単に回足す計算をしているだけですから、掛け算に直せます。「エヌがくれの術」ですね。次のように書き換えられます。
斜体になっているのは、データの個数です。ここではで考えています。数式と照らし合わせてください。
シグマくんの前にがありますから、最後はを約分して、だけになりました。すごい!
最後の強敵は2つ目のシグマくん
ということで、残ったのは2つ目のシグマくんです。
このシグマくんをどう扱ったらいいのか、私は過去にさんざん悩みました。いまから考えると、「なんでそんなことがわからなかったのかなあ~~」と思うのですが、当時は真剣だったんですね。
わかってみれば簡単(だと思う)なのですが、当時は、やはり具体的な数値に置き換えないと納得できなかったのです。
次回はこの2つめのシグマくんを、びっくりするほど簡単に変形します。