趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

シグマくんのはなし #13

分散公式を導く:つづきのつづき

前回までで、分散公式を展開し、3つのシグマくんに分身させ、さらに、3つ目のシグマくんを、エヌがくれの術で簡単にしました。今回は、残った2つ目のシグマくんを、簡単な形に変形していきます。2つめのシグマくんはこんなでした。

式の変形を進める前に、いったん復習タイムです。

式変形(分配法則)

分配法則(たぶん)という名前で式の変形を習ったことを覚えているでしょうか。こんなやつです。
 a(x+y) = ax + ay
反対方向に変形するやつもありましたね。こんなやつ。
 bx+by+bz = b(x+y+z)
今回使うのはこっちです。xにもyにもzにも、bという同じ数を掛けているときには、その数でくくって、カッコの外に出すことができますよ、ということでした。そうです、「まとめ掛けの術」で使ったやつです。
2つ目のシグマくんにはこの術が使えます。式がちょっと入り組んでいるので、順序を入れ替えて、見やすくしていきましょう。

左がもともとの式です。見ると、「-2」と「6」がどの式にもあります。この2つが、上の式変形復習でのabにあたる数で、カッコの外に出せる数です。見やすくするために、順序を入れ替えたのが右です。
2つめのシグマくんがやろうとしていることは、この5つの(n個の)式を合計することです。でも、赤と青で示した「-2\times 6」は、全部同じなので、合計してから1回掛け算すればいいよね、というのが「まとめ掛けの術」でした。ということで、(b)はさらに次の(c)に変形できます。

数式だとこんな感じになっていますよ。(上の図では\frac1nを省略していますのでご注意を!)
 \displaystyle \frac1n \sum_{i=1}^n \Big( -2 x_i \bar x\Big) = \frac{-2 \bar x}n \sum_{i=1}^n x_i
なんだ、結局シグマくん残っているんじゃないか・・・
と、思うのですが、あきらめるのはまだ早いのです。

式変形(平均ってなんだっけ)

またまた復習タイムです。平均ってなんでしたっけ?
いまさら何を? という感じなんですが、思い出してください。こういう式で求めるのでした。
 \displaystyle 平均値 =\frac15 \times (1+4+7+8+10)=6
一般的な数式で書くと、こうでした。
 \displaystyle \bar x= \frac1n \sum_{i=1}^n x_i
この式の、両辺に(つまり、=の左側にも右側にも) nを掛けたら、こうなります。
 \displaystyle \begin{aligned} \bar x &= \frac1n \sum_{i=1}^n x_i \\
n \times \bar x &= n \times \frac1n \sum_{i=1}^n x_i \\
n \bar x &=  \sum_{i=1}^n x_i \end{aligned}
これは、平均値をn倍したものと、データの合計が等しい、という意味ですね。ということは、

 \displaystyle \sum_{i=1}^n x_iは、 n \bar xと書き換えて良い

ということです。では、これを2つ目のシグマくん(c)に適用しましょう。

ついに変形が完成

「平均値をn倍したものとデータの合計は等しい」という書き換えワザを用いると、2つ目のシグマくんは、図の一番右のようになります。(注:数値の表では、nで割るという計算を書いていません。)

ほら、ずいぶん簡単になったでしょう。ここまでくれば、あとは簡単。nを約分しましょう。\bar xが2つ掛け算してあるので、\bar x^2に書き換えましょう。数式でまとめると、
 \displaystyle \frac1n \sum_{i=1}^n \Big(-2 x_i \bar x\Big) = 
\frac{-2 \bar x}n \sum_{i=1}^n x_i = \frac{-2 \bar x n \bar x}{n} = -2 \bar x^2
となりました。

いよいよ

長くなったので、最後のまとめは次回に回します。いよいよ、分散公式が完成します。