趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

シグマくんのはなし #31

カイ二乗統計量の計算

前回までに、クロス表のカイ二乗統計量の計算について書いてきました。ちょっと復習しておきましょう。

今回は、この表を計算式に書き換えていきます。本来は、e を計算する手順も式に書き換えてみたいのですが、ちょっと難しそうな気がするので、今回はスルーします。x と e の表ができている状態からスタートします。

(1) x から e を引く

引き算ですから、 x - eでOKです。が、1つのセルだけやるのではなくて、全部のセルで同じような計算をするので、x や e には添え字が必要です。全部を合計するために、セルに背番号をつけるという意味でも必要ですが、ちゃんと対応したセルどうして引き算するためにも必要です。どういうことかというと、左上のセルの度数と、左上のセルの期待度数を使って引き算をするのであって、左上のセルの度数と右上のセルの期待度数を使うのは変ですよね。「同じ位置のセル」どうしで計算をするのだ、ということを明示する意味でも、添え字が必要なんです。ということで、 x_{ij} - e_{ij}となります。これで、緑色の表が計算できました。

(2) それを二乗する

二乗しますから、 (x_{ij} - e_{ij})^2 です。引き算した結果を2乗するので、カッコが必要ですね。ここまでで、青色の表が計算できました。

(3) それを e で割る

割り算は分数で表現します。ですから、 \frac{(x_{ij} - e_{ij})^2}{e_{ij}} です。ここも添え字が重要ですね。これで、オレンジ色の表までたどり着きました。

(4) すべてのセルの分を合計する

合計するので、ここでシグマくんの出番です。度数の合計を算出したときのように、たてよこシグマくんを使います。したがって、
 \displaystyle \chi^2 = \sum_{i=1}^n \sum_{j=1}^m \frac{(x_{ij} - e_{ij})^2}{e_{ij}}
となります。合計した値は、カイ二乗統計量ですから、式の最初に  \chi^2 をおきました。ローマ字の x によく似ていますが、ギリシア文字の「カイ」という字(小文字)です。「カイ二乗」ですから、右肩に小さい「2」がのっかっています。
これで、教科書に登場する、カイ二乗統計量の計算式ができました。かなりごつい形をした式ですが、表と対応させながら、順に組み立てていくと、理解しやすいのではないかと思います。

ひとまずここまで

ずいぶんと書き散らかしてきた「シグマくんのはなし」ですが、ひとまずここまでで終わります。31回分をもう一度見直して、整理して、何らかの形にまとめる予定です。
お読みいただいた方々、ありがとうございました。次回からはまた別の話題で、書いてまいります。