趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

測定値の分散とピタゴラスの関係

誤差の分散を考える

前回は古典的テスト理論について書きました。この理論では、誤差を、「系統誤差」と「偶然誤差」に分けて考えていました。「偶然誤差」の方は「たくさん集めたら結局打ち消し合って0になるんじゃね?」ということで、合計=0、よって平均=0と考えたのでした。その結果、多くのテスト問題の平均的な得点は、テストを受けた個人の真の得点(真の力)を表していると考えられます。
では、誤差の分散はどうなる? というのが今回の話です。
平均が0なんだから、分散も0でしょ! 決まり!
と考えるのは早合点すぎますね。平均が0になるのは、「プラス方向の誤差とマイナス方向の誤差がきっと打ち消し合うだろう」と考えているからです。一方、分散0になるときというのは、「ぜーんぶ同じ値で、散らばりなんてぜーんぜんないじゃん!」というときです。この違い、理解してもらえますか?
5回分のテストで考えましょう。

  • 誤差が{1,1,1,1,1}(ぜんぶ1!?):誤差の平均は1、分散は0。これは偶然誤差ではなくて系統誤差ですね。いつも1kgだけ大きい値が出る体重計って好きですか? 直した方がいいですよね。
  • 誤差が{0,0,0,0,0}(ぜんぶ0!?):誤差の平均は0、分散は0。誤差がいつも0なのでとても信頼できる測定機器ですね。心理学の概念も(幸福度とか、自己肯定感とか、エトセトラ)こんなふうに測れたら心理学は終わりです。が、ありえないと思いますね。だってこれ、個人差を全否定してますからね(5回分、というのを5人分、に読み替えたらわかりますよね。そういう意味では、最初の例も個人差全否定です。)。
  • 誤差が{-1, 2, 0, -4, 3}(誤差がばらついた!):誤差の平均は0、分散は( (-1)^2+2^2+0^2+(-4)^2+3^2=30, 30 \div 5 = 6)と計算して6です。

これです。この3つ目の例が、テスト理論が想定しているものです。

分散の計算式

分散の計算式は、得点から平均値を引いて(これを偏差といいます)、それを2乗したものを平均します。ちょっと式がごつくなりますが、こんな感じ。
 \displaystyle V(X) = \frac{1}{n} \sum_{i=1}^n (X_i - \bar X)^2
これを展開します。まずX=t+eです。
 \displaystyle  = \frac1n \sum ( (t_i+e_i) - (\bar t + \bar e))^2
次にtとeの順序を入れ替えておきます。
 \displaystyle = \frac1n \sum ( (t_i - \bar t) + (e_i - \bar e))^2
2乗を展開しましょう。
 \displaystyle = \frac1n \sum ( (t_i-\bar t)^2 + 2(t_i-\bar t)(e_i-\bar e) + (e_i-\bar e)^2)
総和記号を3つに分割しましょう。
 \displaystyle = \frac1n \sum (t_i-\bar t)^2 + \frac1n \sum 2(t_i-\bar t)(e_i-\bar e) + \frac1n \sum (e_i-\bar e)^2
第1項と第3項はそれぞれ、真の得点と誤差の分散ですから、
 \displaystyle = V(t) + \frac1n \sum 2(t_i-\bar t)(e_i-\bar e) + V(e)

第2項って?

問題は第2項なんですが、これは真の得点と誤差との「共分散」です。要するに、真の得点と誤差との「関連の大きさ」です。
ところで、誤差って真の得点と関連するのでしょうか?
しません。
だって、ここで扱っている誤差は「偶然誤差」です。「たくさん集めたら結局打ち消し合って0になる」ようなものであり、測定したい対象とは本来何の関係もないものです。つまり、真の得点と誤差とは「関連がない」、よって、相関係数は0である、すなわち、共分散は0である、というのが、テスト理論の考え方です。
ということで、結局、最後の式は次のようになるのです。
 \displaystyle V(X) = V(t)  + V(e)

2乗=2乗+2乗?

最後の式をよく見てみましょう。

  • V(X):測定値の分散です。分散は、平均値との偏差の2乗の平均です。平均するのは(つまりnで割るのは)データサイズの影響を消すためであって、本質的には偏差の2乗和です。
  • V(t):真の得点の分散です。
  • V(e):誤差の分散です。

つまり、測定値の分散は、真の得点の分散と誤差の分散に、きれいに分解できる、というのが、古典的テスト理論が言っていることです。
え? これって、何かに似てませんか? ほら、あれです。何かの2乗が、何かの2乗と何かの2乗の和になるっていう。
ja.wikipedia.org
よく知られているのは平面図形(2次元)のこの定理なんだけど、同じ式は3次元でも4次元以上でも成り立ちます(4次元以上を図にするのは無理ですけどね)。
つまり、です。
測定値の分散っていうのは、「斜辺」なんですよ。(って意味わかるかなあ・・・)