趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

標準偏差が書かれていないことの何が問題なのか

テストの平均点

小杉(2023)の中に、次のような注があります。

私の娘が通っていた中学校では,定期試験の結果を表にまとめたプリントを親に見せてくれるのですが,本人の素点と本人の平均点しか表示されておらず,まったく無意味な数値の羅列でした。(小杉 2023 「心理データ解析基礎」p.85)

統計を学んだことがある人であれば、「そうだよね~」と同意してくださると思うのですが、そうでない方は「なんで?」と思われるかもしれません。「学年の平均点」や「クラスの平均点」ではなく「本人の平均点」というところがなかなか興味深いですね。「他人と比べるんじゃねえぞ!」ということかしら? 
ちなみに、放送大学の「授業科目一覧」には、毎回「過去の単位認定試験平均点」が掲載されていますが、やはり平均点のみで、標準偏差の記述はありません。受験者数もわかりません。抗議しておくべきだったかしら?

シミュレーション

平均点だけわかっていて、標準偏差がわからないのは、何が問題なのでしょう。
それは一言でいうと、「分布がわからない」ことです。「分布」ってな~に? という質問があるかもしれないので、別の言葉でいうと、「何点くらいが何人くらいいたのかわからない」ことです。
それが何? という疑問もあるかもしれません。でも、「クラスの中で、自分はよくできた方なのだなあ」、とか、「平均点より下だとはわかったけど、自分、めっちゃできてないっていうことやん!」、とか、知りたくありませんか?
というわけで、平均点だけの情報だと、実際の話、「何点くらいが何人くらいいたのかわからない」ということを、簡単にシミュレーションしてみます。
シミュレーションをうんと簡単にするために、次の条件で行います。

  • テストを受けた人は10人。
  • 平均点は70点。
  • 得点は10点きざみで、中途半端な点数はついていない。

実際には、同じテストを受ける人はもっと多いかもしれませんし、中途半端な点数(73点とか、81点とか)がついても何も不思議はありません。あくまでも、「(私の能力に見合うように)シミュレーションを簡単にするための」設定です。

パターン1

10人全員が70点! みんな仲良し!
はい、ほとんどあり得ない状況ですね。全員70点だと、平均も70点。ただしこの場合、分散は0、標準偏差も0ですから、偏差値も計算できません。(ここ、説明が必要かしら? 差し当たり今回はスルーしますけど)

パターン2

50点1人、60点2人、70点4人、80点2人、90点1人。
グラフで表すとこんな感じです。平均点と同じ点数を取った人が一番多くて、平均点から点数が離れるほど人数が少なくなる。統計の教科書によく出てくる、山型の分布ですね。標準偏差は12.6でした。

もしかしたら、多くの人はこういうイメージで平均点を見ているのかもしれません(偏見)。平均点=よくある点数=その点数を取った人がいちばん多いんでしょ?みたいな理解は、それほど外れていないこともあるのですが、正しい理解とは言えません。というわけで次のパターン。

パターン3

60点5人、70点2人、80点2人、100点1人。標準偏差は11.0でした。
これも、グラフで表しておきましょう。

「ああ、60点か、平均点より10点低いけど、まあまあだな」と安心するのは早いですね。60点は最下位グループ(60点の人の偏差値は約42)です。平均点より明らかに点数の高い人(100点の人)が平均点を高める効果をもっています。「外れ値」と呼びたくなる感じもしますね。100点の生徒の偏差値は約74ですから、この集団内でとびぬけていることは確かです。

パターン4

10点・20点・60点・70点各1人、80点・90点・100点各2人。
これも、グラフで表しておきましょう。標準偏差は30.0でした。

ここまで点数がばらけることは多くはないかもしれません。でも、きちんと勉強していて、授業も聞いていて、それなりに点数がとれる集団と、明らかに授業についていけてない小集団、というクラスは、実際にありそうな感じがしませんか?
この場合、60点の人は偏差値約47です。

パターン5

70点8人、60点1人、80点1人。標準偏差は4.5です。

これだと、60点は(たまたまかもしれませんが)再開ですね。偏差値を計算すると約28。見たくない数字ですね。統計の教科書に出てきそうな想定ですが、パターン1と同じく、あまり現実に現われそうに思えませんね。

標準偏差の大きさが意味すること

5つのパターンを見てきました。実際には中途半端な点数をとる生徒がいるでしょうし、人数も多いでしょうから、「何点くらいが何人か」というパターンは非常に多く考えられます。でも、そんなに多くのパターンを考えるのは大変ですから(私もです)、標準偏差という1つの指標で、「なんとなくこんな感じかしら」というのを想定できるようにしているのですね。つまり、パターン2や3のように、わりとみんなが近い点数でまとまっているのか(標準偏差11~13くらい)、あるいはパターン4のように2つに分かれてしまっているのか(標準偏差30)。あるいは、パターン5のように、長激戦になっているのか(標準偏差4.5)。
ということで、なんとなくイメージはつかめたでしょうか。
標準偏差が大きい=グラフにすると2つに分かれているとか、べたあっと平べったい感じになるとか。
標準偏差が小さい=グラフにすると1つの場所にぎゅぎゅっと集まっているとか。
こういうことも、集団の(あるいはデータの)特徴として、とらえていきたいのです。そしてこうしたことは、平均点だけではわからない特徴なのです。