趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

「偏差値可視化ツール」を作ったよ!

偏差値、あ、入試ね、と早合点しないで

以前に何かで読んだ記憶があるのですが、「偏差値」と聞くと入試を思い出して暗い気持ちになることがある方がおられるそうです。お気の毒なことです。
でも、ここで取り上げている「偏差値」は、統計用語です。あえて難しい言い方をすると、「標準得点を、平均=50、標準偏差=10になるように線形変換した値」のことです。ね、これなら怖くないでしょ。(いや、別の意味で怖いかもしれませんけどね。)

偏差値とは

さきほどの書き方はちょっと数学オタクっぽいので、もう少しかみ砕きましょう。
まず、テストをしたとします。テストといっても、数学とか英語とかそんなのだけじゃなくて、50m走とか走り幅跳びとかで運動能力を測るのもテストだし、心理学の実験として記憶力を測るのもテストです。パン屋さんが、ちゃんと一定品質の製品ができているかなあと思って、販売するべきパンをいくつか犠牲にして、重さや糖度を測ったりするのだってテストです。
テストをして、その得点(英語の点数とか、50m走の記録とか、パンの重さとか、文脈に応じて読み替えてくださいね)を用いて平均値を出します。標準偏差も出します。そうすると、平均値からすごく離れた値が混じっている、ということがありますね。この生徒だけやけに英語の点数が高い、とか。この生徒だけ50m走がとても遅い、とか。はたまた、やけに小さい(=軽い)パンがいくつかできてしまっている、とかです。
こういうとき、平均値からの「ずれ」がどの程度のものなのかを評価する目安が「標準得点」です。こうやって計算します。
標準得点=(データ - 平均値)÷ 標準偏差
パンの話で続けると、同じようにパンを作っていたとしても、重さにばらつきがあるのは当然のことです。「まあ、これくらいはいつもばらつくよね」という目安が標準偏差だと思えばよいでしょう。標準偏差が2グラムだとすると、その2倍、つまり、4グラムくらいは重くなったり軽くなったりするよね、みたいに判断するわけです(2倍、というのは、今仮に思いついた値です)。これが、標準偏差の3倍も4倍も違うとなると、ちょっと話は違いますね。そういうのが頻繁に見られるのなら、生産工程を見直したほうがよいかもしれません。また、ごくたまーーーに1個、そういうのが見つかったということなら、「ちょっとこれ、お店に出すのやめておこうかな」ということで対処が可能です。
今の話の中で、「標準偏差の○倍」とした部分、これを直接的に表した指標が「標準得点」です。

  • 標準得点が2のとき、そのパンは、平均よりも(標準偏差×2)グラム分だけ重いのです。
  • 標準得点が-1.5のとき、そのパンは、平均よりも(標準偏差×1.5)グラム分だけ軽いのです。

標準得点の符号(+か-か)は、平均値より大きいか小さいかを表し、符号をなくした数値(絶対値)は、平均値からどれだけずれているか(標準偏差のいくつ分ずれているか)を表しています。
ただし、標準得点だと負の値が出てきたりしてなんとなーくわかりづらいので、それを10倍してから50を足すと、なんとなーく「100点満点のテスト」みたいな点数になるので、なじみやすいよねー、となります。これが偏差値ですね。計算式は、
偏差値=標準得点×10+50
です。ちなみに、入試のときに予備校が発表している「偏差値」は、予備校が独自に算出しているもので、さまざまな事情で変動することが知られています。はい、受験前の方、気にしない、気にしない。

可視化ツール

さて、偏差値も言葉で書くとこれだけの文章になってしまいます。そこで、可視化ツールを作りました。自分で数値を調整しながら、好きなだけ操作してもらって、納得してもらおうという魂胆(?)です。

画面はこんな感じ。初期画面は適当に数値を入れてグラフを描いているので、平均値、標準偏差、個人得点を入力すると、それに合わせてグラフが描かれます。グラフの赤い線は個人得点が全体のどのあたりに位置するかを示していて、それより上には何%の人がいるかが数値で示されます。
といっても、あくまでもこれ、テスト成績が正規分布する、ということを仮定しています。実際には、たとえば、学級40人分のテストの点数が正規分布しているかどうかは何ともいえません。なので、あくまでも「理論的には」こうなるんだなあ、というふうに理解してほしいと思います。
標準得点と偏差値も表示しているので、「ああ、こうやって計算するんだあ」と理解する助けになればと思います。アクセスは下のアドレスから。よろしく!