趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

心理測定って難しい

心理学と心理測定法

小杉(2023)の19~20ページに、心理測定法についての記述があります。
心というのは目に見えないので、ものさしをあてて長さを測るようには、測ることができません。そこで、簡単な作業をしてもらってその結果(処理できた個数やかかった時間)を測ったり、あるいは質問項目に「そう思う」とか「あまりそう思わない」とか答えてもらってそれを集計したり、という方法をとるわけです。当然、それらは数値データとなって分析対象になります。私もやりました。
ここで、処理できた個数やかかった時間はともかく、質問項目に答えただけで、「はい、あなたの気持ちは数字で表すと4.5」とか言われても「はあ?」となります。「あなたの性格のうち、誠実さについては2.8ですね」とか言われると「うるせえ!」とか思ったりします。(しませんか?)
通常、調査協力者に対して、こういう伝え方はしないので問題は起きにくいのですが、性格検査なんかは自分で結果を見ることができるので、どうしても「モヤモヤ感」は残るかもしれませんね。
小杉先生もこう書いています。

数字で心がわからない,と思う人がいるかもしれませんが,これについてはどのように数字にしたのか,という心理測定の問題が理由となっているのではないでしょうか。すなわち,嬉しい気持ち,悲しい気持ちを 4 とか 23 とか言われても,そういうんじゃないんだよな,といいたくなるのはわかりますが,それは嬉しい = 4 だと誰がどうやって決めたんだ,という問題なのです。

順序尺度とか、間隔尺度とか

ちょっと寄り道をして、尺度水準の話をします。上の話には、あとで戻ってきますからね。
たとえば、100m競争の「順位」は、順序尺度です。たしかに1位は2位より順位が上で、3位は2位よりも順位が下です。
だけど、1位がぶっちぎりでゴールして、2位と3位がわずかに0.05秒差だった、ということは、順序だけでは表現できませんね。実際のタイムを参照しなければわかりません。
100m走のタイムが10.72秒、とかいうのは、比率尺度といいます。ちゃんと単位があって、2つを比較するという文脈以外では、普通は負の数にはなりません。
この2つの尺度の中間に、間隔尺度というのがあります。比率尺度と同じようなのですが、「0」の意味が異なるのですね。比率尺度では、「0秒」といったら時間がまったく経過していないことです。0mは長さがない、0gは重さが全くない。0はゼロ。
間隔尺度の代表選手は「摂氏温度」です。「摂氏0度」は、温度がないわけではなく、セルシウスさんが決めた氷点の温度です。確かに冷たいけれど、ちゃんと「摂氏0度」という温度が「ある」。0が「ゼロ」ではない。
心理学でもちいる点数、さきほど例に挙げた、性格の明るさが4点とか、誠実さが2.8点とか、そういうのはすべて「間隔尺度」的な特徴をもっているのだろうと思います。そこには単位というものがありません。絶対的な基準と言うものがありません。

勝手に10点満点や100点満点にしないで

たとえば、「この商品はどれくらい好きですか」という質問があったとして、「どっちでもない」を0として、+3(大好き)からー3(大嫌い)で答えてもらうとします。この「+3」や「ー3」は、別に3でなくてもいい。だけど、自由に答えてもらうと、「大好きだから5!」だったり、「大嫌いだから-1000だ!」だったりして、これでは集計できないので、とりあえず「±3の範囲で考えてね」ということなのですね。選択肢に「1~7」を使ったり、「1~5」を使ったりするのも、差し当たりわかりやすい数にしているだけで、同じ考えだといっていいと、私は思います。
さっきの話も、これと同じだと思います。こういうのは、自分一人だけ、ある時点での回答を数値化しても、ほとんど意味がない。なぜなら、比較する対象がないから。誠実さが2.8、というのも、「-3~+3」という範囲での2.8なのか、「1~5」という範囲での2.8なのかでまったく意味が違いますよね。サンプルの平均値が1.3で自分が2.8なのか、平均値が4.2で自分が2.8なのかでも、意味が全く違う。
知能検査とか、ちゃんとした性格検査とかは、大量の調査結果をもとにして「標準化」という作業が行われているので、それらと自分の結果を比較できる。だけど、そういうことが行われている調査はごくごくまれなのですね。
結局、わたしたちは、数字で表現されたものをみると、勝手に10点満点や100点満点の世界で考えてしまっているのかもしれません。
さて、なんだかまとまりのない話になってしまったな。今回はこれくらいにして。