趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

とりあえず、お正月は実家に帰省されますか?

「アンケート」ウォッチング 2023年12月4日

今回のネタはこちらです。記事本文より前に「詳細は「高く売る不動産」にて公開」とあるので、リンク先も見てみたのですが、内容はほとんど同じです。一字一句比較したわけじゃありませんけどね。どこが詳細? それはさておき。
www.jiji.com

きれいな二峰性分布

「実家に帰る頻度はどれくらい?」という記事タイトルから期待される通り、実家に帰省する頻度が最初に尋ねられているようです。以前にも書きましたが、質問文をそのまま(回答者に提示したままの表現で)公開していただきたいですね。
帰省する頻度を「不定期」と回答した0.2%を除くと、わかりやすい順序尺度になっています。そして、「月1回」と「2~3か月ごと」が15.8%で、その両端より割合が高く、「年2回」と「年1回」がそれぞれ18.6%、18.2%でその両端より割合が高くなっていますね。つまり、2つの山がある分布になっています。こういうのを一般に「多峰性の分布」と言ったりします。
「多峰性の分布」に対して、山が1つしかできない分布は「単峰性の分布」ですね。正規分布の形(釣鐘型)が、その典型例です。

多峰性の分布は層別してみる

このような「多峰性の分布」が見られるときには、複数の異質なデータが混じっているのではないか、と疑ってみることが必要です。今回の例でいうと、「月1回」または「2~3か月ごと」に帰省する人たちのグループと、「年2回」または「年1回」帰省する人たちのグループとでは、「何か」が異なるのだろうと推測できます。その「何か」で層別する(グループ分けする)と、分布が単峰性になるかもしれません。
そういう目で見ていくと、3つ目のグラフで「実家に積極的に帰りたいか」を尋ねた結果が示されていますね。「思う」が64.4%、「思わない」が35.6%となっています。ここで「思う」と回答した人と、「思わない」と回答した人を別にして(=層別して)、最初のグラフを作ってみると、「思う」人は帰省の頻度が高く、「思わない」人は帰省の頻度が低いのではないか、と考えられます。
実際にはこのようなグラフは作られていないので、私が予想していることはまったくの的外れかもしれず、もっと他の要因(たとえば実家までの距離とか、交通費とか、家族の人数とか)が帰省の頻度に影響しているかもしれません。
Web上に公開されている「アンケート」では、ここに示したような「仮説をもって調査している」ものは、残念ながらほとんど見当たりません。