趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

食べたいおにぎりの具は、その日の気分で変わりますよね。

「アンケート」ウォッチング 2023年11月17日

今日のネタはこちらです。ほんとうに、毒にも薬にもならない話題なのですが、データが提供されているということで、さわってみることにしました。いえ、別に、新しい知見が得られたとか、記事に書いてないすごいことが見つかったとか、そんなことは一切ありません。ご期待なさいませんように。

media.toint.co.jp

で、年収によって好みは違ったの?

結論としては、年収によって好きな具に差はない。ついでに男女差もない。年代別にみると、60代以降だけちょっと好みが違うみたいだ、ということでした。So what ? という感じですよね。調査の内容については以上。 調査方法について一つだけ付け加えると、「クラウドワークス」という調査会社に依頼していることが書かれています。こういうのをちゃんと書いておくのは良いことだと思います。なお同調査は岐阜新聞のサイトでも紹介されています。

データ分析の練習に使えるね

調査結果の説明に入る前に、この調査のデータが公開されていることが書かれています。なぜか違うテーマの記事に飛ぶので若干不安もありますが、ちゃんとおにぎりのデータがダウンロードできます。 詳しいことはデータを見てほしいのですが、すべてがカテゴリカルデータで、年代と年収は順序尺度、性別と好きな具は名義尺度です。ということは、クロス集計の練習にもってこいですね。Excelを使えるなら、ピボットテーブルの練習にもってこいです。 あと、ジニ係数の算出練習にも使えます。こういう実際の調査で得られたデータは有用で、個人と紐づけられていないし、なにしろ調査内容が人畜無害というか、毒にも薬にもならない内容なので、練習にはもってこいだと思います。

気になるジニ係数

ジニ係数は、格差の指標としてよく使われます。社員が5人の会社で、5人の給与総額が1000万円のとき、全員が200万ずつもらっていれば、格差は0。完全平等。このときジニ係数は0です。5人の内4人が0円、一人が1000万円総取りすると、格差が最大、ジニ係数は1です。 この調査では、社員を「おにぎりの具」、給与を「被選択数」と読み替えると、ジニ係数が小さい時、「すごく好みが分かれたな。定番の具ってないんだな」という意味になりますし、ジニ係数が大きければ、「やっぱり定番の具ってあるんだな」という意味になります。その「定番」が、収入によっても性別によっても変わらなかったよ、というのが今回の調査結果ですね。私が計算したところ、ジニ係数は0.614。男女別に集計すると、男性が0.621、女性が0.619でした。「わりに明確に、定番とそれ以外は分かれている」ように見えます。

計算式は?

ん? 計算式ですか? 以前 note にも書いたんですが。いずれ書きましょう。 あ、このブログは LaTeX 数式書けるのでしょうか?