趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

残念だ。あまりにも残念だ。

「アンケート」ウォッチング 2023年12月15日

今回のネタはこちらです。データの可視化の実践例としては、かなりみっともない部類に属すると思います。せっかく調査をしたのなら、結果がきれいにわかるように可視化を工夫すべきです。
www.jomo-news.co.jp
記事の冒頭で、「下記内容は、弊社運営Webメディア より一部抜粋で掲載しています。より詳細な内容は、【https://media.toint.co.jp/entry/sumaho】 にて公開しております。」と書いてあるので、そのリンク先も貼っておきます。
media.toint.co.jp
以前にも書いたように思いますが、このような書き方で別記事に誘導してあっても、「どこが詳細なん?」と思うことはたびたびです。今回もその例にもれません。「一部抜粋」という書き方はきわめて不正確だと、私は思います。

予想をもって調査することは重要

この報告の「みっともなさ」はたくさんあるのですが、途中にある「年代別」という項目に限って書くことにします。年代別調査結果の前に、次の文章があります。

年代が若いほどキャリアをもつこだわりは少なく、価格を重視するのではないかと予想しましたが、そういうわけではないことがわかります。

このような「予想」をもって調査をすることはとても重要なことだと思います。若い世代ほど年収が少ないことは当然予想できますし、若い世代の方が情報機器や携帯端末に関する知識も豊富ではないか、と考えられます。一方で、若い世代は(とくに独身の内は)親と同居している場合も多いと予想され、そういう場合には親と同じ選択をする(親と同じブランドを選択する)ことも考えられます。家族で契約すると割引がある、という売り方はどの会社もしていると思います。
結果としては、後者の予想がより妥当性が高いのではないか、と思われます。ただし、今回の調査サンプルがどれくらい代表性をもつものか、別に議論する必要がありますけどね。

なぜ表とグラフを両方載せるのか

ところで、この「年代別」の調査結果は、3つの方法で示されています。
1. 度数分布表:年代別に実数と年代内の割合が示されています。ただし、表のつくり方としてはかなり冗長です。
2. 棒グラフ:「キャリア」と「格安スマホ」別に、年代別構成(実数)を示しています。どうして帯グラフを使用しなかったのか疑問が残ります。
3. 円グラフ:年代ごとに、「キャリア」と「格安スマホ」の実数と比率を示しています。
記事を見ればわかるように、3つの表とグラフが示していることは同一のことです。同じ内容を、わざわざ3回も、かなりのスペースを使って表示することに、どんな積極的な意味があるのか、私にはわかりませんでした
その他、キャリアや格安スマホを選択した理由のグラフに至っては、とてもひどいものです。どうしてこのような表現になっているのか、私には理解できませんでした。

調査設計の書き方

調査概要には、調査を依頼した調査会社名が記されています(「詳細」記事の方ではリンクも貼られている)。「アンケート」結果の報告記事は最低限、こうであってほしいと思います。サンプルの性別構成、年代別構成、収入別構成もきちんと報告されています。サンプルの構成がわからない調査報告に比べると、きちんとしています。
なのに。
何なのでしょう。あのひどいグラフは。
とても残念です。

分析の練習にどうぞ

なお、記事の最後に、調査結果のデータ(もちろん匿名)が提供されています。自分ならどうやって分析するか、どう可視化すれば、1つの表やグラフで結果を伝えられるか、練習することができます。こうやって、データを公開してくださることも、統計学習者にとってはありがたいです。
なのに。
何なのでしょう、あの(以下省略)