趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

ブラックフライデーに何か買いましたか?

「アンケート」ウォッチング 2023年11月23日

今回のネタはこちらです。度数分布表と棒グラフが両方書かれていて、しかも項目の並べ方が両者で異なるという、なかなか面白い事例です。
life-style-partners.net

調査計画

今回の調査は、例のごとく「インターネットによる調査」とあります。この調査のプレスリリース(https://www.value-press.com/pressrelease/328248)には、「自社調査」と書いてありますし、調査報告ページは「Life Style Partners」という企業で、「調査リサーチ」という業務を行っているようですから、この企業(Life Style Partners)が、インターネットを用いた何らかの方法で(ここが重要なんだが)調査したものと思われます。どうして100人なのかも不思議なんですが、スルーしましょう。

項目をどう配列するか

2つ目に「Amazonブラックフライデーの利用意向」についての結果が表示されています。記事見出しも本文冒頭も「Amazonブラックフライデーの利用意向」ですが、グラフの見出しは「Amazonブラックフライデー買い物する?」です。質問文は何だったのでしょう。もう何回かこのことは書いていますが、指摘だけしておきます。
さて、興味深いのは、項目の配列です。「結果は次の通りです」という本文の下に表示されている度数分布表では、次のように項目が配列されています。
買い物する 12人
おそらく買い物する 62人
おそらく買い物しない 22人
買い物しない 4人
ところが、見出しのすぐ下(本文より前)のグラフでは、項目は次のように配列されています。
おそらく買い物する 62票
おそらく買い物しない 22票
買い物する 12票
買い物しない 4票
また、表の下の本文は次のように始まっています。
「”買い物する”、”おそらく買い物する”と回答した人は、全体の74%」

このデータはもちろん「順序尺度」

確認しておくと、このデータは順序尺度に当たります。度数分布表では、買い物に対する意向(≒利用意向)が高い順に項目が並べられています。ですから、グラフにした場合も、この順序で項目を並べればよいと、私は思います。
しかし、グラフの方は、度数の降順に並び替えられています。どうしてでしょう?

並び順が違ったらわからないわけではない

もちろん、並び順が変わったら訳が分からなくなるような内容ではありません。だから、どっちだっていいと言えばどっちだっていいのです。それでもあえて、順序尺度なんだから順序通りに並べたほうがいいと私は感じます。そのほうが、調査結果がわかりやすいのではないかと思うのです。
表の下の本文に「”買い物する”、”おそらく買い物する”と回答した人は、全体の74%」と書いてあることに注目しましょう。このように、結果を「肯定的回答」と「否定的回答」に二分して分析することは、よくあることです。つまり、度数分布表を上下に二分して考えているわけです。だったら、グラフもそれに合わせたほうがわかりやすいのでは? と思うのですね。

「分布」としての度数分布表

もう一つは、度数分布表は「分布」を表すものです。したがって、分布の特徴がわかりやすいほうが良い。順序尺度ですから、分布の特徴を示す代表値は、中央値と最頻値です。最頻値は一目瞭然、中央値も、度数分布表から一目でわかります。しかし、グラフから中央値を読み取ろうとすると、いったん順序を並べ替える必要があります。それほど難しい計算ではないとはいえ、一目でわかるようにしていないことは、グラフとしての欠点であると言えます。