趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

割合だけで話を進めないでほしい。

「アンケート」ウォッチング 2023年12月19日

今回のネタはこちらです。私の理解力が不足しているのか、あるいは、文章の書き方のせいなのか。よくわからない部分がいくつかあります。困りました。
prtimes.jp

サブスクリプションって?

サブスクリプション(「サブスク」と略すことが多いようですので、以下それにならいます)って、何でしょう。わかっているようでわかっていないので、Wikipediaの記事とか、定額制との違い、みたいな記事を拾い読みしてみましたが、いまいちよくわかりません。
記事の冒頭で、調査で使用した「ジャンル」ごとにいくつか例が示されています。たとえば「Kindle Unlimited」とか、「Netflix」とかは納得できます。世の中に本や映画や山ほどあり、作品ごとに購入していては大変ですが、サブスクを使えば定額(月額とか年額とかが決まっていますよね)で、ある意味「好きなだけ」本を読んだり映像作品を見たりできるわけです。これがわたしの、サブスクの基本的なイメージでした。
「洋服」とか「自動車」とか「知育玩具」とかもイメージできます。でもね、「教育/学習」ジャンルにある「オンラインや学校での語学」とか「趣味の習い事」になると、それってサブスクなん? と思います。ECCとかユーキャンとかをサブスクとして見たことは無い気がします。公文式やバレエ教室もそうなのかな? というか、こういうことで悩んでしまった回答者はいないのかしら?
サブスクの定義について書くつもりはないのでもうやめますけどね。
ちなみに、日本でもっとも契約数の多いサブスクはNHKの受信料だと私は思います。一部でとっても評判悪いようですけど。あれ、どう見てもサブスクですよね? どうでもいいんですけど。

軸に数値をつけよう

さて、いきなりですが、最初のグラフ「サブスクリプションサービスの認知率」は明らかにルール違反です。横軸の左端が0ではない上に、そのことを記載していません。「シニア層」の「認知率」は82%で、8割を超えていますが、もっとずっと低いように見えてしまいます。差を強調したいのかもしれませんが、このやり方はフェアではありません。

「プレシニア層」って何?

そのグラフのすぐ下に、次の注記があります。
「若年層:20~34歳、ミドル層:35~44歳、プレシニア層:45~59歳、シニア層:60~69歳」

  • どうして年齢幅が一定ではないのか:年齢幅を見ると、順に15年、10年、15年、10年となっています。どうして一定にしないのでしょう? 一定にしないということは、「この年齢で区切ることに意味がある」のだと私は思います。どんな意味があるのでしょう?
  • 「プレシニア層」って何?:この言葉を私はこの調査報告ではじめて見聞きしました。一般的な用語なのでしょうか?(そうとは思えませんが) 年齢で区切って「○○層」とか名前を付けるということを、好き勝手にやってほしいとは思いません。(好き勝手にやっているように見えます。そうでないなら、その理由を説明すべきです)

あと、「若年」だけ熟語で、あとはカタカナっていうのも、まあ面白いですね。「ヤング層」だと若く見えないのでしょうか。これはまあ、どうでもいいんですけど。

何の、何に対する割合を議論しているのか

記事の中ほどに、「サブスクリプション認知者を対象としたジャンル別利用経験率と認知率比較」という難しい表題のグラフがあります。ここで、グラフに赤線が引かれた4つのジャンルについて言及しているのですが、この文章が、まあわからない。引用します。

(赤線を引いた4つの=引用者注)ジャンルを利用したことがある人は、全体ではそれぞれ3~7%と1割に満たないものの、これらのサービスの認知者だけで見ると、どれも利用経験は10%台となって利用経験率は2~3倍程度上がります。

申し訳ないけれど、これが何と何を比べて「2~3倍程度」上がると言っているのか、私にはまったくわかりませんでした。
まず、「サブスクリプション認知者」とは何でしょう。最初のグラフのところで、「サブスクリプションサービスを1つ以上知っている人」という注がありましたが、これらの人のことでしょうか?
「これらのサービスの認知者だけで見ると、どれも利用経験は10%台」ということは、たとえば、「教育/学習」サービスを知っている人は、利用経験が13%になるけれど、「教育/学習」サービスを知らない人も含めると、利用経験が6%にしかならない、と言っているのでしょうか? え? 当たり前では?
だって、分母を小さくしたんでしょ? 分子は変わらないんでしょ? だったら分数の値は大きくなりますよ。違うの?

割合だけで議論しないで

結局、割合だけで話を進めるとこういうふうになるのではないの? と思います。
例によって、この調査でも、年代別(プレシニア層とか)の回答者数は示されていません。記事の一番最後になってやっと、全体で4000名であることはわかりますが、これは最初に示すべきことです。4000名がどのように選ばれたかも書かれていません。調査している企業は海外にもオフィスがあるようですから、「日本人4000人」と早合点しないほうがいいでしょう。
話を戻しますと、さきほどの「認知者だけで見ると」のグラフです。「教育/学習」ジャンルの利用経験13%というのは、何の何に対する割合なのか。同じく6%というのはどうなのか。これらは、実数で示せば、よりわかりやすいはずでしょう。
まず実数で表を作る。相対度数を出す。その上で、(n数を考慮したうえで)意味のある差は何なのかに注目する。こういう基本的な情報こそ、リリースで出してほしいと思います。