趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

2023-12-01から1ヶ月間の記事一覧

分散公式から学んだこと(3)

四捨五入した平均値を使ったら 前回の最後に、データの平均値が4.2とか小数になったら分散の計算がめんどうなので、四捨五入して4にしてしまえばいいんじゃないの? という疑問について書きました。 almondfish.hatenablog.com この疑問に対する答えは、過…

分散公式から学んだこと(2)

分散公式と(シグマ)くん 前回の続きです。 almondfish.hatenablog.com 大きなお口のシグマくん 総和記号()は、見た目がいかついせいか、なかなかとっつきにくいイメージを持っている人も多いようですね。調べてないので適当ですけど。 この記号は次のよ…

分散公式から学んだこと(1)

分散ってわかりにくい 学び始めのころ 私が統計学を学び始めたのは2014年、放送大学に入学して2学期目のことでした。当時開講されていた「心理統計法 '11」は、数学に苦手意識を持ったままなんとか大学入試を潜り抜け、その後は小学校の算数とだけつきあって…

測定値の分散とピタゴラスの関係

誤差の分散を考える 前回は古典的テスト理論について書きました。この理論では、誤差を、「系統誤差」と「偶然誤差」に分けて考えていました。「偶然誤差」の方は「たくさん集めたら結局打ち消し合って0になるんじゃね?」ということで、合計=0、よって平…

誤差の分散を考える 前回は古典的テスト理論について書きました。この理論では、誤差を、「系統誤差」と「偶然誤差」に分けて考えていました。「偶然誤差」の方は「たくさん集めたら結局打ち消し合って0になるんじゃね?」ということで、合計=0、よって平…

テスト理論と「次の一手名人戦」の関係

テスト理論 小杉(2023)第6章「測定の基礎」では、テスト理論が解説されています。(古典的)テスト理論とは、「測定された得点は、真の得点と誤差の和ですよ」という考え方ですね。式で書くと、 となります。単純です。単純なんですが、これをじっと眺めて…

選択肢は偶数か、奇数か。

「アンケート」ウォッチング 2023年12月26日 今回のネタはこちらです。個人的にはあまり楽しくない話題なのですが、これまで何回かとりあげたことと関連があるので、その部分に注目して取り上げます。 www.mri.co.jp 調査概要 いつものごとく、「Webアンケー…

布団に入ると、すぐに眠れるほうですか?

「アンケート」ウォッチング 2023年12月25日 今回のネタはこちらです。調査がどのような目的で行われているのかに、まず注目しましょう。 prtimes.jp 冒頭に次の文章があります。 このデータをもとに3月の「世界睡眠デー」「春の睡眠の日」にあわせた特集お…

世論調査の結果がばらつくのはなぜ?について

「アンケート」ウォッチング 2023年12月24日 今回のネタはこちらです。実際の調査結果ではなく、調査の方法がどのように結果に影響するか、について書かれた記事です。「どのような言葉で質問するか」は、回答に影響するということを前日の記事でも書きまし…

リサーチの専門家による「必読」解説記事

「アンケート」ウォッチング 2023年12月22日 今回は特別編で、こちらの記事を紹介します。 markezine.jp 記事の著者は、渋谷智之氏(株式会社エイトハンドレッド、前職は株式会社マクロミル)です。マクロミルといえば、ネットリサーチ業界の有名どころのひ…

分散は放物線の夢を見るか(3)

前回までのまとめ almondfish.hatenablog.com almondfish.hatenablog.com 1回目では、「平均値からの偏差の総和は常に0であり、データの特徴を何も表すことができない」ということを書きました。 2回目では、「偏差の絶対値の総和は、偽の平均値を中央値に…

割合だけで話を進めないでほしい。

「アンケート」ウォッチング 2023年12月19日 今回のネタはこちらです。私の理解力が不足しているのか、あるいは、文章の書き方のせいなのか。よくわからない部分がいくつかあります。困りました。 prtimes.jp サブスクリプションって? サブスクリプション(…

「飲酒翌日のパフォーマンス実態調査」を読んでみよう

「アンケート」ウォッチング 2023年12月18日 今回のネタはこちら「飲酒翌日のパフォーマンス実態調査・武蔵精密工業調べ」です。プレスリリースとして配信された記事ですが、「アンケート」というよりも「研究報告」で、なかなか面白い内容です。 prtimes.jp…

分散は放物線の夢を見るか(2)

前回のまとめ almondfish.hatenablog.com 前回は「偏差」の性質について書きました。そして、 どんなデータであれ、平均値からの偏差の総和は常に0になります。つまり、偏差の総和は、データの特徴を何も表すことができないのです。 という結論を出しました…

データ可視化の練習をしよう

データ可視化の練習をしよう 前回の記事で、データ可視化についてあれこれ生意気なことを書きまくったのですが、せっかくデータが提供されているので、小杉先生がおっしゃっていることを実践しようと、私も取り組んでみました。 誰がどこでやっても同じ結果…

残念だ。あまりにも残念だ。

「アンケート」ウォッチング 2023年12月15日 今回のネタはこちらです。データの可視化の実践例としては、かなりみっともない部類に属すると思います。せっかく調査をしたのなら、結果がきれいにわかるように可視化を工夫すべきです。 www.jomo-news.co.jp 記…

分散は放物線の夢を見るか(1)

今回から、3回くらいに分けて、以前の記事に書いた、 では、平均値として、偽の値を用いた時は、偏差の総和はどのようになるでしょう。 という問題を解決していきたいと思います。 偽の値を用いるって? 上述の記事で、次のような図を用いました。 赤い破線…

試験日に欠席して、あとから一人だけ受けるのって、いやですよね。

データが追加されたとき 前回の記事の最後に書いた、数式で説明したほうが・・・について、少し書いておきましょう。次のような設定です。 ある高校の40人のクラスで試験を実施し、1名が体調不良で欠席し、39名が試験を受けた。39人の平均点はちょうど64点で…

「つりあい」としての平均

つりあわせる実験、覚えてますか 「てこ実験機」におもりをぶらさげて、つりあう条件を調べよう、みたいな授業を受けた記憶はあるでしょうか。いまでも小学校5年生の理科の授業で扱われているようです。NHK for Schoolに動画があるので、見てみてくださいね…

平均とは平らに均すことです(今更ですが…)

平均とは いまさら書くまでもないことでしょうが、「平均」の辞書的意味についてまだ書いていなかったので復習しておきましょう。 へいきん【平均】 ①不揃いのないようにすること。ならすこと。②つりあいがとれていること。③〔数〕多くの量または数の中間的…

偏差値ではなく「偏差」のはなし

気を取り直して「偏差」のはなし 「偏差」という語から、大学入試の「偏差値」を思い出すので好きではない、という話を聞いたことがあります。その昔、広末涼子が入学するという話が広まったら、その大学の入試の偏差値が急に上がったとか。あの「偏差値」は…

分散が0のデータセットから情報は得られない

小杉(2023)の第3章と第4章は、統計環境Rについて解説されているので、ここは飛ばして、第5章「記述統計量」にすすみます。いよいよ本番という感じですね。記述統計量について、いろいろと書いておきたいことはあるのですが、忘れないうちに書いておきたい…

とりあえず、お正月は実家に帰省されますか?

「アンケート」ウォッチング 2023年12月4日 今回のネタはこちらです。記事本文より前に「詳細は「高く売る不動産」にて公開」とあるので、リンク先も見てみたのですが、内容はほとんど同じです。一字一句比較したわけじゃありませんけどね。どこが詳細? そ…

データは図にする。データ取得前であっても。

データは図にする 小杉(2023)の第2章で、とても印象的なのは、データの可視化の重要性について繰り返し強調されていることです。ちょっと引用しましょう。 分析の第一歩は可視化 (visualization) です。データは図にするのが基本中の基本です。みなさんも…