趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

心理統計をもういちど

シグマくんのはなし #01

総和記号のシグマくん 総和記号という記号をご存知でしょうか。 一般に数学の教科書ではシグマという文字で表されています。シグマというギリシャ文字をご存知でしょうか。ローマ字のMという字を左側にコテンと倒したような形をしています。ギザギザとした結…

標準偏差が書かれていないことの何が問題なのか

テストの平均点 小杉(2023)の中に、次のような注があります。 私の娘が通っていた中学校では,定期試験の結果を表にまとめたプリントを親に見せてくれるのですが,本人の素点と本人の平均点しか表示されておらず,まったく無意味な数値の羅列でした。(小…

サイコロのシミュレーション その3

アニメーションによる統計学習 このところサイコロシミュレーションのことばかり書いていますが、前回(というか本日の午前中に)書いた記事で紹介したシミュレーションに、「目によって出る確率が異なるサイコロ」をシミュレートできる機能をつけてみました…

サイコロシミュレーション

アニメーションによる統計学習 前の記事で、アニメーションによる統計学習について書いています。 almondfish.hatenablog.com ここでちょっとだけ紹介していた「サイコロシミュレーション」をアップデートしました。 サイコロシミュレーション 試作品2 almon…

アニメーションによる統計学習

シミュレーションによる統計学習 しばらく放っておいた書籍をやっとちゃんと読み出しました。 www.hanmoto.com たとえば、大数の法則とか、中心極限定理とか、統計学には難し気な名前の法則やら定理やらが出てきますが、実際に乱数を発生させてシミュレーシ…

分析方法を統合的に理解するために

統合的って? 分析方法の「統合的」理解という言い方は、私が考えたものではなく、南風原先生のご著書によっています。以下に書くのは、私なりの敷衍です。南風原先生の名著はこちら。 www.hanmoto.com 仮想データの分析 仮想データを分析しながら、「統合的…

分散公式から学んだこと(4)

前回まで 第1回では、分散定義式から分散公式が本当に導けるのか?について、学び始めの頃に感じていた疑問について書きました。 第2回では、観測値の合計と平均値のn倍が一致する、という、言われてみれば当然の式変換を使うと、ちゃんと分散公式が導ける…

「偏差値可視化ツール」を作ったよ!

偏差値、あ、入試ね、と早合点しないで 以前に何かで読んだ記憶があるのですが、「偏差値」と聞くと入試を思い出して暗い気持ちになることがある方がおられるそうです。お気の毒なことです。 でも、ここで取り上げている「偏差値」は、統計用語です。あえて…

分散公式から学んだこと(3)

四捨五入した平均値を使ったら 前回の最後に、データの平均値が4.2とか小数になったら分散の計算がめんどうなので、四捨五入して4にしてしまえばいいんじゃないの? という疑問について書きました。 almondfish.hatenablog.com この疑問に対する答えは、過…

分散公式から学んだこと(2)

分散公式と(シグマ)くん 前回の続きです。 almondfish.hatenablog.com 大きなお口のシグマくん 総和記号()は、見た目がいかついせいか、なかなかとっつきにくいイメージを持っている人も多いようですね。調べてないので適当ですけど。 この記号は次のよ…

分散公式から学んだこと(1)

分散ってわかりにくい 学び始めのころ 私が統計学を学び始めたのは2014年、放送大学に入学して2学期目のことでした。当時開講されていた「心理統計法 '11」は、数学に苦手意識を持ったままなんとか大学入試を潜り抜け、その後は小学校の算数とだけつきあって…

誤差の分散を考える 前回は古典的テスト理論について書きました。この理論では、誤差を、「系統誤差」と「偶然誤差」に分けて考えていました。「偶然誤差」の方は「たくさん集めたら結局打ち消し合って0になるんじゃね?」ということで、合計=0、よって平…

テスト理論と「次の一手名人戦」の関係

テスト理論 小杉(2023)第6章「測定の基礎」では、テスト理論が解説されています。(古典的)テスト理論とは、「測定された得点は、真の得点と誤差の和ですよ」という考え方ですね。式で書くと、 となります。単純です。単純なんですが、これをじっと眺めて…

分散は放物線の夢を見るか(2)

前回のまとめ almondfish.hatenablog.com 前回は「偏差」の性質について書きました。そして、 どんなデータであれ、平均値からの偏差の総和は常に0になります。つまり、偏差の総和は、データの特徴を何も表すことができないのです。 という結論を出しました…

データ可視化の練習をしよう

データ可視化の練習をしよう 前回の記事で、データ可視化についてあれこれ生意気なことを書きまくったのですが、せっかくデータが提供されているので、小杉先生がおっしゃっていることを実践しようと、私も取り組んでみました。 誰がどこでやっても同じ結果…

分散は放物線の夢を見るか(1)

今回から、3回くらいに分けて、以前の記事に書いた、 では、平均値として、偽の値を用いた時は、偏差の総和はどのようになるでしょう。 という問題を解決していきたいと思います。 偽の値を用いるって? 上述の記事で、次のような図を用いました。 赤い破線…

試験日に欠席して、あとから一人だけ受けるのって、いやですよね。

データが追加されたとき 前回の記事の最後に書いた、数式で説明したほうが・・・について、少し書いておきましょう。次のような設定です。 ある高校の40人のクラスで試験を実施し、1名が体調不良で欠席し、39名が試験を受けた。39人の平均点はちょうど64点で…

平均とは平らに均すことです(今更ですが…)

平均とは いまさら書くまでもないことでしょうが、「平均」の辞書的意味についてまだ書いていなかったので復習しておきましょう。 へいきん【平均】 ①不揃いのないようにすること。ならすこと。②つりあいがとれていること。③〔数〕多くの量または数の中間的…

分散が0のデータセットから情報は得られない

小杉(2023)の第3章と第4章は、統計環境Rについて解説されているので、ここは飛ばして、第5章「記述統計量」にすすみます。いよいよ本番という感じですね。記述統計量について、いろいろと書いておきたいことはあるのですが、忘れないうちに書いておきたい…

データは図にする。データ取得前であっても。

データは図にする 小杉(2023)の第2章で、とても印象的なのは、データの可視化の重要性について繰り返し強調されていることです。ちょっと引用しましょう。 分析の第一歩は可視化 (visualization) です。データは図にするのが基本中の基本です。みなさんも…

偏差を可視化する

1年半前の書き散らし 約1年半前に書き散らした記事を、整理のために貼っておきます。読まなくていいです。 almondfish.starfree.jpalmondfish.starfree.jpalmondfish.starfree.jp

心理測定って難しい

心理学と心理測定法 小杉(2023)の19~20ページに、心理測定法についての記述があります。 心というのは目に見えないので、ものさしをあてて長さを測るようには、測ることができません。そこで、簡単な作業をしてもらってその結果(処理できた個数やかかっ…

しんりがく=しん+りがく=心+理学(≠心理+学)

心理統計をもういちど 2023年11月27日 いきなりわけのわからないタイトルで書き始めてしまいました。 「心理学」という語を聞いたことがある人はそれなりに多いように思いますが、この語は、どこで区切って理解するのが妥当であるか、という話を、かなり以前…

心理統計を、もういちど

心理統計を、もういちど 2013年10月に放送大学(全科履修、心理と教育コース)に入学し、心理学を学びました。通算で10年間、後半はいたって不真面目でした。 が、一番の収穫は、自分が「統計学」に、こんなに興味をもつことができるのだと知ったことかもし…