趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

3色のミニトマト

「クレア」という品種?の、3色のミニトマトを買ってきました。 どう見ても、オレンジ色だけが大きいように見えます。重さを測ってみましょう。 tomato_red <- c(5,6,7,6,7,6,5,5,6,5,6,5,6,6,5) tomato_yellow <- c(7,6,7,6,6,6,7,5,5) tomato_orange <- c(…

html と css 学習の成果なのだ

少し前から、javascript につづいて、 html と css の学習も進めてきた。使ったのはこれ。www.hanmoto.comちなみに javascript も同じ著者のこれ。www.hanmoto.comjavascript の書き方を検索していたら、「このページレイアウト前にも見たなあ」と思って著者…

stylesheet なのだ

朝から bookdown をいじっている。HTMLやePubにどうやって自分で書式設定を組み込むかという話で、 2.7 Custom blocks | bookdown: Authoring Books and Technical Documents with R Markdown を見ると、R Markdown の解説を見ろと書いてある。というわけで…

bookdown 簡単だあ…

というわけで、bookdown した。bookdown は、R のライブラリなので、基本、R と R Studio で実行する。プロジェクトを作って、yml ファイルをネット記事見ながらほとんどコピペして、ファイル名だけは自分のに合わせて。せっせとキーボード打ちまくっていた …

md ファイルを書く

ブログに書いてきたことを電子出版にまとめようとしている。KDP(Kindle Direct Publishing)というサービスを使う予定。アカウントはもう作っているので、あとは原稿があればいつでもOK。で、原稿なんだけど、Wordで書いてPDFに変換すればいいらしい。しか…

キーボードと仲良しの毎日

ひたすらキーボードを打っています。「シグマくん」カテゴリで書いてきた記事を、本にしようと思っていて、というか、もともと本にするための下書きとして書き溜めてきて。いちおう書きたいことを一通り吐き出したかなあと思ったのが3月中旬。それから1か月…

正規分布の再生性2

アニメーションによる統計学習 今回は第3章の2「確率変数の期待値と分散」に示されている、正規分布の加法性のシミュレーションの後半です。同じパラメータの正規分布に従う、相互に独立な確率変数の平均も、正規分布に従います。このとき、分散がn分の1に…

正規分布の再生性

アニメーションによる統計学習 数値シミュレーション本を読みながら、シミュレーションをRで写経して実行する、その後Javascriptに移植して、アニメーションを加えてみる、ということをずっとやっています。 www.hanmoto.com 今回は第3章の2「確率変数の期待…

シグマくんのはなし #31

カイ二乗統計量の計算 前回までに、クロス表のカイ二乗統計量の計算について書いてきました。ちょっと復習しておきましょう。 今回は、この表を計算式に書き換えていきます。本来は、e を計算する手順も式に書き換えてみたいのですが、ちょっと難しそうな気…

シグマくんのはなし #30

散らばり具合、あるいは密集度 分散という指標の意味を表すのに、「データの散らばり具合」という言い方がよく使われます。英語表現の variance は一般的に「不一致」とか「変化」とかの意味で、dispersion も「解散」「消散」とかの意味で、どちらも数学で…

シグマくんのはなし #29

クロス表における「偏差」 今回は、クロス表における「偏差」について考えます。 最初に断っておくと、前回も書いたように、クロス表で「偏差」という言葉はほぼ使われません。が、以下に書くような性質は、データから平均値を引いた値としての「偏差」と近…

シグマくんのはなし #28

「期待値」ではなく「期待度数」のほうがいいかな? 前回、クロス表の期待値について書きました。1つだけ補足しますと、「期待値」ではなく「期待度数」と書いたほうが正確なのかもしれません。クロス表のセルに書かれている値は、何かを測定した「値」では…

シグマくんのはなし #27

2次元表に整理するということ 2次元の表にデータを整理する、という学習は、小学校の算数ですでに指導されていることです。たとえばこんな感じの表示について勉強するようです。(出版されている小学生用のドリルを参考にして、著者が作成した表です) これ…

シグマくんのはなし #26

たてよこシグマくんを分解しよう 前回の最初に呈示した式を再掲しましょう。 表の中に入っている数たちの総合計を求める式だったので、左辺もその記号()にしてあります。添え字が2つついているのは、一方が「何列目の数たちの仲間か」を示していて、もう一…

シグマくんのはなし #25

たてよこシグマくん 最後のパートでは、ひときわごつい、この形についてお話していきます。 なんですか、これは…思わず絶句しそうな方、どうぞお付き合いください。見た目がいっそうごついので、以下、しばらくの間は、これを「たてよこシグマくん」と呼んで…

シグマくんのはなし #24

平均値を選択する 以前から使用している設定を再掲します。 これを用いて、前回は、全平方和(を自由度で割った全分散)と、群内平方和(を自由度で割った郡内分散)について話しました。そこで、全平方和を割ったときの自由度が19であったのに対し、群内平…

迷うということ

最近の読書 おもちゃクリエーターの高橋さんの本。 www.hanmoto.com 気になるところがいくつかあったのだけど、とりあえずこれを引用。 講師という立場の人がはっきりと断言すると受講生は受け入れてしまいますが、迷っていると受講生は考えてくれます。 (…

シグマくんのはなし #23

設定の再確認 自由度の話をしたので、分散分析の話に戻りましょう。#19と#20で出した設定をもう一度復習します。そして、母集団と自由度も、確かめていきましょう。 母集団 この調査では、放送大学の2つの学習センターAとBで、面接授業に参加していた学生そ…

シグマくんのはなし #22

2種類の分散 自由度について話すために、まず分散には2種類ある、という話をしたいと思います。すでに学習された方はご存知でしょう。偏差の2乗の総和(=偏差平方和)を、(1) で割った分散、(2) で割った分散です。Excelの関数では、前者が var.p 関数、後…

シグマくんのはなし #21

自由度について書く前に 分散分析の話をちょっとだけ横に置いといて、自由度について書いてみます。この話、もっと早く出しておいた方がよかったと思います。それから、「分散」すなわち「偏差平方和の平均」という統計量をずっと扱っているのですが、nで割…

シグマくんのはなし #20

設定の復習 2つの学習センターA、Bで、面接授業を受講していた学生10人ずつに、今学期の受講単位数をたずねたところ、次のようになりました。20人全体の平均は7.3でした。 では、前回の最後に示した手順に沿って、計算していきましょう。 平均が同じだった…

シグマくんのはなし #19

ふたたび「意味がない」状況とは では、「意味がない」という状況について、分散分析が使えそうなデータを使って考えていきましょう。 注:話が難しくなりすぎないように、2つの平均値を比較する、という状況で考えます。通常、2つの平均値の差を検討する場…

シグマくんのはなし #18

分散分析は何を分析したいのか 分散分析の解明に先立って、いったい分散分析というのは何を分析しているのかについて、復習しておきましょう。すでに統計学の教科書で勉強された方はご存知でしょうが、 分散分析は、平均値の差が、統計的に有意であるかどう…

シグマくんのはなし #17

平均を丸めたら:続きの続き 前回までの式変形を復習しましょう。分身の術を使って、この形までたどり着きました。 では、3つのシグマくんを順にみていきましょう。まず3つ目から。 3つ目のシグマくんは「エヌがくれの術」 3つ目はこんな形をしていますね。 …

シグマくんのはなし #16

平均値を丸めると:つづき 平均値を丸めると、その(丸められた平均を使って計算された)分散は、本来の(正しい平均値を使って計算された)分散よりも、少しだけ大きな値になるようだ。というのが、前回の実験でわかったことでした。その大きさはどれくらい…

シグマくんのはなし #15

文中に挿入してあった表の数値が誤っていたのを修正しました。(2024.2.25) 平均値を丸めると 分散公式の展開を学ぶことは、分散分析の理解を助けることになるのではないか、と私は考えています。そのきっかけになるのが、前回の最後に示した問です。すなわ…

シグマくんのはなし #14

分散公式ができた これまで(#11~#13)分散の定義式を展開・整理して、分散公式を導く、というお話をしてきました。順に振り返ってみます。 #11:カッコを展開して分身の術を使いました #12:3つ目のシグマくんに、エヌがくれの術を使いました #13:3つ目の…

シグマくんのはなし #13

分散公式を導く:つづきのつづき 前回までで、分散公式を展開し、3つのシグマくんに分身させ、さらに、3つ目のシグマくんを、エヌがくれの術で簡単にしました。今回は、残った2つ目のシグマくんを、簡単な形に変形していきます。2つめのシグマくんはこんなで…

シグマくんのはなし #12

分散公式を導く:つづき 前回は、分散の定義式を展開し、シグマくん「分身の術」を使うところまでをお話しました。前回までの式変形を整理しておきましょう。 青い数字は平均値、赤い数字は展開の途中で出てきたもので、データの数値とは区別しましょう。 で…

シグマくんのはなし #11

分散公式を導く 前回は分散の定義式の話をしました。今回は、分散の定義式を展開して、分散公式を導く、ということをしてみます。どうしてわざわざ式の展開をするかというと、式の展開の中で、シグマくんの変身術が見事に生かされるのを目撃することができる…