趣味の統計

心理統計のはなし(偏差への偏愛ともいう)。Web上に散らばっている「アンケート」へのつっこみ。その他。

最小二乗法体験ゲーム

アニメーションによる統計学

「数値シミュレーションで読み解く統計のしくみ」という本を読み進めています。
www.hanmoto.com
前回に続いて、相関係数のシミュレーションからヒントを得たものです。

最小二乗法を体験しよう

前回のゲームは、プロットから直感的に回帰直線を予想する、というものでした。それと同じようなゲームをもう一つ作っています。「最小二乗法体験ゲーム」です。何が違うかというと、

  • プロットの数が少ない=予測がけっこう難しい。
  • 各プロットの残差と残差平方がヒントになる
  • 切片と傾きの組合せを3種類まで保存できる=これもヒントになる

リンクを開くとこんな画面になります。

データが赤い点でプロットされていて、現在の回帰直線(画面外)までの残差が垂直な線で示されています。青い数字は残差の大きさ、カッコ内はその二乗です。要するに、すべてのプロットの残差二乗の総和が、一番小さくなるように、切片と傾きを調整すればいいことになります。なあんだ、計算すればいいのか? とも思いますが、さまざまな組み合わせをすべて計算するのは面倒ですね。

設定を記録する

切片と傾きを調整すると、それらしい回帰直線が引けます。「こんな感じかな?」という設定を記録しましょう。残差二乗和を計算してくれます。

ここでは5.90になっていますね。残差平方和がこれより小さくなる設定があれば、より正解に近づきます。

さっきより近づきましたね。正解を見てみましょう。「判定」を押します。

あらら。もっと傾きが小さいのが正解なのですね。難しい。

見た目に惑わされないために

プロットの見た目と、回帰係数は、案外一致しません。ああ、意外に難しいんだなあ、ということを体験すると、分析ツールの「すごさ」がより実感できるのでは? と、こじつけています。

こちらのリンクからどうぞ

遊んでみてください。ご感想はこのブログのコメントに書いてくださいね。
almondfish.starfree.jp