はてなキーワード: 中心極限定理とは
期待値がマイナスな、一般的なギャンブルの場合の話。パチプロさんだとか、競馬の分析屋さんだとかみたいに、期待値がプラス、あるいはそうだと思い込んでいる人には関係の無い話。
俺は特にギャンブルとかやらない。パチンコ打ったこともなければ、宝くじ買ったこともないけど。別に嫌悪してるわけじゃなく、たまにやってみるくらいならいいんじゃない?と思ってる。
特に宝くじなんて、数百円、数千円が下手すりゃ億単位に化ける可能性のあるシロモノだし、こんだけ低リスクかつ低コストでこんなに大きいリターンの可能性があるものって他にないからね。
けれども、絶対に数打っちゃいかん。金銭的な意味で言ってるのじゃなく、たとえ安くても、数打っちゃいかん。
これは簡単に言えば、回数を重ねれば重ねるほど「運」ではどうにもならなくなる。運がよくても勝てなくなる。そういう定理。
もっと直感的に言うと、道行く見知らぬ人5人に誕生日を聞いて、その中に自分と同じ誕生日の人が1人でもいる、そういうことは運がよければありうることだ。
けれど、500人に誕生日を聞いて、その中に自分と同じ誕生日の人が100人いる、そんなことはまず有り得ない。どんなに運がよくても2桁もいかない。回数を重ねれば重ねるほど運は力を失い、期待値通りの数字しか出なくなる。
ギャンブルでは「期待値通り=マイナス」なので、回数を重ねれば重ねるほど「もしかしたら勝てる!勝てるかもしれない」から「勝てない。運ではどうにもならない」に変わっていく。
だから、数を打っちゃいけない。
ところで、最近1円パチンコとか5円スロットが流行ってるらしいけど、そんなの好き好んで負けに行ってるようなものじゃないの?
ちょっと齟齬があるようだけど、「線形」というのは確率過程もある意味で含んでるよ。
確率的な世界での「線形」に対応するのは正規分布。あと再生性が成り立つ確率分布を暗に前提にするとか、中心極限定理が成り立つと前提にしちゃうとかだな。
統計的な話では線形モデルを最尤推定でフィッティングしちゃう、みたいなケースだな。
まー隠れマルコフモデルとかを使ったところで、データ観測期間内で遷移行列の構造が変化しない、という前提を置いてるわけで実際は結構無力だと思う。
数量的な分析、あるいは科学的っぽいロジックってのは何となく説得力あるけどね、実際はかなり無力だよってことを念頭に置いてほしいってことかな。
その辺。
の意味が俺はちょっとよく理解できないけど、普通「母数」と言ったときの意味は
「母集団の任意の確率変数が従う分布関数を特徴づけるパラメータ」のこと。
正規分布ならexp(-(x-μ)^2/2σ^2)のμとσのことだし、他の分布なら何か別の量になる。
通常母数は未知だから、母集団から適当な標本を観測して推定することになる。
そのためのテクニックが、最尤推定だったり母数自身に事前確率分布を指定したベイズ推定だったりする。
(ちなみに母数自身の確率分布の母数をハイパーパラメータと言う)
標本の数は多ければ多いほどよくて、分布関数が普通の分布なら、中心極限定理などによって
標本数が多いほど母数の推定精度が向上したりする。
というわけで、母数と標本数は全く別の概念なんだよね…。