「中心極限定理」を含む日記 RSS

はてなキーワード: 中心極限定理とは

2021-08-27

anond:20210826235411

使わざるを得ないのはいいんだけど、だからってポエム統計学言葉を雑に入れ込むのはやめて欲しいというだけ。「稀な事象ノイズとして棄却する」のはガウス的な裾の薄いノイズモデルを前提としてるからで、統計ソフトを何も考えずにポチポチするだけなら暗黙にガウス仮定してp値とか出すんだろうけど、それは統計学全体像というわけでは全くないから。なんのために冪分布だの一般中心極限定理だの漸近正規でない漸近論などが整備されてきたと思ってるんだ。

2021-01-06

anond:20210106012451

「結果がガウス分布になるように調整」というのは本質的にできないよ。その意味は「データからガウス分布をフィッティングした」という意味しかない。例えば範囲付きで直線状になる分布関数が得られてしまった場合や一様分布になってしまった場合を考えてみればよい(一様分布と言うとBox-Muller変換を思い浮かべてしまうかもしれないけど、あれはサンプリングの話なので)。

モーメントというのは、確率分布関数があったらそのz変換のようなものとしてモーメント母関数というもの定義することができて、モーメント母関数のn回微分をn次のモーメントと言ってx^nの期待値に一致することから来ている。だから平均を1次モーメント、分散を2次モーメントと言う。

あとべき分布コーシー分布は別物だよ。べき分布はp(x) ~ x^{-a}となるような分布のことで、他のレスにも書いたけどx>>1でのp(x)の挙動がそれに従うという意味で言うことが多い。コーシー分布もそうだけど1次や2次のモーメントが発散するような分布に従う変数については中心極限定理が成立しないんだけど、それでも一般中心極限定理というのが成立する場合があってそのような変数の和は安定分布という分布に従うことがある。安定分布の裾はべき分布になってる。

2019-10-07

[]記録二十七日目

筋トレ

ホリゾンタルレッグプレス 140-120-100 kgで15回ずつ2セット

腕立て伏せ(筋肉体操)

ランニングマシン

距離: 7.0 km

速度: 時速10 kmで4キロ、時速15 kmで3キロ

消費: 616 kcal

運動中: どろろ16,17 話の視聴

組成

体重: 80.7 kg

体脂肪率: 25.0 %

筋肉量 57.4 kg

筋肉評価 +2

雑記

標準誤差についてちょうど学んだので簡単にまとめる。

中心極限定理は「平均μ、標準偏差σを持つ母集団(分布の形状は問わない)からサンプルサイズnの標本を抽出することを繰り返す場合抽出した値から計算した平均値は、nが大きいほど平均μ、標準偏差σ/√nの正規分布に従って分布する」というもの。ここで登場した標準偏差σ/√nが標準誤差。

サイコロについて考える。1から6までの値が一様に出るため、平均μは3.5, 標準偏差σは√(35/12)≒1.708。サイコロの出目の母集団から無作為にn個取り出して、平均を求める試行を考える。標準誤差はσ/√nで求まる。

例えばサイコロ3回平均の出目は、信頼区間を95%取ってμ±(σ/√n)×2=3.5±1.97に入ると推測されます。じゃあ実際に振ってみましょう。ここにサイコロはなかったのでパソコンを使います。[3, 2, 1]と出ました。平均は2。信頼区間範囲内に入ってますね。

10回だと信頼区間は3.5 ± 1.08。ちょっと範囲が狭くなりました。サイコロ10回振ってみると、[6 1 1 6 1 6 3 6 2 2]で平均は3.40。範囲内です。100回だと信頼区間は3.5 ± 0.34。だいぶ小さくなりましたが、100回振ってみると平均は3.74、範囲内に入りました。

で、これを逆向きに使うと今度は「標本の平均値標準偏差から母集団平均値」の信頼区間計算できて...って話をしようと思ったけどで話が長くなったので終わりにします。

2019-09-16

anond:20190915130435

平均顔も平均声も中心極限定理やぞ

大きな集団の平均は母集団の平均に近づくやつ

2019-07-21

線形代数やら微積分やら結局わからなかった

社会科学大学院生

今日をもってこれらを体系的に身に着けることをあきらめた。

思えば統計学を学び始めたのがきっかけだった。

中心極限定理やF分布についてふわっと学ぶ度、こういうものを本当に理解するためには大学数学知識必要なんだろうなと漠然と感じていた。

研究室はそういうところを専門とはしておらず、ただあくまツールとして、回帰分析回したり分散分析するくらいでよかった。

就職先は金融ではあるけれどクオンツアクチュアリー職ではないから、たぶんそういうものの出番はない。

バカな僕は数理統計を学ばずにいて統計を用いた研究やるなんて、ちゃんちゃらおかしいと思っていたし、

就職先でもそういうことを学んでいれば周りよりも一歩二歩先を行けると信じていた。

しかし、マセマをやっても定評のある教科書を終えても、なんだか自分が思ったほどできるようにはなっていないことに気づいた。

やってることと言えば、学ぶ前も後も全く同じように回帰を回し、p値を眺めてあーだこーだ言ってるだけだった。

p値ハックの記事ベイズ有用性を目にするたびに自責の念かられてつらくなる。

しかしたら自分がやったことは無駄だったのかもしれないと思うようになる。

就活を終え、今一度参考書に取り組んでも、抜け落ちているところがいくつもあったことに絶望してノートもすべて捨ててしまった。

こうした知識必要コミュニティとは違ったところに自分いたことに気づけていなかったんじゃないだろうか

2018-09-29

アラン・チューリングについてのメモ


anond:20180929230408

2017-10-26

科学教徒の分際で宗教馬鹿にするな

科学教徒

モデル/理論/原理計算/設計整合的な測定結果が得られたぞ!

俺は現代科学技術フロンティアの縁に足跡を残したぞ!

やった!!

宗教

それは神の意思だぞ.

もしくはお前の徳のなせるわざだぞ.

あるいはただの偶然だぞ.

お前が真に偉大なるものに対する信仰を失えば, 明日にも中心極限定理崩壊するぞ(怖い脅し).

--

このように科学宗教は両立する.

2012-05-28

http://anond.hatelabo.jp/20110905180453

そもそも検定というのは、

「A(とB)は性質Xを満たすかもしれない」

という仮定があったとき

「もし「A(とB)は性質Xを満たす」としたら、A(とB)の統計量Fは分布Dに従うはず。

 それでは実際にそうなるか、見てみよう」

というテストを行うこと。

(どれだけ頑張っても「本当にAは性質Xを満たすのか?」が100%確実になることはないことに注意。)

カイ二乗分布というのは上の説明のうち「D」にあたるところによく用いられる、特別な分布

どんな分布でも数集めた平均が正規分布に従う(中心極限定理)ように、

ある種の統計量がどんな分布であっても近似的にカイ二乗分布に従うことが分かっている。

特に、「AとBが性質「独立である」を満たす」の検定に使われることが多い。

2011-03-16

http://anond.hatelabo.jp/20110316195034

そりゃおめーの訊き方が悪かっただけじゃねーの?

中心極限定理証明はどうするんですか?」と訊かれて「キュムラント展開しろよ」と答えるだけとか、そういうレベルで。

http://anond.hatelabo.jp/20110316193534

数学科出身の派遣さん統計のことで教えてもらおうとしたら、

統計学は専門だったのでなんでも聞いてください!」

と得意げだったんだけど、実際に聞きたいことを尋ねてみると

「どういう事象にどの統計モデルを用いるかやどう解析するかは守備範囲はないのでちょっとわかりません」

と言われてしまった。

いったいどんな質問がくると思っていたのだろうか?

製造部の俺が中心極限定理証明について聞くとでも思ったんだろうか?

2010-11-12

http://anond.hatelabo.jp/20101112155416

生涯賃金(多分0に漸近)

生涯賃金が漸近って意味わかんねーな。

人生サンプリングでもして中心極限定理的な感じのことを言ってるのかな。

漸近分布が求まったところで、実際の単一人生の実現に関してはあんま意味無いし、そもそも漸近分布が使えるほど人生のサンプルを集めるのが困難っぽいよなあ。

2010-07-14

中心極限定理名前のかっこよさは異常

主張もかなりイカしてると思うけど

2010-05-10

ギャンブルは、ハマればハマるほど、得する確率が低くなる。

期待値マイナスな、一般的なギャンブル場合の話。パチプロさんだとか、競馬の分析屋さんだとかみたいに、期待値プラス、あるいはそうだと思い込んでいる人には関係の無い話。

俺は特にギャンブルとかやらない。パチンコ打ったこともなければ、宝くじ買ったこともないけど。別に嫌悪してるわけじゃなく、たまにやってみるくらいならいいんじゃない?と思ってる。

特に宝くじなんて、数百円、数千円が下手すりゃ億単位に化ける可能性のあるシロモノだし、こんだけ低リスクかつ低コストでこんなに大きいリターンの可能性があるものって他にないからね。

けれども、絶対に数打っちゃいかん。金銭的な意味で言ってるのじゃなく、たとえ安くても、数打っちゃいかん。

統計学って分野に、中心極限定理という大事な定理がある。

これは簡単に言えば、回数を重ねれば重ねるほど「運」ではどうにもならなくなる。運がよくても勝てなくなる。そういう定理

もっと直感的に言うと、道行く見知らぬ人5人に誕生日を聞いて、その中に自分と同じ誕生日の人が1人でもいる、そういうことは運がよければありうることだ。

けれど、500人に誕生日を聞いて、その中に自分と同じ誕生日の人が100人いる、そんなことはまず有り得ない。どんなに運がよくても2桁もいかない。回数を重ねれば重ねるほど運は力を失い、期待値通りの数字しか出なくなる。

ギャンブルでは「期待値通り=マイナス」なので、回数を重ねれば重ねるほど「もしかしたら勝てる!勝てるかもしれない」から「勝てない。運ではどうにもならない」に変わっていく。

だから、数を打っちゃいけない。

ところで、最近1円パチンコとか5円スロット流行ってるらしいけど、そんなの好き好んで負けに行ってるようなものじゃないの?

2009-01-09

http://anond.hatelabo.jp/20090109182559

いやそーいう話じゃなくて、種としての多様性を保つための統計的サンプルを1個か2個提供しろってことじゃね?

普通人間中心極限定理に埋もれるサンプルくらいの価値しか無いでしょ。

たまに圧倒的にイレギュラーな奴がいて全体の統計性に影響与えたりするわけで。

2008-12-08

http://anond.hatelabo.jp/20081208233008

ちょっと齟齬があるようだけど、「線形」というのは確率過程もある意味で含んでるよ。

確率的な世界での「線形」に対応するのは正規分布。あと再生性が成り立つ確率分布を暗に前提にするとか、中心極限定理が成り立つと前提にしちゃうとかだな。

統計的な話では線形モデル最尤推定でフィッティングしちゃう、みたいなケースだな。

まー隠れマルコフモデルとかを使ったところで、データ観測期間内で遷移行列構造が変化しない、という前提を置いてるわけで実際は結構無力だと思う。

数量的な分析、あるいは科学的っぽいロジックってのは何となく説得力あるけどね、実際はかなり無力だよってことを念頭に置いてほしいってことかな。

2008-10-01

http://anond.hatelabo.jp/20081001141726

その辺。

母集団の媒介変数

意味が俺はちょっとよく理解できないけど、普通「母数」と言ったときの意味

母集団の任意の確率変数が従う分布関数を特徴づけるパラメータ」のこと。

正規分布ならexp(-(x-μ)^2/2σ^2)のμとσのことだし、他の分布なら何か別の量になる。

通常母数は未知だから、母集団から適当な標本を観測して推定することになる。

そのためのテクニックが、最尤推定だったり母数自身に事前確率分布を指定したベイズ推定だったりする。

(ちなみに母数自身の確率分布の母数をハイパーパラメータと言う)

標本の数は多ければ多いほどよくて、分布関数普通の分布なら、中心極限定理などによって

標本数が多いほど母数の推定精度が向上したりする。

というわけで、母数と標本数は全く別の概念なんだよね…。

2008-08-28

http://anond.hatelabo.jp/20080828202008

購入者数が少なすぎて統計的揺らぎの効果が大きすぎて(中心極限定理からのずれが大きくて)

リスク管理できないと思うね。ファンドの規模小さくて証券化も困難だろうしね。

2008-03-13

http://anond.hatelabo.jp/20080313121625

最低限このくらい理解してない場合は、経済とか語るのやめてもらう。

そうしたら世の中もう少しスッキリすると思う。

 
ログイン ユーザー登録
ようこそ ゲスト さん