「ヒストグラム」を含む日記 RSS

はてなキーワード: ヒストグラムとは

2008-09-04

http://anond.hatelabo.jp/20080903232620

Eカップを例にとる。

A:普通女性

B:AV女優

E:Eカップである、という観測データ

とすると

P(E|A) = 0.1

P(E|B) = 0.19

となる。

全女性に対するAV女優の割合は、適当にググったところ0.4%とからしい。めんどくさいんで0.5%とすると

P(A) = 0.995

P(B) = 0.005

だ。これらをベイズの定理に代入すると

p(B|E) = P(E|B)P(B)/(P(E|A)P(A) + P(E|B)P(B)) = 0.0095 = 0.95%

となって、若干確率が上昇することがわかる。

ちなみに、より極端な場合でGカップを例にとると

p(B|G) = 5.6%

となって、10倍くらいになるね!

ベイズのいい練習になった

【追記】

実際は、観測データヒストグラムから分布関数を推定する問題をまず初めに解く必要があると思う。

結構裾が長い分布だから、正規分布じゃなくてポアソン分布あたりでパラメトリック推定すればいいか?

上の計算ではそれを省略してヒストグラムをそのまま確率だと思って使った。

2007-02-27

http://anond.hatelabo.jp/20070225184324

まあそうだよね。わからんよね。おおむね同意。

リスクリスクと巷で言うけど、これほど難しい概念はないよね。ちょっと詳しく言うと、リスクというのはヒストグラムで表すことができる変動のことをいう。つまり、まったくのランダムではない(まったくのランダムで起こる事象は「不確実性」とよぶ)、あるスパンの中での変動ということ。

そいで、リスクという概念は「あくまで起こるまで」の話であって、過去をふりかえって「ほれみろ、違ったじゃん」という話ではない。これもなかなかとっつきにくい考え方だと思う。

リスクは、確率(%)で表すこともあるけれど、これも一定以上の母数がないかぎり実用性はないよね。個人で行うときなんか、いくらリスクという概念を知ってようが、結局のところ「ノルかソルか」の世界になっちゃうんだよな。元がたくさんあれば話は違うのだろうけどね。

ログイン ユーザー登録
ようこそ ゲスト さん