2020-03-26

志村けん感染した事象統計学的優位性

コロナ関連のブコメ、まあ無茶苦茶なのはから指摘されていたけど、今日見かけたhttps://b.hatena.ne.jp/entry/s/twitter.com/Sukuitohananika/status/1242698846032953345もなかなかひどいので書かせてくれ。

まず、このツイート主が言いたいことを統計学的言葉に訳せば、「東京都民有名人率N人/900万人の下、ランダム都民200人の一人が有名人であるという事象確率は例えば95%信頼区間に入っているか?」ということなのはどこからどう見ても明らか、だよね。それ以外に解釈のしようがない。140文字言い訳にならんよ。

そうすると、まず一次の近似として、とにかく感染者とかそういう属性は取っ払って、有名人数は集合の数に対して有名人率のもとでの二項分布に従うと思っていいよね。で、『超有名人』の数をリプにあったようにN=5000人だと思ってhttps://keisan.casio.jp/exec/system/1161228843とか使って計算してみると確率10%。統計的には有意ではない、つまりまあそういうことはあってもおかしくないというのが結論になる。ということで結論としては、元ツイートは誤りである、つまり都民の真の感染者数と志村けん感染は無矛盾である、ということが統計的にわかる。これはまあ感覚的にもうなずけて、有名人期待値が1になるような感染者数が2000人くらいなので、まあ1/10くらい下ブレしても10%くらいで起きてもおかしくはないだろう。

もちろん、有名人の真の感染確率都民感染確率が同じなのか?とかそういう問題はあるけども、市内感染が起きている現状でこれは悪くない近似ではあろう。

で、実際岩田教授もまさにそういうリプライをしているのだけど(フィッシャー検定というの、増田は知らなかった)、ブコメ無茶苦茶事実じゃないだの志村けんは一人だのプライヤーがどうのだの芸能人からなんだのまあなんとも的外れなのばっか。というか、上の結論からもわかるように、統計学的には95%で無矛盾なので、このツイートに「反論」を試みている君たちは「市中感染がとんでもなく広まっている」という言説を補強しようとしているの?まずは一番シンプル仮定でp値を計算してくれよ。

普段ニセ科学がどうたら言っている割にこういうときになると本当にレベルが低いことが露呈してびっくりしてしまう。

  • おまえがしこしこ計算した結果をブコメに書き残せばええだけやろ。他人のせいにするな。

  • 確立統計専門ではないが、 (5000 / 9,000,000) * 200 = 0.1 で0.1が1人になるには10倍 よって、200 * 10 = 2000人みたいな感じだろうか これはこれで、なんかモヤモヤするなあ…

  • みんなそんなのもちろん分かった上で統計できないアホの子ごっこしてるのに…

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん