2013-07-22

よくある統計ミス

統計博士課程の学生論文であるミスの8割なんだけど。

だいたいパターンが決まっている

原因と結果の関係

 「朝ごはんを食べる子は勉強がよくできる」という統計があったとする。

 朝ごはんを食べた子を調べてみると、朝ごはんを食べなかった子より、平均点がよかった。 というのが根拠だったとする。

 しかし、

 成績がいい子→親の愛情が深くなりがち→朝ごはんをちゃんと親が作る。

 ということなのかもしれず、

 朝ごはんを食べさせる→成績がいい

 かどうかは言い切れない。

どっちが正しいかを確定する手法は?

 オッズ比というのを使います

朝ごはんを食べて成績がいい子」

朝ごはんを食べて成績が悪い子」

朝ごはんを食べす成績がいい子」

朝ごはんを食べず成績が悪い子」

 この4つの比率を調べます

 これにより、「朝ごはんを食べる」→「成績のいい子」 となるのか 「成績のいい子」→「朝ごはんを食べる」 となるのか。 はたまた「成績のいい子」→「朝ごはんを食べないのか」それとも、朝ごはんと成績は関係が無いのか。

 これらのどれかを確定させることができます

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん