2017-07-23

今日単語データドレッディング(Data dredding)

擬似相関とも違う、偶然の相関のことを学問的にはどう呼ぶのだろうと昔から思ってたけど

こちらのツイート用語を知ったので共有

https://twitter.com/taka1miya/status/888725664085311488

HKのAI特番、ちょこっと見てみたが思いっきデータドレッディング(たくさんのデータがあるとデータの組み合わせの量がめちゃくちゃ増えるので妙な相関が偶然出てくる)の罠に引っかかっているように見えるな。統計の授業のネタに使えないかしら(←仕事中毒

日本語だとデータ浚渫しゅんせつ)と言うらしいです。

奥村先生サイトに載っていました。

https://oku.edu.mie-u.ac.jp/~okumura/stat/tests_and_CI.html

血液型性格関係を調べるために,A/B/AB/O,男/女,いろいろな性格検査の項目をごちゃごちゃやっているうちに,いくつか統計的有意な結果が見つかりました。 ―― こういうのを data dredging(データ浚渫しゅんせつ))といいます。いろいろやっていれば,20回に1回は有意な結果が出るものです。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん