生データというのは、そういうもの。３割ぐらいがノイズ。へたすりゃ９割..

はてな匿名ダイアリー

2020-09-03

■

生データというのは、そういうもの。

３割ぐらいがノイズ。

へたすりゃ９割ノイズ。

ここから、目的とする対象群をどうやって抽出するか？とその抽出はほんとうにランダムサンプリングに近い母集団での抽出と言えるか？ノイズを切り落とす時に恣意的になりすぎていないか？

ものすごく大変

なにがしたいかによって、切り落とすデータが違う。まちがえて切り落とすと違うデータになっちまう。

Permalink | 記事への反応(1) | 10:14

記事への反応 -

anond:20200903101435
対象とする要素を持つ、母集団でのランダムサンプリングはランダムか？

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん