評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だ..

はてな匿名ダイアリー

2024-05-29

■anond:20240529153307

評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ

大抵はclassification reportとかAUCを出力すればそれなりに評価は可能

内容分かってないでscikit learn弄ってるだけだとこうなる

Permalink | 記事への反応(1) | 15:39

記事への反応 -

anond:20240529152102
知ってるから「100%なんて言うのは不毛だ」という話になったんだろ
- anond:20240529152204
  100％じゃないなんてのは当たり前の話でそんな話が出てくる事自体もうダメだしサンプル数より95か99かって話だしなんならバイナリなんだからデータ５０・５０じゃないだろうし色々ダ...
  - anond:20240529152445
    100％じゃないなんてのは当たり前の話でそんな話が出てくる事自体もうダメだし当たり前がわかってない奴が社内にいる状況で前提知識を揃えるという話ねサンプル数より95か99か...
    - anond:20240529152648
      まあ君の上司が完全に無知なのを君のせいにするのは確かに酷だが評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ不均衡でダメだと現場で使えないだろ...
      - anond:20240529152919
        ちゃんと評価の方法があるよ、じゃねぇんだよ大抵はclassification reportとかAUCを出力すればそれなりに評価は可能だろ、そんなのは常識レベルの話、お前の初心者知見など求めてない
        anond:20240529153307
        評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ大抵はclassification reportとかAUCを出力すればそれなりに評価は可能内容分かってないでscikit learn弄って...
        anond:20240529153939
        分かるって何が？
        anond:20240529154126
        F1の式とかやな
        anond:20240529154316
        それ、classification reportって単語がわかってればF1の式をわかってる前提で話していると思わない？
        anond:20240529154357
        評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ普通不均衡だしだからアキュラシーじゃなくてF1使うわけなのでね
        anond:20240529154622
        だからclassification reportを使えばF1出るだろ？
        anond:20240529154817
        それ単なるライブラリの機能なので何やってるか分かってれば評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろって言葉は出ないんですよ
        anond:20240529155023
        不均衡に関しては、テストデータを作る際のラベルの分量のバランスを気をつけろという話ねいくらAUCやF1で良い精度が出たと言っても、実データの分布で実用レベルの結果が出ないと...
        anond:20240529155239
        いやバランス弄ってテストデータ作ってる時点でテストデータじゃないから実データを分けるんだよ
        anond:20240529160226
        お前、ホールドアウト分割したところで実用のテストにならんのまず理解してる？訓練データの分布で話してるよねそれ
        anond:20240529160542
        だからバリデーションと分けるんだけど謎のテストデータがどこかにあったら一回しか使えないだろ
        anond:20240529160542
        君Kaggleしかやった事ないのでは？ブラックボックスのテストデータはプロダクションではあり得ないぞあるとすれば新たに入ってくる生データ
        anond:20240529155023
        ライブラリの機能にしろ、F1を出力することがわかってるなら、F1について事前知識があると考えるのが妥当である。
        anond:20240529155023
        横だけど、なんか相手を否定したいがために必死になってるのがわかりますなぁw コテハンに誹謗中傷すると訴えられるからほどほどにねｗ
        anond:20240529155951
        はいはい
        anond:20240529155951
        評価の際には不均衡データではダメは、まともにやったことある人なら完全におかしいのわかるけどね
        anond:20240529160440
        訓練データの分布が、99%がTrueで1%がFalseってタイプのやつだとするだろ？それでそのまま評価するにしろ、F1を使うにしろ、実用の精度の評価は難しいんよなぜって？「ほぼTrueでいける...
        anond:20240529161006
        それ「評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ」ってなりますかね？
        anond:20240529154622
        そうじゃなくて、正規のテストデータを作る場合はラベルのバランスをある程度気をつけろという話だと思うが...
        anond:20240529155027
        ん？ラベルの「バランス」って？手動で合わせるの？
        anond:20240529153307
        はいはいそうですね

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん