だからバリデーションと分けるんだけど謎のテストデータがどこかにあった..

はてな匿名ダイアリー

2024-05-29

■anond:20240529160542

だからバリデーションと分けるんだけど

謎のテストデータがどこかにあったら一回しか使えないだろ

Permalink | 記事への反応(1) | 16:08

記事への反応 -

anond:20240529154622
だからclassification reportを使えばF1出るだろ？
- anond:20240529154817
  それ単なるライブラリの機能なので何やってるか分かってれば評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろって言葉は出ないんですよ
  - anond:20240529155023
    不均衡に関しては、テストデータを作る際のラベルの分量のバランスを気をつけろという話ねいくらAUCやF1で良い精度が出たと言っても、実データの分布で実用レベルの結果が出ないと...
    - anond:20240529155239
      いやバランス弄ってテストデータ作ってる時点でテストデータじゃないから実データを分けるんだよ
      - anond:20240529160226
        お前、ホールドアウト分割したところで実用のテストにならんのまず理解してる？訓練データの分布で話してるよねそれ
        anond:20240529160542
        だからバリデーションと分けるんだけど謎のテストデータがどこかにあったら一回しか使えないだろ
        anond:20240529160835
        コンペみたいにリーダーボードで評価するようにするんだよ、知らんのか？テストデータを「1回しか利用できない」なんてことはなく、ラベルを開発者にバラさなければいい
        anond:20240529161108
        だからそれで評価されるまで性能上げてったらオーバーフィッティングやろまして１００パーセントの上司だろ？
        anond:20240529161624
        だから期限と一日あたりのモデル送信数にを設けるんだよそれを超えたらテストデータ自体を更新するどちらにせよ、ホールドアウト分割よりは過学習を防げる
        anond:20240529162025
        あークロスバリデーションでバリデーションセットとテストセットの話なんだよねバリデーションとテストってさんざ言ってるんだから知ってればわかると思うけど
        anond:20240529163303
        バリデーションとテストと分けたところで、ホールドアウト分割だろ？交差検証してもホールドアウト分割だろ？
        anond:20240529163457
        k fold cross validationとholdoutは違いますね
        anond:20240529163634
        わかってないのはお前だろホールドアウト分割を繰り返してるんだよ交差検証ってのはテストデータのブラックボックステストってのはそれとは別で、マニュアルでアノテーションして...
        anond:20240529163634
        はい、交差検証法はホールドアウト分割を繰り返し行う手法です。 ## 交差検証法の手順 1. データセットを複数のフォールド(部分集合)に分割する。[1][2] 2. 1つのフォールドをテストデ...
        anond:20240529163925
        ChatGPTかな？
        anond:20240529163634
        ルー大柴になればイキれると思ったの？
        anond:20240529164018
        ルー大柴が決め台詞w
        anond:20240529160542
        君Kaggleしかやった事ないのでは？ブラックボックスのテストデータはプロダクションではあり得ないぞあるとすれば新たに入ってくる生データ
        anond:20240529161046
        ブラックボックスのテストがありえない？何いってんだお前？むしろブラックボックス以外のテストはできないだろ、頭おかしいのか？開発者がテストデータのラベルを見れる時点で、...
        anond:20240529161306
        あーやっぱコース受けた方がいいよ
        anond:20240529163337
        はい、Kaggleのようなブラックボックスのリーダーボードで評価する現場は存在します。 ## 機械学習モデルの評価方法機械学習モデルの評価には、一般的に以下の2つの方法があります。...
  - anond:20240529155023
    ライブラリの機能にしろ、F1を出力することがわかってるなら、F1について事前知識があると考えるのが妥当である。
  - anond:20240529155023
    横だけど、なんか相手を否定したいがために必死になってるのがわかりますなぁw コテハンに誹謗中傷すると訴えられるからほどほどにねｗ
    - anond:20240529155951
      はいはい
    - anond:20240529155951
      評価の際には不均衡データではダメは、まともにやったことある人なら完全におかしいのわかるけどね
      - anond:20240529160440
        訓練データの分布が、99%がTrueで1%がFalseってタイプのやつだとするだろ？それでそのまま評価するにしろ、F1を使うにしろ、実用の精度の評価は難しいんよなぜって？「ほぼTrueでいける...
        anond:20240529161006
        それ「評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ」ってなりますかね？
        anond:20240529161433
        「わかりきった話」という言葉のチョイスは間違えたかも知れないが、テストデータが不均衡だと不都合すると言いたかった

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん