知ってるから「100%なんて言うのは不毛だ」という話になったんだろ
100%じゃないなんてのは当たり前の話でそんな話が出てくる事自体もうダメだし サンプル数より95か99かって話だしなんならバイナリなんだからデータ50・50じゃないだろうし色々ダ...
100%じゃないなんてのは当たり前の話でそんな話が出てくる事自体もうダメだし 当たり前がわかってない奴が社内にいる状況で前提知識を揃えるという話ね サンプル数より95か99か...
まあ君の上司が完全に無知なのを君のせいにするのは確かに酷だが 評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ 不均衡でダメだと現場で使えないだろ...
ちゃんと評価の方法があるよ、じゃねぇんだよ 大抵はclassification reportとかAUCを出力すればそれなりに評価は可能だろ、そんなのは常識レベルの話、お前の初心者知見など求めてない
はいはいそうですね
評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ 大抵はclassification reportとかAUCを出力すればそれなりに評価は可能 内容分かってないでscikit learn弄って...
分かるって何が?
F1の式とかやな
それ、classification reportって単語がわかってればF1の式をわかってる前提で話していると思わない?
評価の際には不均衡データではダメ、なんてのはそれこそわかりきった話だろ 普通不均衡だしだからアキュラシーじゃなくてF1使うわけなのでね
だからclassification reportを使えばF1出るだろ?
そうじゃなくて、正規のテストデータを作る場合はラベルのバランスをある程度気をつけろという話だと思うが...