はてなキーワード: 過学習とは
マジこれよな。どうして文章分析の話をしてたら突然「例えばよ、これを数えさせてみ? 」とか、どうした急に、って感じだよな。
本人の中では何か繋がりがあるんだろうけど、天然知能が過学習起こしてるように見えるわ
「ML失敗増田」という特定の人物についての情報は私の知識にはありません。その名前が実在する人なのか、あるいはネット上やコミュニティで使われているスラングなのかも不明です。
一般的に「ML」は機械学習(Machine Learning)を指します。機械学習ではデータを使ってモデルを訓練し、そのモデルを使って予測や分類を行います。しかし、機械学習プロジェクトには様々な失敗の可能性が伴います。例えば:
トレーニングデータにフィットしすぎて、未知のデータに対して良いパフォーマンスを発揮できない。
もし「ML失敗増田」という言葉が特定の文脈や事例に関連しているなら、その具体的な背景がわからないと更に詳しい情報や理解が得られないかもしれません。具体的な事例や文脈についてもう少し情報があれば、より詳しい説明やアドバイスができるかもしれません。
はい、Kaggleのようなブラックボックスのリーダーボードで評価する現場は存在します。
機械学習モデルの評価には、一般的に以下の2つの方法があります。
1. **ホールドアウト評価**: 学習データを訓練データとテストデータに分割し、テストデータでモデルを評価する方法。[1]
2. **ブラックボックス評価**: 評価用のデータセットが公開されず、サーバーにモデルを提出して評価される方法。Kaggleのコンペティションがこの方式。[1][2]
つまり、Kaggleのようなブラックボックス評価は、機械学習の様々な現場で採用されている評価方式の1つであり、特に実運用に近い評価が求められる場合に有効な手段となっています。[1][2][3]
Citations:
[1] https://qiita.com/Shun_PI/items/896d05ed9689f4b24347
[2] https://www.kikagaku.co.jp/kikagaku-blog/kaggle-competition/
[3] https://www.kikagaku.co.jp/kikagaku-blog/signate-competition/
[4] https://www.topgate.co.jp/blog/google-service/8707
[5] https://www.jst.go.jp/crds/pdf/2023/RR/CRDS-FY2023-RR-02.pdf
文化庁のあれで大幅な尺とっているRAGならともかく画像生成AIはほとんど問題ないと思うよ。
文化庁のあれの注釈にもあるけれど、権利制限は主に学習時点の条件のであり、「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的とする」はRAGと違って学習させた絵を直接出力するわけではないから「当該著作物の享受」になるにはコピー機レベルの過学習を意図的に行う必要になるし、「目的とする」となっていて結果ではないから例えばピカチュウの絵を出す目的で学習するとNGだけれど、いろんな画像を学習した結果ピカチュウが出力される場合もあるはOK。目的なんて学習した奴以外わかるわけないじゃんとかいくらでも嘘つけるじゃんって話は、著作権法以外での「目的」と同様に状況証拠から推認することになって、たとえば文化庁のあれだとキャラクターLoraは「享受させることを目的とする」ことが推認されうるNGパターンとして例にあげられてる。SDみたいな汎用のやつはある特定の著作物を享受させることを目的と推認できることを証明するのはかなり大変じゃないかな。
「著作権者の利益を不当に害する」も学習段階の問題でやデータセット販売などが念頭にあり、例えば、学習目的なら無断で複製できるといっても有料で売ってるものを故意に割るのはNGよの為にある。むりやり生成時点の話にしても、30条4に限らずまだ存在しない著作物の権利を特定個人に保障するなんてのがないから、例えばJOJOの画風生成AIによって JOJOの既刊が売れなくなったならともかく、まだ描いていない新しいJOJOが売れなくなるはずは通らない
増田はネタでも一言一句まんまこれ言うのがAdoちゃんの客層だからな
まぁだからこそ、彼女を売り出している大人(ブレーン)のフィルターがあるとしても、年齢から考えたら相当お行儀の良い振る舞いしてるんだが
(キッズとメンヘラばっかだから過去には自殺未遂事件とか起きちゃったみたいだし)
以下再放送
ワイくんは『飾りじゃないのよ涙は』や『罪と罰』やジャズっぽい曲がすんげぇ良かったから、フツーに歌手として活躍して欲しいけどな
画像に関して
ニュースだけ追いかけている人には、性能が上がって凄い!という感想だと思うが、
実際に定期的に触った身からすると、確かに凄いけどなんだかな、という感想だ。
プロンプト共有サイトが沢山出たが、ほぼ同じプロンプトで回っているため一通り見ると参考にならない。
多数使い回されているプロンプトより、数は少ないが自分にあったプロンプトを探す旅に出ることになり不毛だ。
動画に関して
俺という生まれも育ちも今の境遇も何一つ努力してこなかったやつの末路の話なんだけどさ
将来像とか目標とかまったく思いつかないんだよ。
はてなを見ているような君たちは、「こういう学習をしてこういうふうになりたいんだ!」とかさ「趣味を続けてたら次の目標が見えてくる」みたいな
まず目標なんて持ったところで自分という頭が悪く、怠惰を極北のようなダメ人間がその目標を達成できるわけがないという過学習が過ぎてしまって、
何もやる気が湧いてこないというのが一つある。
あとその目標を見つけるための何が、学習でも趣味でもキャリアアップとかでもそういう対象が見つからないでいる。
今だって増田を書く前は、仕事から帰ってきて3時間ぐらいXやYouTubeを焦点の合わない目で見てぼんやりと過ごしてしまって
ふとこんな虚しさに気づいたばっかりに、不安になって増田を書いている始末。