「過学習」を含む日記 RSS

はてなキーワード: 過学習とは

2024-06-14

anond:20240614192019

マジこれよな。どうして文章分析の話をしてたら突然「例えばよ、これを数えさせてみ? 」とか、どうした急に、って感じだよな。

本人の中では何か繋がりがあるんだろうけど、天然知能が過学習起こしてるように見えるわ

2024-06-09

anond:20240609225545

ML失敗増田」という特定人物についての情報は私の知識にはありません。その名前実在する人なのか、あるいはネット上やコミュニティで使われているスラングなのかも不明です。

一般的に「ML」は機械学習Machine Learning)を指します。機械学習ではデータを使ってモデルを訓練し、そのモデルを使って予測や分類を行いますしかし、機械学習プロジェクトには様々な失敗の可能性が伴います。例えば:

データの質が悪い

不足しているデータノイズが多すぎるデータなど。

アルゴリズムの選定ミス

問題に適さなアルゴリズムを選んでしまう。

過適合/過学習

トレーニングデータフィットしすぎて、未知のデータに対して良いパフォーマンスを発揮できない。

不足する資源

コンピューティングリソース時間が足りない。

評価メトリクスの誤り

モデルの性能を誤って評価してしまう。

もし「ML失敗増田」という言葉特定文脈や事例に関連しているなら、その具体的な背景がわからないと更に詳しい情報理解が得られないかもしれません。具体的な事例や文脈についてもう少し情報があれば、より詳しい説明アドバイスができるかもしれません。

2024-05-29

anond:20240529163337

はい、Kaggleのようなブラックボックスリーダーボード評価する現場存在します。

## 機械学習モデル評価方法

機械学習モデル評価には、一般的に以下の2つの方法があります

1. **ホールドアウト評価**: 学習データを訓練データテストデータに分割し、テストデータモデル評価する方法。[1]

2. **ブラックボックス評価**: 評価用のデータセットが公開されず、サーバーモデルを提出して評価される方法。Kaggleのコンペティションがこの方式。[1][2]

## ブラックボックス評価の利点

ブラックボックス評価には以下のような利点があります

## ブラックボックス評価現場

まり、Kaggleのようなブラックボックス評価は、機械学習の様々な現場採用されている評価方式の1つであり、特に運用に近い評価が求められる場合有効手段となっています。[1][2][3]

Citations:

[1] https://qiita.com/Shun_PI/items/896d05ed9689f4b24347

[2] https://www.kikagaku.co.jp/kikagaku-blog/kaggle-competition/

[3] https://www.kikagaku.co.jp/kikagaku-blog/signate-competition/

[4] https://www.topgate.co.jp/blog/google-service/8707

[5] https://www.jst.go.jp/crds/pdf/2023/RR/CRDS-FY2023-RR-02.pdf

anond:20240529161624

から期限と一日あたりのモデル送信数に設けるんだよ

それを超えたらテストデータ自体更新する

どちらにせよ、ホールドアウト分割よりは過学習を防げる

2024-05-16

anond:20240516174203

すると、実際に販売している各メーカーは全部嘘をついてるって言いたいの?

それを受けて報道している新聞社技術系の出版社なども全部嘘で、「「疑似量子」って単語存在するかしないか」って段階だと言いたいのか?

すげーな。どんな過学習するとこんな天然知能が出来ちゃうんだろ。

2024-03-06

anond:20240223154325

そら「男に都合の良い女とそれを成立させる創作世界観」というステレオタイプ過学習したらそうなるんだろ

2024-03-05

anond:20240305170114

文化庁のあれで大幅な尺とっているRAGならともかく画像生成AIほとんど問題ないと思うよ。

文化庁のあれの注釈にもあるけれど、権利制限は主に学習時点の条件のであり、「当該著作物表現された思想又は感情を自ら享受し又は他人享受させることを目的とする」はRAGと違って学習させた絵を直接出力するわけではないから「当該著作物享受」になるにはコピー機レベル過学習意図的に行う必要になるし、「目的とする」となっていて結果ではないから例えばピカチュウの絵を出す目的学習するとNGだけれど、いろんな画像学習した結果ピカチュウが出力される場合もあるはOK。目的なんて学習した奴以外わかるわけないじゃんとかいくらでも嘘つけるじゃんって話は、著作権法以外での「目的」と同様に状況証拠から推認することになって、たとえば文化庁のあれだとキャラクターLoraは「享受させることを目的とする」ことが推認されうるNGパターンとして例にあげられてる。SDみたいな汎用のやつはある特定著作物享受させることを目的推認できることを証明するのはかなり大変じゃないかな。

著作権者利益を不当に害する」も学習段階の問題でやデータセット販売などが念頭にあり、例えば、学習目的なら無断で複製できるといっても有料で売ってるもの故意に割るのはNGよの為にある。むりやり生成時点の話にしても、30条4に限らずまだ存在しない著作物権利特定個人保障するなんてのがないから、例えばJOJOの画風生成AIによって JOJOの既刊が売れなくなったならともかく、まだ描いていない新しいJOJOが売れなくなるはずは通らない

2024-03-04

anond:20240304115359

ABAにおけるmaskingってASD向けの話よね?

まりよく分かってなかったから改めて調べたけど

ASDに絞って書いたつもりはないんだよな


ASDというより、むしろ伝統政治家経営者にはADHDが多いと思うのよ

過集中・過学習によって一般社会常識から逸脱するような

逸脱しつつも、社会的インパクトを与えてはいるし同じコミュニティにおいては会話は通じる

けれど、今の社会がそれを全てオープンに、見える化を求めているために

ADHDにおいても特に大人含めてmaskingが必要になってきたのではって話がしたかった


発達障害全般に広くmaskingが必要って話が周回遅れならそれはワイの勉強不足や

2024-01-26

anond:20240126125139

増田ネタでも一言一句まんまこれ言うのがAdoちゃんの客層だから

まぁだからこそ、彼女を売り出している大人(ブレーン)のフィルターがあるとしても、年齢から考えたら相当お行儀の良い振る舞いしてるんだが

(キッズメンヘラばっかだから過去には自殺未遂事件とか起きちゃったみたいだし)

 

以下再放送

 

ネットで反応を得るタイプアーティストは売り方が難しいわね

ワイくんは『飾りじゃないのよ涙は』や『罪と罰』やジャズっぽい曲がすんげぇ良かったから、フツーに歌手として活躍して欲しいけどな

くじらの『金木犀』もめっちゃ好き、

Adoちゃん用のオリジナルだと『過学習』がめっちゃすこ、澤野弘之の『Tot Musica』も良かったね

anond:20240126111401 anond:20240126123159

フツーに大人にご意見伺った上でのお気持ち表明と違いますの?

過去Adoちゃんもっと軽率炎上してる様子がプレビュー報酬目当ての闇深アンチ垢にまとめられてましたわ

(10代の若者からこういうこともあるだろうという罪の無いレベルだったが、メンヘラネット親和性高い子がメイン層だから自殺未遂事件も起きたそうな)

 

ネットで反応を得るタイプアーティストは売り方が難しいわね

ワイくんは『飾りじゃないのよ涙は』や『罪と罰』やジャズっぽい曲がすんげぇ良かったから、フツーに歌手として活躍して欲しいけどな

くじらの『金木犀』もめっちゃ好き、

Adoちゃん用のオリジナルだと『過学習』がめっちゃすこ、澤野弘之の『Tot Musica』も良かったね

2023-12-31

画像生成AI、あと何が足りないのか

倫理問題はここでは置いておいて、あと何が足りていないのか。


画像に関して

  1. ファッションメイク、ヘアセットなど言語化カテゴリーけが出来てないものコントロール出来ない
  2. 目の形などが出来ない。(元絵集めてLoRAでという方法になる)
  3. Controlnetでポーズが動かせるというが、実際やると違和感が残る。言葉説明しにくい(ので改善点をあげにくい)
  4. 漫画コマアノテーションデータ自体が足りてない。
  5. 2人キャラは描画出来るようになったが、まだ不安定。(Latentとか)
  6. データがある物のモデル、LoRaは増えるが、本当に真似るだけになっている。(クオリティは上がったが過学習している?)
  7. モデルは沢山あるが、どれも似たりよったり。
  8. モデルを全部入れ替える方法しかない。
  9. SD, SDXLなど元バージョンが変わると引き継ぎが出来ない。
  10. いい感じのバリエーション複数出してくれない。プロンプトを毎回探すことになる。
  11. 飽きる
  12. AI投稿サイトを見ても飽きる。Pintarestのような多様性がない。

ニュースだけ追いかけている人には、性能が上がって凄い!という感想だと思うが、

実際に定期的に触った身からすると、確かに凄いけどなんだかな、という感想だ。

プロンプト共有サイトが沢山出たが、ほぼ同じプロンプトで回っているため一通り見ると参考にならない。

多数使い回されているプロンプトより、数は少ないが自分にあったプロンプトを探す旅に出ることになり不毛だ。


動画に関して

  1. 実写動画からの変換は進んだが、元の動画がないと駄目。
  2. 実写からアニメに変換した物だと違和感が残る。(実写とアニメ表現の違い?)
  3. まだコマごとに差分があり、バタバタする(オクルージョン埋め込みが必要?)

2023-12-30

anond:20231230120955

人間データだけでは過学習となる

データは疑似的に作られてもいるはず

2023-09-01

目標が立てられない大人になってしまった

俺という生まれも育ちも今の境遇も何一つ努力してこなかったやつの末路の話なんだけどさ

将来像とか目標とかまったく思いつかないんだよ。

はてなを見ているような君たちは、「こういう学習をしてこういうふうになりたいんだ!」とかさ「趣味を続けてたら次の目標が見えてくる」みたいな

感じなのだうから、あまり理解されないと思うんだけど。

まず目標なんて持ったところで自分という頭が悪く、怠惰極北のようなダメ人間がその目標を達成できるわけがないという過学習が過ぎてしまって、

何もやる気が湧いてこないというのが一つある。

あとその目標を見つけるための何が、学習でも趣味でもキャリアアップとかでもそういう対象が見つからないでいる。

だって増田を書く前は、仕事から帰ってきて3時間ぐらいXやYouTubeを焦点の合わない目で見てぼんやりと過ごしてしまって

ふとこんな虚しさに気づいたばっかりに、不安になって増田を書いている始末。

もし今から、こんな怠惰な老人になってしまった今からやり直せるとしたら、どうやってやり直したらいいんだろうか。

自分ではもう手詰まりしか感じないが。

2023-07-13

anond:20230713003627

Nur ein Idiot glaubt,aus den eigenen Erfahrungen zu lernen.

Ich ziehe es vor,aus den Erfahrungen anderer zu lernen,um von vorneherein eigene Fehler zu vermeiden.

【DeepL訳】

自分経験から学べると思っているのはバカだけだ。

私は、自分の失敗を避けるために、他人経験から学ぶことを好む。

と言うが、愚者愚者たる所以経験から過学習することだろうな。

愚者経験に学び、賢者歴史に学ぶ」と言うが、愚者愚者たる所以経験から過学習することだろうな。

2023-07-12

anond:20230712150158

途中までは狙い通りの口調だったのに

ちょっと調整入れたら「じゃあの」「しましょうわ」などと口調が崩れてしまったはてのちゃん

まさにそういう過学習の好例

2023-05-11

anond:20230511194113

すぐにクオリティーでAIに抜かれるから

俺は去年の10月からAI画像進化を見ているけど最近進化が止まってきてると思うよ

直近のブレイクスルーってControlNet1.1くらいでしょ

DeepFloydは過学習も甚だしいし必要スペックも跳ね上がってるから技術的に普及しないだろうし

たぶん今の状態が長らく続くんじゃないか

2023-05-07

anond:20230507181026

カワイソーという気持ち普通にあるし、特定の絵柄を過学習して収益を上げた画像を本人に送り付けたりしてる輩は普通にカスだと思うけど、

それはそれとして絵師サイドも意味不明問題提起無意味抵抗が多すぎてバカじゃんとしか思えないんだよな。

AI擁護側のバカは全員無名なのに対してアンチAI側は結構成功してる絵師バカ晒してるから炎上コンテンツとして強くて、絵師ばっかり叩かれてるように見えてるだけ。

ログイン ユーザー登録
ようこそ ゲスト さん