「過学習」を含む日記

はてなキーワード: 過学習とは

2024-03-06

■anond:20240223154325

そら「男に都合の良い女とそれを成立させる創作の世界観」というステレオタイプを過学習したらそうなるんだろ

2024-03-05

■anond:20240305170114

文化庁のあれで大幅な尺とっているRAGならともかく画像生成AIはほとんど問題ないと思うよ。

文化庁のあれの注釈にもあるけれど、権利制限は主に学習時点の条件のであり、「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的とする」はRAGと違って学習させた絵を直接出力するわけではないから「当該著作物の享受」になるにはコピー機レベルの過学習を意図的に行う必要になるし、「目的とする」となっていて結果ではないから例えばピカチュウの絵を出す目的で学習するとＮＧだけれど、いろんな画像を学習した結果ピカチュウが出力される場合もあるはＯＫ。目的なんて学習した奴以外わかるわけないじゃんとかいくらでも嘘つけるじゃんって話は、著作権法以外での「目的」と同様に状況証拠から推認することになって、たとえば文化庁のあれだとキャラクターLoraは「享受させることを目的とする」ことが推認されうるNG パターンとして例にあげられてる。SDみたいな汎用のやつはある特定の著作物を享受させることを目的と推認できることを証明するのはかなり大変じゃないかな。

「著作権者の利益を不当に害する」も学習段階の問題でやデータセット販売などが念頭にあり、例えば、学習目的なら無断で複製できるといっても有料で売ってるものを故意に割るのはNGよの為にある。むりやり生成時点の話にしても、30条４に限らずまだ存在しない著作物の権利を特定個人に保障するなんてのがないから、例えばJOJOの画風生成AIによって JOJOの既刊が売れなくなったならともかく、まだ描いていない新しいJOJOが売れなくなるはずは通らない

Permalink | 記事への反応(1) | 21:18

2024-03-04

■anond:20240304115359

ABAにおけるmaskingってASD向けの話よね？

あまりよく分かってなかったから改めて調べたけど

ASDに絞って書いたつもりはないんだよな

ASDというより、むしろ伝統的政治家・経営者にはADHDが多いと思うのよ

過集中・過学習によって一般社会常識から逸脱するような

逸脱しつつも、社会的インパクトを与えてはいるし同じコミュニティにおいては会話は通じる

けれど、今の社会がそれを全てオープンに、見える化を求めているために

ADHDにおいても特に大人含めてmaskingが必要になってきたのではって話がしたかった

発達障害全般に広くmaskingが必要って話が周回遅れならそれはワイの勉強不足や

Permalink | 記事への反応(0) | 12:30

2024-02-22

■anond:20240222111626

過学習させたもんなんて使わねえだろ

現実的にモノ考えようや

Permalink | 記事への反応(0) | 14:16

■anond:20240222013401

過学習させれば作れる

はい論破

Permalink | 記事への反応(1) | 11:16

2024-01-26

■anond:20240126125139

増田はネタでも一言一句まんまこれ言うのがAdo ちゃんの客層だからな

まぁだからこそ、彼女を売り出している大人(ブレーン)のフィルターがあるとしても、年齢から考えたら相当お行儀の良い振る舞いしてるんだが

(キッズとメンヘラばっかだから過去には自殺未遂事件とか起きちゃったみたいだし)

以下再放送

ネットで反応を得るタイプのアーティストは売り方が難しいわね

ワイくんは『飾りじゃないのよ涙は』や『罪と罰』やジャズっぽい曲がすんげぇ良かったから、フツーに歌手として活躍して欲しいけどな

くじらの『金木犀』もめっちゃ好き、

Ado ちゃん用のオリジナルだと『過学習』がめっちゃすこ、澤野弘之の『Tot Musica』も良かったね

Permalink | 記事への反応(1) | 13:05

■anond:20240126111401 anond:20240126123159

フツーに大人にご意見伺った上でのお気持ち表明と違いますの？

過去のAdo ちゃんはもっと軽率に炎上してる様子がプレビュー報酬目当ての闇深アンチ垢にまとめられてましたわ

(10代の若者だからこういうこともあるだろうという罪の無いレベルだったが、メンヘラやネットに親和性高い子がメイン層だから、自殺未遂事件も起きたそうな)

ネットで反応を得るタイプのアーティストは売り方が難しいわね

ワイくんは『飾りじゃないのよ涙は』や『罪と罰』やジャズっぽい曲がすんげぇ良かったから、フツーに歌手として活躍して欲しいけどな

くじらの『金木犀』もめっちゃ好き、

Ado ちゃん用のオリジナルだと『過学習』がめっちゃすこ、澤野弘之の『Tot Musica』も良かったね

Permalink | 記事への反応(0) | 11:22

2023-12-31

■画像生成AI、あと何が足りないのか

倫理問題はここでは置いておいて、あと何が足りていないのか。

画像に関して

ファッション、メイク、ヘアセットなど言語化、カテゴリー分けが出来てないものはコントロール出来ない
目の形などが出来ない。(元絵集めてLoRAでという方法になる）
Controlnetでポーズが動かせるというが、実際やると違和感が残る。言葉で説明しにくい（ので改善点をあげにくい）
漫画はコマのアノテーションデータ自体が足りてない。
2人キャラは描画出来るようになったが、まだ不安定。(Latentとか)
元データがある物のモデル、LoRaは増えるが、本当に真似るだけになっている。（クオリティは上がったが過学習している？）
モデルは沢山あるが、どれも似たりよったり。
モデルを全部入れ替える方法しかない。
SD, SDXLなど元バージョンが変わると引き継ぎが出来ない。
いい感じのバリエーションを複数出してくれない。プロンプトを毎回探すことになる。
飽きる
AI絵投稿サイトを見ても飽きる。Pintarestのような多様性がない。

ニュースだけ追いかけている人には、性能が上がって凄い！という感想だと思うが、

実際に定期的に触った身からすると、確かに凄いけどなんだかな、という感想だ。

プロンプト共有サイトが沢山出たが、ほぼ同じプロンプトで回っているため一通り見ると参考にならない。

多数使い回されているプロンプトより、数は少ないが自分にあったプロンプトを探す旅に出ることになり不毛だ。

動画に関して

実写動画からの変換は進んだが、元の動画がないと駄目。
実写からアニメに変換した物だと違和感が残る。（実写とアニメの表現の違い？）
まだコマごとに差分があり、バタバタする（オクルージョン埋め込みが必要？）

Permalink | 記事への反応(0) | 22:13

2023-12-30

■anond:20231230120955

人間のデータだけでは過学習となる

データは疑似的に作られてもいるはず

Permalink | 記事への反応(0) | 12:14

2023-10-04

■anond:20231003234043

イエスマン達で過学習してしまったんだろな

Permalink | 記事への反応(0) | 08:29

2023-09-01

■目標が立てられない大人になってしまった

俺という生まれも育ちも今の境遇も何一つ努力してこなかったやつの末路の話なんだけどさ

将来像とか目標とかまったく思いつかないんだよ。

はてなを見ているような君たちは、「こういう学習をしてこういうふうになりたいんだ！」とかさ「趣味を続けてたら次の目標が見えてくる」みたいな

感じなのだろうから、あまり理解されないと思うんだけど。

まず目標なんて持ったところで自分という頭が悪く、怠惰を極北のようなダメ人間がその目標を達成できるわけがないという過学習が過ぎてしまって、

何もやる気が湧いてこないというのが一つある。

あとその目標を見つけるための何が、学習でも趣味でもキャリアアップとかでもそういう対象が見つからないでいる。

今だって増田を書く前は、仕事から帰ってきて3時間ぐらいXやYouTubeを焦点の合わない目で見てぼんやりと過ごしてしまって

ふとこんな虚しさに気づいたばっかりに、不安になって増田を書いている始末。

もし今から、こんな怠惰な老人になってしまった今からやり直せるとしたら、どうやってやり直したらいいんだろうか。

自分ではもう手詰まりしか感じないが。

Permalink | 記事への反応(1) | 22:18

2023-08-20

■anond:20230820230553

増田でケンカしてるときに過学習はおすすめしない

もっと軸多めでいこ

Permalink | 記事への反応(0) | 23:08

2023-07-13

■anond:20230713003627

Nur ein Idiot glaubt,aus den eigenen Erfahrungen zu lernen.
Ich ziehe es vor,aus den Erfahrungen anderer zu lernen,um von vorneherein eigene Fehler zu vermeiden.
【DeepL訳】
自分の経験から学べると思っているのはバカだけだ。
私は、自分の失敗を避けるために、他人の経験から学ぶことを好む。

と言うが、愚者の愚者たる所以は経験から過学習することだろうな。

Permalink | 記事への反応(1) | 00:58

■

「愚者は経験に学び、賢者は歴史に学ぶ」と言うが、愚者の愚者たる所以は経験から過学習することだろうな。

Permalink | 記事への反応(1) | 00:22

2023-07-12

■anond:20230712150158

途中までは狙い通りの口調だったのに

ちょっと調整入れたら「じゃあの」「しましょうわ」などと口調が崩れてしまったはてのちゃんが

まさにそういう過学習の好例

Permalink | 記事への反応(0) | 15:09

2023-05-11

■anond:20230511194113

すぐにクオリティーでAIに抜かれるからね

俺は去年の10月から AI 画像の進化を見ているけど最近進化が止まってきてると思うよ

直近のブレイクスルーってControlNet1.1くらいでしょ

DeepFloydは過学習も甚だしいし必要スペックも跳ね上がってるから技術的に普及しないだろうし

たぶん今の状態が長らく続くんじゃないかな

Permalink | 記事への反応(0) | 21:10

2023-05-07

■anond:20230507181026

カワイソーという気持ちは普通にあるし、特定の絵柄を過学習して収益を上げた画像を本人に送り付けたりしてる輩は普通にカスだと思うけど、

それはそれとして絵師サイドも意味不明な問題提起や無意味な抵抗が多すぎてバカじゃんとしか思えないんだよな。

AI 擁護側のバカは全員無名なのに対してアンチ AI側は結構成功してる絵師もバカを晒してるから炎上コンテンツとして強くて、絵師ばっかり叩かれてるように見えてるだけ。

Permalink | 記事への反応(0) | 22:40

2023-05-01

■anond:20230501144921

満点とか目指さない限りTOEICに過学習も何もないわ

Permalink | 記事への反応(0) | 14:50

■anond:20230501143955

テストごとに過学習するのは大変そう

Permalink | 記事への反応(1) | 14:49

2023-04-30

■anond:20230430123909

過学習感ある「普通の人はそんな変な単語検索しないので間違いでしょ」みたいな

Permalink | 記事への反応(2) | 12:42

2023-04-22

■ただのメモ

https://arxiv.org/pdf/2304.10466.pdf

効率的な深層強化学習には過学習の規制が必要

試行錯誤によって方針を学習する深層強化学習アルゴリズムは、環境と積極的に相互作用することによって収集された限られた量のデータから学習しなければならない。多くの先行研究が、データ効率の良いRLを実現するためには適切な正則化技術が重要であることを示していますが、データ効率の良いRLにおけるボトルネックの一般的な理解は不明なままでした。その結果、すべての領域でうまく機能する普遍的な技術を考案することは困難であった。

本論文では、非定常性、過剰な行動分布シフト、オーバーフィッティングなどのいくつかの潜在的な仮説を検討することにより、サンプル効率的な深層RLの主要なボトルネックを理解することを試みている。

＞効率のいい強化学習って難しいんですね

強化学習ってよく知らない

我々は、状態ベースのDeepMind control suite（DMC）タスクについて、制御された体系的な方法で徹底的な実証分析を行い、遷移の検証セットにおける高い時間差（TD）誤差が、深いRLアルゴリズムの性能に深刻な影響を与える主犯であり、良い性能をもたらす先行手法は、実際、検証 TD誤差を低く制御することを示した。この観察から、ディープRLを効率化するための強固な原理が得られる。すなわち、教師あり学習の正則化技術を利用することで、検証 TD誤差をヒルクライムできる。

＞時間差（TD）誤差ってやつがだめらしい

誤差を減らすのがDeepLearningだけど、それが時間差なのか。

我々は、検証 TD誤差をターゲットとするシンプルなオンラインモデル選択法が、状態ベースのDMCとGym タスクにおいて効果的であることを示す。

1 はじめに

強化学習（RL）法は、大容量の深層ニューラルネット関数近似器と組み合わせた場合、ロボット操作などのドメインで有望視されている（Andrychowicz et al、

2020）、チップ配置（Mirhoseini et al.、2020）、ゲーム（Silver et al.、2016）、データセンターの冷却（Lazic et al.、2018）。アクティブなオンラインデータ収集の単位ごとに費用が発生するため（例．

実際のロボットを動かす、シミュレーションによるチップ評価など）、限られた経験量でも効率的に学習できる、サンプル効率の良い深層RLアルゴリズムを開発することが重要である。このような効率的なRLアルゴリズムの考案が、近年の重要な研究課題となっています（Janner et al、

2019; Chen et al., 2021; Hiraoka et al., 2021)。

原理的には、オフポリシーRL法（例えば、SAC (Haarnoja et al., 2018), TD3 (Fujimoto et al., 2018), Rainbow (Hessel et al., 2018)）は、データ収集のステップごとに多くの勾配ステップのポリシーと値関数を改善することを可能にするため、良いサンプル効率が得られるはずです。しかし、このメリットは実際には実現できないようで、1回の学習ステップを多く取りすぎることでを収集した各遷移は、多くの環境において実際にパフォーマンスを害する。過大評価（Thrun & Schwartz, 1993; Fujimoto et al., 2018）といったいくつかの仮説、非定常性（Lyle ら、2022）、またはオーバーフィッティング（Nikishinら、2022）が根本的な原因として提案されている。

これらの仮説に基づき、より多くの勾配ステップを持つオフポリシーRLを可能にする方法として、モデルベースのデータ増強（Jannerら、2019）、アンサンブルの使用（Chenら、2021）、ネットワークの正則化（Hiraokaら、2021）、再生バッファを維持しながらRLエージェントをゼロから定期的にリセット（Nikishinら、2022）などのいくつかの緩和戦略が提案されている。これらのアプローチはそれぞれサンプル効率を大幅に向上させるが、これらの修正の有効性は（これから示すように）タスクに大きく依存する可能性があり、根本的な問題やこれらの手法の挙動を理解することはまだ未解決である。

ICLR 2023で会議論文として発表本論文では、より多くの勾配ステップを取ることが深層RLアルゴリズムの性能悪化につながる理由、ヒューリスティック戦略が役立つ場合がある理由、そしてこの課題をより原理的かつ直接的な方法で軽減する方法を理解しようとするものである。

最近提案されたタンデム学習パラダイム(Ostrovski et al., 2021)を用いた実証分析を通じて、TD 学習アルゴリズムは、学習の初期段階において、すぐに高い検証時間差(TD)誤差(すなわち、保留した検証セットにおけるQ-ネットワークとブートストラップターゲットの間の誤差)を得る傾向にあり、悪い最終解をもたらすことを明らかにする。