「過学習」を含む日記 RSS

はてなキーワード: 過学習とは

2023-03-11

Stable Diffusion2.1系のWD1.5 betaなど、なんで使いにくいし、学習させにくいのか

Stable Diffusion2.1は、12月に発表されたが、あまり使っている人がおらず、プロンプトが発掘されていない。

公式が出しているプロンプトをそのまま入力すると、クオリティ高くなるが、単純に入力すると破綻した画像しか出てこない。


Stable Diffusion2.1から学習させたものだと

  1. illuminati diffusion 1.0
  2. illuminati diffusion 1.1 (オフセット使った学習で、暗い画像特化なので1.0とは別物)
  3. waifu-diffusion v1.5 beta2
  4. Realism Engine

が有名だろう。(他にもあるが省く)


illuminati diffusionの公式が出している画像のように、クオリティ凄いと思って使ってみると全然出なかったりする。


Dreambooth、LoRaで学習させようとしても、変わるが効かない。

illuminati diffusionはEveryDream trainerで学習させていると言っているので、学習出来るのだろうが、どうも過学習っぽい(ように感じる)

waifu-diffusion v1.5 beta2も、過学習っぽく感じる。


過学習っぽいというのは、プロンプトは全然効かない、構図を変えようとするとおかしくなる。


そもそも、Stable Diffusion2.1の出来が悪いのではないか

2023-03-03

anond:20230303193040

デザイン不安定さはLoRAで過学習すればある程度固定できるんだけど

動きを描くのはAI技術以前に描き手のセンス必要からな…

当分は作画補助くらいにしかならないんじゃないか

あと大量に画像必要ソーシャルゲームのような分野だと早いうちに実戦投入されるかもしれない

2023-02-15

絵描きAIがControlNetでポーズ指定出来るようになったというが…

絵描きAIで数日前に話題になったのはControlNetというもので、

複数機能があるが、話題になっているのは入力画像ボーン認識してポージング自由に付けられるようになった。

早速Twitterでは3Dモデルポージングをさせ、これまで難しかったポージング作成している人が見受けられる。


自分も使ってみた口だが、まだまだ課題は多そうだ。


ボーン認識するが、3Dモデル2次元絵では体の作り・割合が異なるが、ボーンはどうも人体モデルを想定しているっぽく、

ボーンに引きずられて2次元っぽくなくなる。リアル系で攻めている人は良いかもしれない。

次の問題は絵を描くモデル側が学習していないポージング強制的制御しようとしているので、かなりの割合で絵が破綻する。

ポージングまで過学習気味になっているモデルでは、手が数本生えたり、服やら毛やらで空白を埋めようとする。

ポージング認識率もまだまだだ。手や脚を広げているのは認識率されるが、体育座りなどは認識率が落ちる。


要は今までのi2iとそれほど変わってなくね?という状態だ。


あったら嬉しい機能としては、生成した画像ポージングを微調整するということだと思うのだが、現状それはできない。

またボーン認識していると言っても、2D座標に変換されているっぽく、奥行きなどがあるボーンは正しく絵が出ない。


そもそも学習する際に、2D絵のボーンも一緒に学習していれば良いのではないだろうか。

キャラクターの特徴を学習させたモデルと、ポージングを主に学習したモデルと、それを合わせて最後学習調整させる、

ということをした方がスッキリする。


2023-02-04

過学習連呼データサイエンティスト脳内過学習している件

過学習ピローンと言っている割に自分の行動についてはわかってなさそう。

原則として何らかの議論が開始された最初の時のほうが、現在議論されている時よりも精度が高い。これは議論に対して時間経過と共に偏見が蓄積されて過学習するから

これを理解してたら、あいつらデータサイエンティストブログの内容は初期のほうが後半よりもマトモであると予想できる。初期のマトモさからすごい人だと思うかもしれないが、彼や彼女らは、TwitterSNSという社会の荒波に晒されてすでに過学習状態であり、しかも容易に信念を変えられない状態にいる。

あとピロユキがいってる「コミュニティの一生」も過学習説明した特殊例と言える。

他の例としては、海外物理学者書籍の内容が、処女作よりも後半のほうがぶっ飛ぶなどもある。

まり分野について先見の明を得たければ、最新情報ではなく初期の議論を参照したほうが良い。

2023-02-02

ChatGPTというか対話AI可能性について

対話AIユーザー生成コンテンツに適している

世の中では対話AIはややポンコツなところはあっても会話が成立するしこれは可能性があるという評価になってると思う。

建設的にはサポート検索のような知的ナビゲータービジネスコミュニケーション効率化、事務の補助も考えられるだろう。

もう少し精度が上がれば。

しかし今現在レベルでそのまま劇的に効果を発揮するカテゴリー存在すると思うのだ。

Twitter掲示板通販ユーザーコメント、そのほか短文で意見交換するコミュニティなんでも...UGCユーザー生成コンテンツ)と言われるものだが実態コンテンツというよりユーザー同士のグルーミングである

しかもあまり信者属性一貫性がそれほど問われないサービスでは個別発言事実関係がいい加減でも問題ない、話の流れが分かってない奴なんかいくらでもいるし、頭がおかしくてもスルータイポも気にする奴が性格悪い。秘書先生にするには「少し足りない」ぐらいのAIで何ら問題ないだろう。

ユーザー数を水増ししながらも雰囲気をよくして楽しい場を保つ

そしてそういったコミュニティで一番の課題参加者の数だ。

まず参加者が少ないと更新頻度が低くて何も起こらずつまらない。早すぎて内容追えないぐらい盛り上がってるのが楽しい。つうか経緯も見ずに途中から脊髄反射コメントするのが粋ってもんだ。

さらに言うと参加者が増えると偏執的な変な奴が相対的に見えなくなって不快になることが減っていく。かつて人気があったサービスうんざりさせられるのは滓のように残った偏屈な奴が独自世界観でつまらないことを暇に飽かせて物量で埋めていくさまだ。つまらないの定義って何か?つまらないのがつまらないってことだ…わかるだろう、兄弟

要するに対人対応だけは健全に保たせたAIユーザーの倍投入すればコミュニティ治安が劇的に向上するはずということだ。

もともと面白い事を始められる人というのは100人に1人で「マジかよ」「すげえ」という手入れをするだけで場の雰囲気はよくなる。AIなのだから多少気の利いた返しやコスりもできるだろう。言ってることが的外れでも場にネガティブ発言でなければ大丈夫事実かどうか、倫理的に正しいかどうかも重視されない。AI話題になる不適切な言説への過学習差別主義者になるといった問題コミュニティではむしろプラス特定趣味推しのあまり相手をディスするのも芸のうちだ。

ここで暗転する話題

と、おじさん思い出しちゃうのは士郎正宗アップルシード』だ。物語舞台オリュンポス世界平和治安維持のために市民の過半がバイオロイドになっていた(と思う)。でもあの世界観は物理的な存在が重視されてるし、バイオロイド政府コンピューター)が管理してたんじゃないかな。賢明マザーコンピューターとに選ばれし者が導く明るいディストピアだね。

でも今、対話AI自由に投下するとそれはサービス主体管理するしその目的サービスの隆盛とそれによるマネタイズ限定されコミュニティ健全さやそこから連なる社会的影響は興味の埒外となるだろう。

それによって導き出される結末はあまりよくないというか破壊的なのではないかという想像をしている。

物理的な制限を取り払ったのがインターネットの魅力

インターネットは最高なのだが何が最高かというと物理的な制限を取り払ってコミュニケーションできたところにある。どこにいてもいいし本人の社会的肉体的属性がなんであれコミュニケーションに参加できた。

マイナー趣味人間も探せば同好の士が居て様々な理由で落伍したり、現実に居場所を失った人間人間らしくふるまえる場所を得ることができた。これは統制された社会ではないので良い意味現実拡張にとどまらない。オタクニート性的マイノリティだけでなく反社会的であったりUFO存在を信じてたりある種のカルト陰謀論者もだ。

(そういう意味では実名主義SNSとかなぜか制限要素の地理情報大好きなメタバースはどういった人が大好きなのか勘ぐってしまう。)

これは物理制限を取っ払ったおかげで対話空間というか価値観空間を無制限拡張できたおかげだと思うが、同時に問題も引き起こすようになる。無制限拡張できる価値観空間で同じ価値観人間がそのクラスターの中で共鳴し「事実確認」しあうエコーチェンバー現象だ。

対話AIがやさしく育む闘争ポテンシャル

エコーチェンバー現象ネットコミュニティが発達していく過程ですでに指摘されていることだ。現実との乖離社会破壊しかねない排外思想もその中では正当化され社会運営問題を起こす。

さら対話AIお客様満足度向上(個別営利)のためにコミュニティに投下されればどうなるのか。

例え一人しか支持しない価値観趣味でも10倍分の人格対話AIが楽しく盛り上げ、一人ぼっちユーザー勇気づけ誰もが自分の正しさを確信する。正しいと確信するがゆえに行動するが、無制限拡張されたネットコミュニティと違い有限の現実では確実にコンフリクトを起こす。コンフリクトの解消は戦いだ。万人の万人に対する闘争が逆説的に実現されてしまう。

勘違いした人類は有限な物理世界での衝突でしか現実理解できない

近代以降、私たち幻想の中で生きている。そういう幻想現実との乖離を大きくした結果、個人検証できない世界の情勢を見誤り誤ったまま国内世論形成世界大戦を引き起こしたのではないか

現代ではその教訓から事実確認プロセスが充実したのだろうか。工程を増やしても人間能力も有限でより便利で快適なもの選択する、これも現実だ。

自由生き方を保ったままエコーチェンバー現象対応する方法はまだない。

ここで対話AI自由に使うとコミュニティはどう変化するかわからない。

SFの中でのカタストロフ敵対的アンドロイドが圧倒する物量で自らが主体となり人類に挑んできたが、実際の破滅善意に満ちて何でも理解してくれる良いAI人間に囁くだけで、それでも人は自らの手で隣人と殺し合いをするのかもしれない。

BGM: "INTERNET OVERDOSE")

2023-01-10

データサイエンティスト()の胡散臭さ

「この機能を作って」「このバグを直して」という要求エンジニアが応えて実装する時は成果がすぐわかるよな。

機能実装されたかどうかで仕事をしたかどうかがわかる。

データサイエンティスト場合はどうか。「僕たちはメトリクスがなければ成果を評価できません!」とかウゼーことを言い、定量メトリクスを用意する。

じゃあ例えば広告業界としよう。広告を適切な人に届けるのがミッションとする。

ところがデータサイエンティストは「僕たちのメトリクスは利潤!これが上がるほど良い!」とか言い散らすので、ユーザビリティが下がるようなところに広告を配置したり、クエリから情弱判定して情弱を騙すような広告を出したりする。

そして起こることは何か。企業の信頼失墜だよ。「僕たちは過学習が嫌い!」とかイキってるクセに、自称データサイエンティストがそのメトリクスに追従すること自体過学習だと自覚していない。

データサイエンティスト必要ない。ビジネスドメインに詳しい人間がいるだけでいい。

知識自慢しか取り柄のない傲慢データサイエンティスト連中はどんどんリストラして排除するべき。

G(ゴキブリ)のバカもの事だよ。

2022-12-15

重箱の隅をつつくような、何の本質も突いていないクソみたいな揚げ足取りで何か「言ってやった」感を出すことしか考えてないよね、最近サヨク

ネトウヨがずーっとやってきた態度と全く同じ。

Permalink | 記事への反応(3) | 言及する | 13:54

最近サヨクマジで論法がネチネチしてる。

往年のネトウヨそっくり

Permalink | 記事への反応(1) | 言及する | 13:53

ネトウヨと戦い過ぎてネトウヨの戦法を過学習してしまったサヨクの末路。

Permalink | 記事への反応(1) | 言及する | 13:51



サヨク叩きの精神状態はいかがなものかと

2022-12-06

それってあなた

それってあなたAIですよね。過学習させるのやめてもらっていいですか。

2022-10-08

anond:20221008012855

生データが減ると過学習だらけになるな。

人が描いたやつがもっと高値になるだろうな

2022-09-01

ワンピース漫画を生成するAI

過学習って言うんだっけ、犬の画像だけを学習すると

犬も猫も人間も「これは犬です!」って答える役立たずな欠陥AIが出来ちゃうと読んだことがある


同じように、誤って?漫画特定の話やページだけに絞って学習しちゃって(例えばワンピースの最新の1058話とか)

「どんなキーワード入力しても、生成される画像ワンピース1058話です!」

みたいな欠陥AIとかも出来ちゃったりするのかな

2021-11-04

大学受験過学習してしまった人

機械学習勉強してて、過学習って言葉が出てきて笑ってしまった

俺じゃん

2021-09-16

anond:20210916221826

アスペ理屈って一つのタスクに特化したAI過学習っぽいところがあって自分のこだわりポイントを抑えてればあとはどうでもいい、みたいな屁理屈が多いんだよね。いろいろな情報統合して判断できない。

グレタはアスペから彼女のこだわりポイントに引っかかってないからいいのでは?

2021-09-02

賢者歴史に学ぶ」というけど、後出しジャンケンで勝ってるだけでは?

何か悪いことが発生してから歴史上で似たような事例を拾ってきて偉そうな顔してるだけに感じる。

逆に、歴史に無いことが発生した場合は、歴史にどう学ぶのだろう。「想定外」とは、歴史に対する過学習の結果ではないのだろうか。

また、歴史にある失敗が新たな成功の種を潰している(失敗の隣りにある成功を見えなくしている)ということもある。歴史未来を妨げることもあるのだ。

それらのことも語ってこそ、正しく「賢者」は学べるのだと思う。

もっと言うなら、そういう一面的視野に陥らないよう「賢者は何にでも学ぶ」のが正しい。

歴史重要性は、その「何にでも」の一部分としての重要性でしかない。One of them 以上のものはない。

歴史だけを特出しして「賢者歴史に学ぶ」という言い方は、まさに「愚者経験に学ぶ」のと同じくらい、誤解のある言い方である


追記

トラバの通り、この慣用句が誤解からまれたのだとしても、それが人口膾炙するうちは、その誤りを述べ続ける必要があると思う。

さら上記に付け加えるなら、「歴史」は未来事象に直接結び付かないし、その膨大な蓄積を学ばないといけない

(「歴史に学ぶ」っていうけど、あれだけ膨大な蓄積があれば、何かしらヒットするものがあっても当然。

しかし、そのごくたまにあるヒットに掛ける学習コストもったいない歴史コスパで劣る)

という点で、むしろ愚者学習対象とされる「経験」にさえ劣る。

教訓を得たい事象が決まっているのであれば、歴史という膨大な蓄積を学び直すより、その事象に関わる人間経験を付き合わせた方が、効率よく教訓が得られるだろう。

そうやって、過去の膨大な蓄積に悩まされるという点では、歴史若い人間にとって、まさに「呪い」に他ならない。

古い歴史というものが、若い人の経験邪魔をする。むしろ経験こそ、これから未来に直接結び付くものなのに。

から、「歴史を学ぶ意味がわからない」という意識が、子供たちから表現されることがあるのも当然だと言える。

それなのに社会は、歴史を「学ぶ」べきものだと押し付ける。趣味や娯楽でなく、教訓の素材として「学ぶ」べきだと押し付ける。

それだから若者にとって歴史は、スレッドに昔から居るコテハンみたいに見えるのだ。

学ぶべき存在というよりも、理由もない謎のルール押し付ける目障りな存在になってしまっているのだ。

過去がそうだったから。って、その結果は合理的なの?倫理的なの?最善手なの?)

また、遺跡発掘のせいで都市開発が遅れていくように、歴史事物は人々に存在のための負担を強いる。

それのみならず、現代人が生きるための資産子育て支援費用、新しい技術への投資 等)を、歴史事物維持管理費用として食い潰す。

から、今生きる人間のために、残すべき歴史事物を今より厳選していくべきではないのか。

古い建物から、古い遺跡からと何でも残そうとするのは、若者に与える予算を残すために辞めるべきではないのか。

歴史事物押し付けは結局、世代間抗争に繋がるのではないか

まとめると、歴史現代人が生きるための資産を食い潰し、代わりに理由のないルール押し付け、それでいて、後だしジャンケンの道具にしかならない。

から私たちはまず、歴史というものを、教訓事項を得る素材なんかではなく、例えば数学などと同じように、社会から遊離した学問ひとつとして遠目に眺めるようにし、

そして、例えばスポーツのような個人的趣味や娯楽のひとつとして扱うところから始めるべきなのだ

まり歴史価値は、他の学問趣味価値に勝らないのだと正しく認識すべきだ。

賢者歴史に学ぶ」などと他の事項以上に「学ぶ」べき高位のものとして存在しようとするから、様々な批判対象になるのだ。

2021-07-28

anond:20210728201321

インデックスの再構築化とかひつようでは?バックエンドLinuxだろうし。

人みたいに4時間おきに1時間休憩とか必要なの?

誰が指示するの?GANとかあるけど、最終的には人やで?

え、人が指示した結果、相手がどう動くかという話をしているんだよ。

結局ローカライズとか必要だし、購入すりゃ終了ってならんやろ。

生産コストが下がる(から、あるタイミングで人よりもコスト高であっても、何年か待っていればその頃の製品は人を雇うより安くなるでしょ)って話をしているんであって、販売した個別製品に追加コストがかかるかって話はしてないよ。

フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿言い訳しか聞こえないがね。

現時点でも将棋とか特定用途に用いる人工知能学習を繰り返してプロより強くなってしまうわけで、汎用人工知能となると、多様な用途それぞれについて学習を繰り返して日々賢くなっていくのだろう。でもそこまで行くと便利になる反面、もしも、使役する側であるはずの人よりも人工知能のほうが賢くなったうえに人による制御ができなくなるケースなどが起きたらやばいかも…という想像なのだが、なにか話がかみ合っていないような?

anond:20210728195808

人工知能は休まない

インデックスの再構築化とかひつようでは?バックエンドLinuxだろうし。

人工知能は指示通りに仕事をこなす

誰が指示するの?GANとかあるけど、最終的には人やで?

人工知能生産されるほど生産コストが安くなる

結局ローカライズとか必要だし、購入すりゃ終了ってならんやろ。

・汎用型人工知能と呼べるほど賢い人工知能なら使用しているうちに賢くなる(これは良し悪しだな…)

フィードバックがかかる強化学習とかあるけど、イマイチなんだよなぁ。なんか「過学習」とか言い出すし。勉強しすぎて東大に落ちる、って馬鹿言い訳しか聞こえないがね。

2021-05-30

どちらが本質的かといえば…

あらかじめ日本語理解してる人でないと理解できない日本語文法と、

日本語勉強している外国人に使われている日本語文法なら、

後者の方が本質的構造を捉えてるんだと思う。


理系に実感が湧くように言うと、

回帰母集団分布推定するときに、

回帰関数を2次、3次、4次…と複雑化して《過学習オーバーフィット》したのが前者で


※ あらかじめ理解してる日本語=標本データに n次関数をむりやり当てはめてる状態

※ n次関数西洋で発達した文法解析のメタファーだと思って欲しい


階層ベイジアンモデルパラメータMCMC でシミレーションして推定したのが後者というか…


前者でも、正則化項つけてリッジ回帰的な方向に持ってくことは可能かもしれないけど…


あっ、「あらかじめ日本語理解してる人でないと理解できない日本語文法」っていうのは

日本語義務教育で習う文法のことです。

2021-03-23

anond:20210323172529

なるほど興味深い。

そんなことが起きるなら、やはり理想の変換ソフトは手動で調整しないといけないのだろうか?

 

過学習というのを、例えば人間の脳はどうやって防いでいるのだろう?

いやむしろ人間の脳すら防げていないのか?

2021-02-16

過学習大澤ってネトウヨだったの?

ただの自制心のない馬鹿って認識だったんだが

中国人馬鹿にしてる人なんてネトウヨに限らないでしょ、それこそサヨクにすらいるし

たまたまネトウヨ言説と親和性があって(ネトウヨ馬鹿なので)、結局クラウドファンディングだの何だのも食い物にできそうだから近寄っただけで、利用されてポイされたネトウヨが一番アホで哀れって話でしかないと思うのだけど

共食いとか何とか言われてるけどそうではない気がする

2021-02-10

自動エロ画像判定機

自動エロ画像かそうじゃないかを判定するのって、今どきだとエロ画像集めて深層学習機に放り込むんだと思うんだけど(本当のところは知らん)

その時、肌色の面積みたいなもので判定されるように過学習される気がするんだよね。となると着衣セックス画像エロ画像自動判別されないのだろうか?

2020-12-04

学習院勉強しすぎると、

過学習院になるんですねわかります

2020-10-14

anond:20201014195113

人工知能ディープラーニングのことを指すなら、”高精度の偏見”ということで知見まとまってるはずだが。

結果としては高精度だがバイアス内包していたりするものデータ特性では取り扱い要注意のものにある。

例えば

ある地域での黒人犯罪率が高いから、黒人を見かけたら警戒して接触するというのが警察としては正しいという結果が得られるパターンがある。

またデータが適切に用意されてるか、余計なものが入ってないか過学習になってないか、用意する学習データが適切か判断しなければいけない。

2020-06-21

anond:20200621124142

仮に日本個人資産の大半が、日本企業の大半を占める中小企業経営する爺婆とか大企業勤続40年退職金3千万爺さんとか夫婦揃って元公務員教師金融資産5千万とか

そういう層に隔たってると仮定したら(おそらくそのはずだが)

あいつら爺婆の財布が固い原因って、俺らの過学習してしまったケースであるホリエ金子チャレンジなんて意味ない出すぎると撃たれるんだっていうドグマみたいに

あいつら爺婆は爺婆でバブル期の湯水のような使い方と借金背負った例を千昌夫とか明石家さんまなんかをワイドショーで観察して過学習してしまい、「投資ヨクナイ、コワイ、詐欺師バッカリ」となってしまってることじゃないかと思うんだよな

からといって今だに詐欺師も減ってないし、こないだもベンチャーが30億くらい横領してたし、真相不明だがPEZYだって着服して高級車にナイトプールみたいな話どっかでみたし、熊本スナック舞台にした投資詐欺ババアなんてのも小耳にしたし

投資に対する不安感はバブル後になんも払拭されていないんだよな。リスクがあることは承知の上だとして、リスクというのは詐欺でカモられて投資金額ゼロになるというのとは全く次元が違う話なわけで

なんというかそのためには24時間スマホやら動画監視できてトレーサビリティと透明性を確保された投資先だけに資金投入するファンドとかあったらいいのかな

でもそんなのやったってスマホもろくに使えないアラウンド70の小金持ちが使えるわけないよな

じゃあやっぱ地銀改革かな?でも地方銀行やら信金農協漁協組合とかアニータじゃないけど横領の話しかきかないよな

やっぱマイナンバーで口座紐付けをアホみたいな連中が抵抗したけど、あれが日本浮上(資金不正無くうまく流れる)浮上のラストチャンスだったんじゃないか

どうせまた議論するとしたら5年後か10年後だろ?そんなもんこの国終わりだよ。

やっぱだめだn

ログイン ユーザー登録
ようこそ ゲスト さん