2022-09-29

AI画像生成の課題雑感

プロンプトエンジニア

現在AI画像生成はほぼ画像検索といっていい、プロンプトは検索ワード並べてるのと変わらない。個人的にはエロ動画探すとき検索が一番似てると思った。

界隈でプロンプトエンジニアとか言い出した際には本当にセンスがなくて失望した。

適当ワード画像検索してすばらしい景色写真を見つけられて俺ってスゴイと思うだろうか。

俺の検索技術で最高なイラストを見つけてやったとか?

キーワードによる画像生成の問題コントロールがおおざっぱすぎることと、学習モデルが変更されたときに結果があっさり大幅に変わることである

ユーザーが思ったところに思ったように描画してもらうにはもっと工夫が必要で、なぜかAI界隈はそういうのに無頓着AI自動塗りなんてのもすごい大雑把な機能で「未来を予感」させながら実際は使い物にならんなこれと放置されている。


抽象モデル必要

ツール機能させるにはユーザー意思を反映させる必要がある。

なんでもいいユーザーならキーワード指定だけで十分で今でもそれを楽しめるが、もっと厳密なゴールを設定した対象に使うと途端に精度が低すぎてお話にならなくなる。

ガンダム」で画像を作ってみてほしい。おおすげえガンダムっぽいじゃないかと思うかもしれない。じゃあそれをガンダムファンに僕ガンダム描きましたってみせたらどうだろうか。ああ面倒な奴来ちゃったという顔をするのではないかファンアートは元作品再現しないといけない部分がシビアなのだ

AI本質は多様で小さい判断を大量に必要とする業務自動化すること。

従来、多量の作業自動化はコンピューターの得意分野であったが「幅広く判断する」ことは小さな判断であっても難しく専門家でなくとも多少訓練した人間大勢使って処理していた。

なので税務で税理士先生指導しながらも実務は専門学校の生徒のバイトがやるみたいな業務に向く。

AI画像生成もあるスペースを作画カロリーの高い図像で埋める効率はとても高く素晴らしい。

しかし大きい判断人間がせざるを得ない。そしてその判断AIに伝える必要がある。

その指示をどう出せばいいか。基本は対象指定してどう変化させるか指示する。

まり範囲指定して、パラメーターを指示・変更するということになる。また指示と結果にはある程度再現性を持つべきだ。

この範囲現在キーワードによる意味空間だったりベース画像提示だったりする。今のところパラメーターはAIの内部的なものしかない。

ここに抽象モデル設計してやる必要性がある。これは言語発明とか音階発見のようなジャンプがあり非常にクリエイティブ仕事だ。

画像生成AI3Dモデルを使ってるものは出力が非常に安定している。3Dモデル物理立体の抽象モデルだ。

イラストであるなら構図とか筆致といった高度な抽象概念から、いまペインツールにあるドットでの領域指定モデル化できるだろう。

モデルを使うことでAIの生成結果の合目的精度を上げ、管理可能にすることで人間コントロールできる機能になる。

じゃあガンダムイラストを生成できるAIにはどんなモデルが要るのだろう。

ファーストSEEDユニコーン作品ごとに世界観モデルがあったほうがいい?キャラクターは設定に沿う必要があるしモビルスーツにはやはり3Dモデル必要か。ん?これ、権利的にアレじゃない…?


著作権というか社会への悪影響

著作権的にはクリアだというのはそりゃそうだろうと。

端的にはクラウドソーシング粗製乱造されたアフィリエイトブログと同じだ。

ネットから抽出した関心リストに沿ってググっていくつか言及ページをピックアップコピペしないように注意して記事を書き使用権フリー素材集の写真を添える。誰かが自分専門性取材と実務から得た情報を取りまとめた記事と内容が同じでも著作権的な問題はない。

書くことが決まっていてそれを多様で小さな判断をして他者著作権侵害しないようにコピーを生成するのがその仕事で、この度はAIを使えば一記事1000円なんてクラウドソーシングにすら発注する必要もなくなったということだ。

長期間かけて身に着けた専門性とか取材の手間暇、実験して確認する手間や費用。そんな記事公表した時点で著作権ロンダリングパブリックドメインになる。いまテックライターアップル提灯記事書く以外に収入がないのはそういう結果なのでは?

頑張って書いてもすぐ人力AIコピーされてこれは私の著作物といわれるのではそのものへのインセンティブが失われてその界隈にニンゲンは誰もいなくなるんじゃないのかな。

そういうことの是正著作権って設定されてたと思うので法律家ドヤ顔問題ありませんっていうのはAI並みかなと思いますね。


直近のうんざりする未来

とりあえず文章画像イラスト自動生成できるようになったので、ツイッターの関心キーワードから記事リアルタイム自動生成されてネットはいかがでしたかどころでなくなるんじゃない。

  • そもそもそういうの元から見ないのでどーでも良いかな GoogleさんはAIで自動生成したページはスパムって言ってるけど YouTubeも結構誤BANしてるのでどういうアルゴリズムなのかは気になる

  • まだまだ未熟な技術なのにそんな高度に完成された機能を求められても困っちゃうんじゃないかな?

  • ぶっちゃけプロンプトを考えて試行錯誤するのは面倒だからそれ専用の職業というのはあった方が助かる 脳のリソース取られたくない そのうえで微調整も必要だからその人自身のセンス...

  • ネットの光は全て嘘、ぐらいのマインドセットが鍛えられそう。全人類が、とは言わないが。

    • 今までもネットで実話風の話なんかいくらでもあったし、それが画像になっただけやな

  • クソコラで磨いた技術とimg2imgを使えばだいたい解決する

    • img2imgの性能はかなりいいよね 定番お絵描きソフトにimg2imgが組み込まれたら爆速で作品生み出せるようになるよね

  • これがこのまま定着したとして、 一番気になるのはAIの描いた「ありふれた絵」が氾濫した時だわ AIがAIの絵から絵を学習し始めたらどうなってしまうんだろう その頃にはAIが自分で参考...

    • それがシンギュラリティよ

      • 遺伝的アルゴリズムが達成しえなかった 「何が描かれているか分からないのにちんぽが立つ最強のエロ絵」が発生するかもしれない

        • 生体脳に対するadversarial exampleか…

          • 脳に電極を刺して性的興奮を感じる部位が発火するかどうかをLossにしてAIが作った絵を見せ続ける・・・ 似たようなシーンをエロ漫画で見たな(VRゴーグルをつけた女の子が集団でア...

            • なんかその作ったモデルがスナップショット的存在で終わる気がしてる SDも低質で陳腐化するアニメ絵生成器にしかなってないし

      • まだそんな高尚な段階にはない気がするわw 少なくとも人間の顔をオリジナル(乱数)で違和感なく描けるようにならないとなぁ

    • AIの出力する絵の大部分は人間が取捨選択して捨ててるんで、学習に使う「AIの絵」には人間の好みがしっかり反映されてるから問題は起きないと思うよ。

  • ほぼ画像検索が嫌なら、画像数枚を用意してファインチューニングの学習データ作って結果を縛り、img2imgで全体像指定して、生成画像からのimg2imgで方向性と結果の取捨選択をし、部分的...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん