AI画像生成の課題雑感

はてな匿名ダイアリー

2022-09-29

■AI 画像生成の課題雑感

プロンプトエンジニア？

現在のAI 画像生成はほぼ画像検索といっていい、プロンプトは検索ワード並べてるのと変わらない。個人的にはエロ動画探すときの検索が一番似てると思った。

界隈でプロンプトエンジニアとか言い出した際には本当にセンスがなくて失望した。

適当なワードで画像検索してすばらしい景色の写真を見つけられて俺ってスゴイと思うだろうか。

俺の検索技術で最高なイラストを見つけてやったとか？

キーワードによる画像生成の問題はコントロールがおおざっぱすぎることと、学習モデルが変更されたときに結果があっさり大幅に変わることである。

ユーザーが思ったところに思ったように描画してもらうにはもっと工夫が必要で、なぜかAI界隈はそういうのに無頓着でAI 自動塗りなんてのもすごい大雑把な機能で「未来を予感」させながら実際は使い物にならんなこれと放置されている。

抽象 モデルの必要性

ツールを機能させるにはユーザーの意思を反映させる必要がある。

なんでもいいユーザーならキーワード指定だけで十分で今でもそれを楽しめるが、もっと厳密なゴールを設定した対象に使うと途端に精度が低すぎてお話にならなくなる。

「ガンダム」で画像を作ってみてほしい。おおすげえガンダムっぽいじゃないかと思うかもしれない。じゃあそれをガンダムファンに僕ガンダム描きましたってみせたらどうだろうか。ああ面倒な奴来ちゃったという顔をするのではないか？ファンアートは元作品の再現しないといけない部分がシビアなのだ。

AIの本質は多様で小さい判断を大量に必要とする業務を自動化すること。

従来、多量の作業の自動化はコンピューターの得意分野であったが「幅広く判断する」ことは小さな判断であっても難しく専門家でなくとも多少訓練した人間を大勢使って処理していた。

なので税務で税理士先生が指導しながらも実務は専門学校の生徒のバイトがやるみたいな業務に向く。

AI 画像生成もあるスペースを作画カロリーの高い図像で埋める効率はとても高く素晴らしい。

しかし大きい判断は人間がせざるを得ない。そしてその判断をAIに伝える必要がある。

その指示をどう出せばいいか。基本は対象を指定してどう変化させるか指示する。

つまり範囲を指定して、パラメーターを指示・変更するということになる。また指示と結果にはある程度再現性を持つべきだ。

この範囲は現在キーワードによる意味空間だったりベース画像の提示だったりする。今のところパラメーターはAIの内部的なものでしかない。

ここに抽象モデルを設計してやる必要性がある。これは言語の発明とか音階の発見のようなジャンプがあり非常にクリエイティブな仕事だ。

今画像生成AIで3D モデルを使ってるものは出力が非常に安定している。3D モデルは物理立体の抽象モデルだ。

イラストであるなら構図とか筆致といった高度な抽象概念から、いまペイントツールにあるドットでの領域指定もモデル化できるだろう。

モデルを使うことでAIの生成結果の合目的精度を上げ、管理可能にすることで人間がコントロールできる機能になる。

じゃあガンダムのイラストを生成できるAIにはどんなモデルが要るのだろう。

ファーストやSEED、ユニコーンと作品ごとに世界観モデルがあったほうがいい？キャラクターは設定に沿う必要があるしモビルスーツにはやはり3D モデルが必要か。ん？これ、権利的にアレじゃない…？

著作権というか社会への悪影響

著作権的にはクリアだというのはそりゃそうだろうと。

端的にはクラウドソーシングで粗製乱造されたアフィリエイトブログと同じだ。

ネットから抽出した関心リストに沿ってググっていくつか言及ページをピックアップしコピペしないように注意して記事を書き使用権フリー素材集の写真を添える。誰かが自分の専門性と取材と実務から得た情報を取りまとめた記事と内容が同じでも著作権的な問題はない。

書くことが決まっていてそれを多様で小さな判断をして他者の著作権を侵害しないようにコピーを生成するのがその仕事で、この度はAIを使えば一記事1000円なんてクラウドソーシングにすら発注する必要もなくなったということだ。

長期間かけて身に着けた専門性とか取材の手間暇、実験して確認する手間や費用。そんな記事も公表した時点で著作権ロンダリングでパブリックドメインになる。いまテックライターがアップルの提灯記事書く以外に収入がないのはそういう結果なのでは？

頑張って書いてもすぐ人力AI コピーされてこれは私の著作物といわれるのではそのものへのインセンティブが失われてその界隈にニンゲンは誰もいなくなるんじゃないのかな。

そういうことの是正に著作権って設定されてたと思うので法律家がドヤ顔で問題ありませんっていうのはAI並みかなと思いますね。

直近のうんざりする未来像

とりあえず文章も画像やイラストも自動生成できるようになったので、ツイッターの関心キーワードから記事がリアルタイム自動生成されてネットはいかがでしたかどころでなくなるんじゃない。

Permalink | 記事への反応(7) | 06:03

記事への反応 -

anond:20220929060301
そもそもそういうの元から見ないのでどーでも良いかな GoogleさんはAIで自動生成したページはスパムって言ってるけど YouTubeも結構誤BANしてるのでどういうアルゴリズムなのかは気になる
anond:20220929060301
まだまだ未熟な技術なのにそんな高度に完成された機能を求められても困っちゃうんじゃないかな？
anond:20220929060301
ぶっちゃけプロンプトを考えて試行錯誤するのは面倒だからそれ専用の職業というのはあった方が助かる脳のリソース取られたくないそのうえで微調整も必要だからその人自身のセンス...
anond:20220929060301
ネットの光は全て嘘、ぐらいのマインドセットが鍛えられそう。全人類が、とは言わないが。
- anond:20220929122850
  今までもネットで実話風の話なんかいくらでもあったし、それが画像になっただけやな
anond:20220929060301
クソコラで磨いた技術とimg2imgを使えばだいたい解決する
- anond:20220929123106
  img2imgの性能はかなりいいよね定番お絵描きソフトにimg2imgが組み込まれたら爆速で作品生み出せるようになるよね
anond:20220929060301
これがこのまま定着したとして、一番気になるのはAIの描いた「ありふれた絵」が氾濫した時だわ AIがAIの絵から絵を学習し始めたらどうなってしまうんだろうその頃にはAIが自分で参考...
- anond:20220929161124
  それがシンギュラリティよ
  - anond:20220929162115
    遺伝的アルゴリズムが達成しえなかった「何が描かれているか分からないのにちんぽが立つ最強のエロ絵」が発生するかもしれない
    - anond:20220929163601
      生体脳に対するadversarial exampleか…
      - anond:20220929164927
        脳に電極を刺して性的興奮を感じる部位が発火するかどうかをLossにしてAIが作った絵を見せ続ける・・・似たようなシーンをエロ漫画で見たな（VRゴーグルをつけた女の子が集団でア...
        anond:20220929165335
        なんかその作ったモデルがスナップショット的存在で終わる気がしてる SDも低質で陳腐化するアニメ絵生成器にしかなってないし
  - anond:20220929162115
    まだそんな高尚な段階にはない気がするわｗ少なくとも人間の顔をオリジナル（乱数）で違和感なく描けるようにならないとなぁ
- anond:20220929161124
  AIの出力する絵の大部分は人間が取捨選択して捨ててるんで、学習に使う「AIの絵」には人間の好みがしっかり反映されてるから問題は起きないと思うよ。
anond:20220929060301
ほぼ画像検索が嫌なら、画像数枚を用意してファインチューニングの学習データ作って結果を縛り、img2imgで全体像指定して、生成画像からのimg2imgで方向性と結果の取捨選択をし、部分的...