現在のAI画像生成はほぼ画像検索といっていい、プロンプトは検索ワード並べてるのと変わらない。個人的にはエロ動画探すときの検索が一番似てると思った。
界隈でプロンプトエンジニアとか言い出した際には本当にセンスがなくて失望した。
適当なワードで画像検索してすばらしい景色の写真を見つけられて俺ってスゴイと思うだろうか。
キーワードによる画像生成の問題はコントロールがおおざっぱすぎることと、学習モデルが変更されたときに結果があっさり大幅に変わることである。
ユーザーが思ったところに思ったように描画してもらうにはもっと工夫が必要で、なぜかAI界隈はそういうのに無頓着でAI自動塗りなんてのもすごい大雑把な機能で「未来を予感」させながら実際は使い物にならんなこれと放置されている。
ツールを機能させるにはユーザーの意思を反映させる必要がある。
なんでもいいユーザーならキーワード指定だけで十分で今でもそれを楽しめるが、もっと厳密なゴールを設定した対象に使うと途端に精度が低すぎてお話にならなくなる。
「ガンダム」で画像を作ってみてほしい。おおすげえガンダムっぽいじゃないかと思うかもしれない。じゃあそれをガンダムファンに僕ガンダム描きましたってみせたらどうだろうか。ああ面倒な奴来ちゃったという顔をするのではないか?ファンアートは元作品の再現しないといけない部分がシビアなのだ。
AIの本質は多様で小さい判断を大量に必要とする業務を自動化すること。
従来、多量の作業の自動化はコンピューターの得意分野であったが「幅広く判断する」ことは小さな判断であっても難しく専門家でなくとも多少訓練した人間を大勢使って処理していた。
なので税務で税理士先生が指導しながらも実務は専門学校の生徒のバイトがやるみたいな業務に向く。
AI画像生成もあるスペースを作画カロリーの高い図像で埋める効率はとても高く素晴らしい。
しかし大きい判断は人間がせざるを得ない。そしてその判断をAIに伝える必要がある。
その指示をどう出せばいいか。基本は対象を指定してどう変化させるか指示する。
つまり範囲を指定して、パラメーターを指示・変更するということになる。また指示と結果にはある程度再現性を持つべきだ。
この範囲は現在キーワードによる意味空間だったりベース画像の提示だったりする。今のところパラメーターはAIの内部的なものでしかない。
ここに抽象モデルを設計してやる必要性がある。これは言語の発明とか音階の発見のようなジャンプがあり非常にクリエイティブな仕事だ。
今画像生成AIで3Dモデルを使ってるものは出力が非常に安定している。3Dモデルは物理立体の抽象モデルだ。
イラストであるなら構図とか筆致といった高度な抽象概念から、いまペイントツールにあるドットでの領域指定もモデル化できるだろう。
モデルを使うことでAIの生成結果の合目的精度を上げ、管理可能にすることで人間がコントロールできる機能になる。
じゃあガンダムのイラストを生成できるAIにはどんなモデルが要るのだろう。
ファーストやSEED、ユニコーンと作品ごとに世界観モデルがあったほうがいい?キャラクターは設定に沿う必要があるしモビルスーツにはやはり3Dモデルが必要か。ん?これ、権利的にアレじゃない…?
端的にはクラウドソーシングで粗製乱造されたアフィリエイトブログと同じだ。
ネットから抽出した関心リストに沿ってググっていくつか言及ページをピックアップしコピペしないように注意して記事を書き使用権フリー素材集の写真を添える。誰かが自分の専門性と取材と実務から得た情報を取りまとめた記事と内容が同じでも著作権的な問題はない。
書くことが決まっていてそれを多様で小さな判断をして他者の著作権を侵害しないようにコピーを生成するのがその仕事で、この度はAIを使えば一記事1000円なんてクラウドソーシングにすら発注する必要もなくなったということだ。
長期間かけて身に着けた専門性とか取材の手間暇、実験して確認する手間や費用。そんな記事も公表した時点で著作権ロンダリングでパブリックドメインになる。いまテックライターがアップルの提灯記事書く以外に収入がないのはそういう結果なのでは?
頑張って書いてもすぐ人力AIコピーされてこれは私の著作物といわれるのではそのものへのインセンティブが失われてその界隈にニンゲンは誰もいなくなるんじゃないのかな。
そういうことの是正に著作権って設定されてたと思うので法律家がドヤ顔で問題ありませんっていうのはAI並みかなと思いますね。
とりあえず文章も画像やイラストも自動生成できるようになったので、ツイッターの関心キーワードから記事がリアルタイム自動生成されてネットはいかがでしたかどころでなくなるんじゃない。
そもそもそういうの元から見ないのでどーでも良いかな GoogleさんはAIで自動生成したページはスパムって言ってるけど YouTubeも結構誤BANしてるのでどういうアルゴリズムなのかは気になる
まだまだ未熟な技術なのにそんな高度に完成された機能を求められても困っちゃうんじゃないかな?
ぶっちゃけプロンプトを考えて試行錯誤するのは面倒だからそれ専用の職業というのはあった方が助かる 脳のリソース取られたくない そのうえで微調整も必要だからその人自身のセンス...
ネットの光は全て嘘、ぐらいのマインドセットが鍛えられそう。全人類が、とは言わないが。
今までもネットで実話風の話なんかいくらでもあったし、それが画像になっただけやな
クソコラで磨いた技術とimg2imgを使えばだいたい解決する
img2imgの性能はかなりいいよね 定番お絵描きソフトにimg2imgが組み込まれたら爆速で作品生み出せるようになるよね
これがこのまま定着したとして、 一番気になるのはAIの描いた「ありふれた絵」が氾濫した時だわ AIがAIの絵から絵を学習し始めたらどうなってしまうんだろう その頃にはAIが自分で参考...
それがシンギュラリティよ
遺伝的アルゴリズムが達成しえなかった 「何が描かれているか分からないのにちんぽが立つ最強のエロ絵」が発生するかもしれない
生体脳に対するadversarial exampleか…
脳に電極を刺して性的興奮を感じる部位が発火するかどうかをLossにしてAIが作った絵を見せ続ける・・・ 似たようなシーンをエロ漫画で見たな(VRゴーグルをつけた女の子が集団でア...
なんかその作ったモデルがスナップショット的存在で終わる気がしてる SDも低質で陳腐化するアニメ絵生成器にしかなってないし
まだそんな高尚な段階にはない気がするわw 少なくとも人間の顔をオリジナル(乱数)で違和感なく描けるようにならないとなぁ
AIの出力する絵の大部分は人間が取捨選択して捨ててるんで、学習に使う「AIの絵」には人間の好みがしっかり反映されてるから問題は起きないと思うよ。
ほぼ画像検索が嫌なら、画像数枚を用意してファインチューニングの学習データ作って結果を縛り、img2imgで全体像指定して、生成画像からのimg2imgで方向性と結果の取捨選択をし、部分的...