画像生成AIは色々足りてないが良くなるものか？

はてな匿名ダイアリー

2022-12-04

■画像生成AIは色々足りてないが良くなるものか？

手がおかしくなるといったのは良くなるとわかってるので、ここでは言いたいことではない。

学習元に必要なデータで、高品質な物はそれほど多くないのではないか？
1. 計測機器だと、より細かい物を測定できたりするようになるが、AIは学習データの品質が100%で劣化する方向しかないのでは？
2. AIの出力を、人の手で修正するとしても、AIの間違いは少なくなるかもしれないが、クオリティは上がるのか？
3. AI生成物で回るようになった場合、より高品質なデータを作る方法がなくなるのでは。
4. 高品質な機材が売れる数が減り、市場からジャンルごと消えた場合、高品質なデータを作れなくならないか。
5. 認識が間違えていて、下手な絵を沢山含まれていても大量にデータさえあれば高品質になるのか？(NovelAIだと、danbooruの何のテイストも揃ってない画像を大量に学習させればNovelAIの絵になるのか？）
絵や写真のタグ付が思ったよりできていない。
1. 人の顔の細かい差を表す単語がそもそもない。
2. メイクだと、商品によって微妙な差が出るわけだが、画像からは商品名は読み取れないし、対応付けができない。
3. 2次元絵だと、目をキラキラさせたいとか、そういう表現になるか、アーティスト名に紐づいてしまっている。
4. 写真だと、ライティング方法といった、画像に写ってない、どうやって撮影しているかの情報がごっそり抜けている。学習させようにもタグ付けできないのでは。(光の向きは影で推定できるかもしれないが、オパと複数の光源組合せて撮ったのを解析してタグ付けできる人は限られるのでは）
5. イラストだと、位置の場所を指定するためのタグ付けはできてない（微妙な位置の調整を表す言葉がない。今だと唯一キャラ名になる）
ファッションのようによっぽど詳しい人でないとタグ付けできないジャンルがある。素材名、素材のテクスチャなど。
概念を組合せて新しいものを生み出せる数は限られている。
学習させてる単語を知らないことには、ブラックボックスを対象にプロンプトをいじることになる。
短く曖昧な命令で、高品質な画像が生成されるのを多くの人は望んでいるはずだが、AIが意図を汲むための情報をどこからひっぱってくるのか

2022-12-04

■画像生成AIは色々足りてないが良くなるものか？

記事への反応（ブックマークコメント）

人気エントリ

注目エントリ