2022-12-04

画像生成AIは色々足りてないが良くなるものか?

手がおかしくなるといったのは良くなるとわかってるので、ここでは言いたいことではない。


  1. 学習元に必要データで、高品質な物はそれほど多くないのではないか
    1. 計測機器だと、より細かい物を測定できたりするようになるが、AI学習データ品質100%劣化する方向しかないのでは?
    2. AIの出力を、人の手で修正するとしても、AIの間違いは少なくなるかもしれないが、クオリティは上がるのか?
    3. AI生成物で回るようになった場合、より高品質データを作る方法がなくなるのでは。
    4. 品質な機材が売れる数が減り、市場からジャンルごと消えた場合、高品質データを作れなくならないか
    5. 認識が間違えていて、下手な絵を沢山含まれていても大量にデータさえあれば高品質になるのか?(NovelAIだと、danbooruの何のテイストも揃ってない画像を大量に学習させればNovelAIの絵になるのか?)
  2. 絵や写真タグ付が思ったよりできていない。
    1. 人の顔の細かい差を表す単語そもそもない。
    2. メイクだと、商品によって微妙な差が出るわけだが、画像から商品名は読み取れないし、対応けができない。
    3. 2次元絵だと、目をキラキラさせたいとか、そういう表現になるか、アーティスト名に紐づいてしまっている。
    4. 写真だと、ライティング方法といった、画像に写ってない、どうやって撮影しているか情報がごっそり抜けている。学習させようにもタグ付けできないのでは。(光の向きは影で推定できるかもしれないが、オパと複数の光源組合せて撮ったのを解析してタグ付けできる人は限られるのでは)
    5. イラストだと、位置場所指定するためのタグ付けはできてない(微妙位置の調整を表す言葉がない。今だと唯一キャラ名になる)
  3. ファッションのようによっぽど詳しい人でないとタグ付けできないジャンルがある。素材名、素材のテクスチャなど。
  4. 概念組合せて新しいものを生み出せる数は限られている。
  5. 学習させてる単語を知らないことには、ブラックボックス対象プロンプトをいじることになる。
  6. 短く曖昧命令で、高品質画像が生成されるのを多くの人は望んでいるはずだが、AI意図を汲むための情報をどこからひっぱってくるのか

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん