2023-12-31

画像生成AI、あと何が足りないのか

倫理問題はここでは置いておいて、あと何が足りていないのか。


画像に関して

  1. ファッションメイク、ヘアセットなど言語化カテゴリーけが出来てないものコントロール出来ない
  2. 目の形などが出来ない。(元絵集めてLoRAでという方法になる)
  3. Controlnetでポーズが動かせるというが、実際やると違和感が残る。言葉説明しにくい(ので改善点をあげにくい)
  4. 漫画コマアノテーションデータ自体が足りてない。
  5. 2人キャラは描画出来るようになったが、まだ不安定。(Latentとか)
  6. データがある物のモデル、LoRaは増えるが、本当に真似るだけになっている。(クオリティは上がったが過学習している?)
  7. モデルは沢山あるが、どれも似たりよったり。
  8. モデルを全部入れ替える方法しかない。
  9. SD, SDXLなど元バージョンが変わると引き継ぎが出来ない。
  10. いい感じのバリエーション複数出してくれない。プロンプトを毎回探すことになる。
  11. 飽きる
  12. AI投稿サイトを見ても飽きる。Pintarestのような多様性がない。

ニュースだけ追いかけている人には、性能が上がって凄い!という感想だと思うが、

実際に定期的に触った身からすると、確かに凄いけどなんだかな、という感想だ。

プロンプト共有サイトが沢山出たが、ほぼ同じプロンプトで回っているため一通り見ると参考にならない。

多数使い回されているプロンプトより、数は少ないが自分にあったプロンプトを探す旅に出ることになり不毛だ。


動画に関して

  1. 実写動画からの変換は進んだが、元の動画がないと駄目。
  2. 実写からアニメに変換した物だと違和感が残る。(実写とアニメ表現の違い?)
  3. まだコマごとに差分があり、バタバタする(オクルージョン埋め込みが必要?)

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん