画像生成AI、あと何が足りないのか

はてな匿名ダイアリー

2023-12-31

■画像生成AI、あと何が足りないのか

倫理問題はここでは置いておいて、あと何が足りていないのか。

画像に関して

ファッション、メイク、ヘアセットなど言語化、カテゴリー分けが出来てないものはコントロール出来ない
目の形などが出来ない。(元絵集めてLoRAでという方法になる）
Controlnetでポーズが動かせるというが、実際やると違和感が残る。言葉で説明しにくい（ので改善点をあげにくい）
漫画はコマのアノテーションデータ自体が足りてない。
2人キャラは描画出来るようになったが、まだ不安定。(Latentとか)
元データがある物のモデル、LoRaは増えるが、本当に真似るだけになっている。（クオリティは上がったが過学習している？）
モデルは沢山あるが、どれも似たりよったり。
モデルを全部入れ替える方法しかない。
SD, SDXLなど元バージョンが変わると引き継ぎが出来ない。
いい感じのバリエーションを複数出してくれない。プロンプトを毎回探すことになる。
飽きる
AI絵投稿サイトを見ても飽きる。Pintarestのような多様性がない。

ニュースだけ追いかけている人には、性能が上がって凄い！という感想だと思うが、

実際に定期的に触った身からすると、確かに凄いけどなんだかな、という感想だ。

プロンプト共有サイトが沢山出たが、ほぼ同じプロンプトで回っているため一通り見ると参考にならない。

多数使い回されているプロンプトより、数は少ないが自分にあったプロンプトを探す旅に出ることになり不毛だ。

動画に関して

実写動画からの変換は進んだが、元の動画がないと駄目。
実写からアニメに変換した物だと違和感が残る。（実写とアニメの表現の違い？）
まだコマごとに差分があり、バタバタする（オクルージョン埋め込みが必要？）

Permalink | 記事への反応(0) | 22:13

記事への反応 -

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん