2022-09-06

画像生成AI「Stable Diffusion」の不満

学習データ品質に引っ張られて、ガチャを多く回す事になる

23億枚学習使用したとのことだが、低品質の物も多く含まれている。

「犬」、といった物はスマホ撮影したと思われるので、品質が保たれているようで上手く出せる。

イラストに関しては、単語に対するゆらぎが大きい。

例えばあるアニメキャラクター名を入れたとして、デフォルメした画像3D公式から同人まで色々あり、

平均を取るとなんだかわからない物になっている、気がする。


kawaiiというのが日本人が感じるものと、外国人が感じるもので違うということもあり、

そういった文化からのゆらぎもある、気がする。


写真人物を描画する場合だと、時代感もかなり出てくる。

服や髪型メイクといった流行があり、プロンプトを入力する側はあまり意識しない。

Japanese」といったら、普段見慣れている今の流行なはずだが、データベースがフラットなのか、戦後とかの白黒写真が混ざる。

日本より韓国文化の方が英語圏勢力があることもあり、髪型だと韓国圏の英語での言い回しを使わないと出来ないといったのもある。



出てきた画像の一部が気に入らなくても、あまり修正出来ない。

画像の一部が気に入らないとして、シード固定して、プロンプトを変更すると、大きく画像が変わってしまう。

数値を変えるだけだと構図は大きく変わらない。

記事への反応(ブックマークコメント)

人気エントリ

注目エントリ

ログイン ユーザー登録
ようこそ ゲスト さん