ImageFX、普通の検索時と同じでプロンプトに書いてない情報拡張してるんだろうが、元画像も入れてI2Iっぽくなってんじゃね？

はてな匿名ダイアリー

2024-08-30

■ImageFX、普通の検索時と同じでプロンプトに書いてない情報 拡張してるんだろうが、元画像も入れてI2Iっぽくなってんじゃね？

例えばJapanese Girlと入力したときに、米国の太平洋戦争時の公文書に残っている写真に載っている日本人女性を意図したわけではなく、

現代風なのを意図しているはずだ。

このあたりはGoogle検索時でもやっている。

で、あまりに元画像に似すぎてねーか？ってのが出てくることもあり、

画像生成時に、プロンプトで引っかかった複数の画像も生成に突っ込んでいるじゃないのか？

と疑ってしまう。

StableDiffusionだと1枚狙ってだが、Googleの画像検索に出てくる上位数%を入れる。

実際の実装は、画像をRAGに変換していて、元の画像そのままと違うのかもだが・・。

物体ごとにセグメント分かれているので、プロンプトでわざわざ指示して一致しない部分は置き換わる。

Permalink | 記事への反応(0) | 09:53

記事への反応 -

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん