日本人女性の写真を生成するプロンプトについて私なりに試行錯誤した結果を示します。
画像は4つ以下に貼り付けました。
約2週間経過しているため、既に何らかの結論を得られているかもしれませんが、どなたかの参考にでもなれば幸いです。
actressを付けると安定すると書かれていましたが、正にその通りだと思います。
actressだけでなく、2つの言葉を重ねると表情や顔の作りが安定するように思います。
例として
actress×Japanese idol
AKB48 × a famous Japanese girl in Instagram
などです。
今回のpromptで、日本人を示す言葉はこの部分くらいだったのですがそれなりに日本人ぽくなっていると思います。(ちなみにAKB48とnogizaka46で素人目に大きな差は出ませんでした。)
また結果(1)と(2)に含まれているAya Kodaのように適当に女性の名前を入れると結果が安定する傾向も見られました。
(私は適当に、北条政子、幸田文など、歴史上の女性名を使ってみましたが特にその名前の方々の特徴が取り入れられている訳ではなさそうです)
結果(3)は特定の名前を使わない代わりに、女性らしさが出るかと思ってmuscular arm, cleavage of breasts, detailedなどを入れています。
CFG scaleは5~22で振ってみましたが、数値を大きくしすぎると光を強く当てたようなギラついた雰囲気になるようです。
(なお、自然光を当てた写真にするため、「on the beach」としましたので室内の設定だと異なると思います)
STEPは100にしてもそれほど良い結果にならなかったため40~70にしています。
使用しているツールは、下記のstable-diffusion-webui(by Automatic1111)です。
https://github.com/AUTOMATIC1111/stable-diffusion-webui
なお本稿では以降stable-diffusion-webuiと記載します。
「Restore faces」と「Highres,fix」はONにした状態とし、Samplerは「Euler a」を基本としています。
stable-diffusion-webui(Automatic1111)の機能については下記をご参照ください。
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features
「Highres,fix」がその一助になると思いますのでもしお使いで無ければお試しください。
◆prompt:
Photo of a young female wearing a T-shirt and jeans, Aya Koda, (((beauty bright eyes))), cute face, Angel face, short hair, small nose, on the beach, ((perfect face)), detailed, photorealistic, cute slight smile, Medium Shot, actress, Japanese idol,
◆Negative prompt:
ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny), (((underbite))), long jaw, long hair,
Steps: 70, Sampler: Euler a, CFG scale: 6.5, Seed: 18523803, Face restoration: GFPGAN, Size: 576x768, Denoising strength: 0.4
◆prompt:
Photo of a young female wearing a T-shirt and jeans, Aya Koda, (((beauty bright eyes))), cute face, Angel face, short hair, small nose, on the beach, ((perfect face)), detailed, photorealistic, cute slight smile, Medium Shot, actress, Japanese idol,
◆Negative prompt:
ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny), (((underbite))), long jaw, long hair,
Steps: 50, Sampler: Euler a, CFG scale: 16, Seed: 1585211664, Face restoration: GFPGAN, Size: 576x768, Denoising strength: 0.4
◆prompt:
portrait of an attractive talent wearing a T-shirt and jeans, (((beauty bright eyes))), cute face with elegant hairstyle, face to the left, on the beach, ((perfect face)), muscular arm, cleavage of breasts, detailed, intricate, photorealistic, a famous Japanese girl in Instagram, cute slight smile, Medium Shot, akb48, Japanese idol,
◆Negative prompt:
ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny)
Steps: 55, Sampler: Euler a, CFG scale: 9, Seed: 3339383866, Face restoration: GFPGAN, Size: 576x768, Denoising strength: 0.25
※これはsamplerとCFG Scale についての比較用です。
◆prompt:
Photo of a young female wearing a T-shirt and jeans, (((beauty bright eyes))), cute face, Angel face, short hair, small nose, on the beach, ((perfect face)), detailed, photorealistic, cute slight smile, Medium Shot, actress, Japanese idol,
◆Negative prompt:
ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny), (((underbite))),
Steps: 70, Sampler: Euler a, CFG scale: 5.0, Seed: 1729711779, Face restoration: GFPGAN, Size: 512x768
Negative promptは以下くらいに省略しても問題は無さそうです。
ugly, fat, obese, chubby, (((deformed))), bad anatomy, disfigured, poorly drawn face, mutation, mutated
ただしpromptもNegative promptは、あまりシンプルにし過ぎるとハズレ率が高くなるかもしれません。
またseedを固定してCFG Scaleを変えた方が効果が出るケースも多いような気がしています。
結果(3)の「talent」の部分は、適当に職業名に変えても成立しました。
もう少し早く投稿したかったのですが、色々やっているうちにあっという間に時間が経ってしまいました。
また、日本人(というかモンゴロイド)に多い頬骨が張っていない丸顔を作るのは結構難しいと感じました。
以上
をみんなで共有しあいたい(タイトル入らなかった) 日本人限定の理由は、学習データの多い西洋人の写真と比べて、日本人特有の考慮が必要だと思われるため いくつか三次元の美...
日本人女性の写真を生成するプロンプトについて私なりに試行錯誤した結果を示します。 画像は4つ以下に貼り付けました。 https://imgur.com/a/x8TOFla 約2週間経過しているため、既に何らかの...
広末みたいなのがスッと出ると嬉しいよな。