2022-09-27

https://anond.hatelabo.jp/20220914223600

日本人女性写真を生成するプロンプトについて私なりに試行錯誤した結果を示します。

画像は4つ以下に貼り付けました。

https://imgur.com/a/x8TOFla

約2週間経過しているため、既に何らかの結論を得られているかもしれませんが、どなたかの参考にでもなれば幸いです。

1.結論

(1)安定させるwordについて

actressを付けると安定すると書かれていましたが、正にその通りだと思います

actressだけでなく、2つの言葉を重ねると表情や顔の作りが安定するように思います

例として

actress×Japanese idol

AKB48 ×Japanese idol

AKB48 × a famous Japanese girl in Instagram

などです。

今回のpromptで、日本人を示す言葉はこの部分くらいだったのですがそれなりに日本人ぽくなっていると思います。(ちなみにAKB48とnogizaka46で素人目に大きな差は出ませんでした。)

また結果(1)と(2)に含まれているAya Kodaのように適当女性名前を入れると結果が安定する傾向も見られました。

(私は適当に、北条政子幸田文など、歴史上の女性名を使ってみましたが特にその名前の方々の特徴が取り入れられている訳ではなさそうです)

結果(3)は特定名前を使わない代わりに、女性らしさが出るかと思ってmuscular arm, cleavage of breasts, detailedなどを入れています

(2)CFG scale

CFG scaleは5~22で振ってみましたが、数値を大きくしすぎると光を強く当てたようなギラついた雰囲気になるようです。

5~7くらいが自然な気がしました。

(なお、自然光を当てた写真にするため、「on the beach」としましたので室内の設定だと異なると思います

(3)Step

STEPは100にしてもそれほど良い結果にならなかったため40~70にしています

2.条件と結果

使用しているツールは、下記のstable-diffusion-webui(by Automatic1111)です。

https://github.com/AUTOMATIC1111/stable-diffusion-webui

なお本稿では以降stable-diffusion-webuiと記載します。

「Restore faces」と「Highres,fix」はONにした状態とし、Samplerは「Euler a」を基本としています

また「Negative prompt」も使用しました。

stable-diffusion-webui(Automatic1111)の機能については下記をご参照ください。

https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features

美人なんだけどなんか複数人うつってる」みたいな変な写真がたまに出ること(これを解消できるワードが欲しい)

「Highres,fix」がその一助になると思いますのでもしお使いで無ければお試しください。

(1)grid-0015-18523803

◆prompt:

Photo of a young female wearing a T-shirt and jeans, Aya Koda, (((beauty bright eyes))), cute face, Angel face, short hair, small nose, on the beach, ((perfect face)), detailed, photorealistic, cute slight smile, Medium Shot, actress, Japanese idol,

Negative prompt:

ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny), (((underbite))), long jaw, long hair,
Steps: 70, Sampler: Euler a, CFG scale: 6.5, Seed: 18523803, Face restoration: GFPGAN, Size: 576x768, Denoising strength: 0.4
(2)grid-0009-1585211664

◆prompt:

Photo of a young female wearing a T-shirt and jeans, Aya Koda, (((beauty bright eyes))), cute face, Angel face, short hair, small nose, on the beach, ((perfect face)), detailed, photorealistic, cute slight smile, Medium Shot, actress, Japanese idol,

Negative prompt:

ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny), (((underbite))), long jaw, long hair,
Steps: 50, Sampler: Euler a, CFG scale: 16, Seed: 1585211664, Face restoration: GFPGAN, Size: 576x768, Denoising strength: 0.4
(3)grid-0001-3339383866

◆prompt:

portrait of an attractive talent wearing a T-shirt and jeans,  (((beauty bright eyes))), cute face with elegant hairstyle, face to the left, on the beach, ((perfect face)), muscular arm, cleavage of breasts, detailed, intricate, photorealistic, a famous Japanese girl in Instagram, cute slight smile, Medium Shot, akb48, Japanese idol,

Negative prompt:

ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny)
Steps: 55, Sampler: Euler a, CFG scale: 9, Seed: 3339383866, Face restoration: GFPGAN, Size: 576x768, Denoising strength: 0.25
(4)xy_grid-0401-1729711779

※これはsamplerとCFG Scale についての比較用です。

◆prompt:

Photo of a young female wearing a T-shirt and jeans, (((beauty bright eyes))), cute face, Angel face, short hair, small nose, on the beach, ((perfect face)), detailed, photorealistic, cute slight smile, Medium Shot, actress, Japanese idol,

Negative prompt:

ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy, disfigured, poorly drawn face, mutation, mutated, (extra_limb), (ugly), (poorly drawn hands), messy drawing, penis, nose, eyes, lips, eyelashes, text, red_eyes, (((nipples))),(skinny), (((underbite))),
Steps: 70, Sampler: Euler a, CFG scale: 5.0, Seed: 1729711779, Face restoration: GFPGAN, Size: 512x768

3.補足・雑感

Negative promptは以下くらいに省略しても問題は無さそうです。

ugly, fat, obese, chubby, (((deformed))), bad anatomy, disfigured, poorly drawn face, mutation, mutated

ただしpromptもNegative promptは、あまりシンプルにし過ぎるとハズレ率が高くなるかもしれません。

またseedを固定してCFG Scaleを変えた方が効果が出るケースも多いような気がしています

結果(3)の「talent」の部分は、適当職業名に変えても成立しました。

例:swimmer、fireman、golfer

4.終わりに

面白い課題を与えていただきありがとうございました。

もう少し早く投稿たかったのですが、色々やっているうちにあっという間に時間が経ってしまいました。

また、日本人(というかモンゴロイド)に多い頬骨が張っていない丸顔を作るのは結構難しいと感じました。

以上

記事への反応 -

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん