はてなキーワード: Taggerとは
Waifu Diffusion v1.5 beta版を見ると、ネットで集めてきた画像を学習させるだけでは、プロンプトで制御し易いモデルは難しそうだな、という印象がある。
Dreambooth、LoRAで追加学習が出来るというが、学習時に付けるキャプションを、元のモデルが認識出来ていないと、どうも覚えない。
模様などを差し替えるのは追加学習でも、すぐ出来るが、元のモデルにどうやって覚えさせるか。
学習データ作成で、BLIP、deepdanbooru、WD1.4 taggerがあるが、衣装や要素は出してくれるが、カメラアングルや構図はあまり出してくれない。
(たまに出してくれるが)