例のクソアホ画像AI、結局使いこなすには人間様の手が必要だったｗｗｗ [902879481]

?2BP(1000) · 2022/09/02(金) 15:45:50.76

より思い通りの画像を作る！img2img＆フォトバッシュ複合ワークフローについて[StableDiffusion]
https://note.com/abubu_nounanka/n/n3a0431d2c47a

2022/09/02(金) 15:46:49.13

ここはスクリプトが立てたスレなのでレス禁止です

?2BP(1000) · 2022/09/02(金) 15:47:00.09

■『昼飯を食べるバットマンとジョーカー』を作る。

https://assets.st-note.com/img/1661952952765-dyDTK0DMDW.jpg
『昼飯を食べるバットマンとジョーカー』A film still of Batman and Joker eating lunch in the diner, worm lighting, cinematic tone. The Dark Knight(2008)

なんでしょうかこの凶悪な白塗りバットマンは。『昼飯を食べるバットマンとジョーカー』を生成させると高確率でこのような画像が出て来ます。
現在のSDは二つの異なる要素を独立した形で平行描写することが難しく、このようにバットマンとジョーカーの"要素"が混ざってしまいます。このような混同はあらゆる場面で少なからず影響を出しており、最早入力方式の問題ではなくStableDiffusion自体の性能限界に起因するものでしょう。
そこでより良い画像作りの為に考えられる解決策が「いっそPhotoshopで合成してしまおう」です。シード値を固定したまま、『昼飯を食べる二人のバットマン』と『昼飯を食べる二人のジョーカー』の二枚の画像を作り、後から加工で繋いでしまう訳ですね。シード値が同じであれば多少プロンプトを変更しても構図やライティングは近似のものが生成されますので、フォトバッシュ作業は非常に容易です。

https://assets.st-note.com/img/1661953790199-AVB1LK4gmt.jpg?width=800
シード値を固定して『昼飯を食べる二人のバットマン』と『昼飯を食べる二人のジョーカー』を生成してからフォトショップで統合。だいたい雑に消しゴムかけるだけ。

はい、バットマンとジョーカーが仲良く飯を食うことができました。思い通りの画像が出るまで生成ガチャを１００回続けるよりも、遥かに素早く確実性の高いアプローチだと思われます。