約二ヶ月間24/7でstable diffusionを回し続けたが(電気代のことは忘れたい…)、結局自分でMerge Modelを作るということになった。それほど難しいことではない。 画像生成をしても似たような画像ばかりになってきたし、Promptネタもつきてきたなと言うときに手を出す感じです。 外国産のモデルx3、日本産x2でMerge。 外国産のモデルをベースに他4つをほんの少々加えましたという程度(Input Block 0-2, 4-5, 7-8, Mid BlocksしかMergeしてない)。 ここから改良を加えていくが外国産のNSFWを含むPromptの自由度と日本人のモデル、あとちょっとリアル系はとくいでないので、2.9D-2.8Dぐらいのトーンを目指した。 PromptでNSFWを指定してもかたくなに拒むモデルもあるが、これは比較的簡単に対応可能。 Photoshopしてノイズを乗せたりしているが、以下が生成画像。 著作権上問題ないとされているものをPick Upしたが、公開とかしない。 ModelのTrainingはしない。 あれは多人数でやるものだと思う、個人的には。 (追記)相当、沼にはまるなという感じ…