Stable DiffusionのLoRA学習20250312

Stable-Diffusionの画像生成modelに対し追加学習用の画像を用意しファインチューニングを行います。

成功すると追加学習した画像の影響を色濃く反映した画像が生成されるようになります。

沢山のパラメータがあり正直自分の手に余ると思い、ネットの記事や動画などを見ながら試してみました。LoRAの情報は約１年前ぐらいで、今更感はあるのですが、同じ手順とパラメータを与えても素材によって結果が異なることを知りました。

「過学習」というなんとも耳馴染みのない用語もあり、どのような状態が過学習なのか不明なので何とも言えませんが、現在のところ生成される画像は人物を生成したはずが、私の知っている人類とはかけ離れた画像が生成されてしまいます。

学習を繰り返すステップ数を減らすと、まるで反応しないところ見ると、過学習ではなく学習がたりないと思われるので、ひたすらステップ数を増やしています。

ステップ数を増やし、パラメータをいじり、Stable-Diffuisionで画像を生成してみるというサイクルを何度も繰り返します。

時間がいくらあっても足りないので、いつかまたチャレンジしたいと思います。

動画を見ていて個人でサーバーを立てている人々をテーマにした動画を見かけました。聞いたことも無い様な専門用語を嬉々として語らう姿は、異国の言葉で会話している異邦人のように見えました。

かなりニッチな分野でも、それを動画にして視聴される需要があるという、なんとも良い時代になりました。

その動画でproxmoxという聞いたことの無いソフトでサーバーを構築するとの情報を得て、検索してみました。

ざっと見た感じ仮想化を実行するソフトウェアで、ネットワーク越しに仮想サーバーを立ち上げる、Webインターフェイスが印象的でした。

一度セットアップすれば後はウェブブラウザから、好きなだけサーバーの構築と破壊を行うことが出来ます。自由にサーバーが構築できる点は非常に魅力的なので、いつか時間が出来たら試してみたいと思います。