DreamBoothを試すべくkohya_ssのリポジトリを導入してみましたが…

当サイトは、筆者が行った行動を、後日参考にするためのノートですので、基本的に成功事例を掲載するようにしています。
ただ、失敗続きだと、記事の投稿頻度が減る傾向があり、見返した際、何も行っていない時期があるように見えるので、失敗談も記事にしたいと思います。

DreamBoothを試すべくkyoha_ssのリポジトリを導入してみましたが、エラーが発生します。
chatGPTに効いたとCUDAとpytorchのバージョン違いとのこと。
venvを再作成すると一時的に解消しますが、次に起動すると同じエラーが発生します。
CUDAのバージョンアップが必要だと思われます。
そうなると他のCUDAを使ったソフトが同じ理由で動作不可になる可能性があります。

このような状況を回避するための仮想化技術ですが、CUDAなどハードウェアに近い層の問題だと仮想化では対処できない模様です。
スキルがある人であれば最新バージョンに対応することもできるのでしょうが、そのようなスキルがない自分としては、動作可能状態をなるべく維持するという対応となり、設定変更などを極力避ける必要があります。

KVMなども試しましたが、GPUのパススルーで使えるゲストOSは１つだけですので、パフォーマンスを落としてまで導入する意味は無さそうな感じがします。
物理的にOSをインストールするストレージを差し替えることで、1つのPCで環境を維持しつつ、新しい環境を試す方法に成りそうです。

昔のPCでフロッピーディスクでOSやアプリを起動していたころを思い出します。

また、ストレージの容量問題ですが、gitでcloneするリポジトリをSamabaなどのファイルサーバーなどに、逃がせば容量問題が解決するかと思ったのですが、ファイルサーバーの場合venvが上手く動作してくれませんでした。読み書きの部分は問題ないはずですので、ファイルシステムの属性の何かが足りない可能性があります

今回の問題解決に、遅ればせながらChatGPTを使い始めました。無料版ですので、あっという間にトークンの上限に達してしまいます。LLMの回答に精度を求めるのは、ナンセンスなのかもしれませんが、Ge〇iniさんより堅実な感じがします。逆にGem〇niさんはお話を作るのが上手で、フィクションであればGe〇iniさんのお力を借りると良い感じがします。

追記:20250528
RTX3060のドライバーを550から575CUDAのバージョンを12.4から12.8へバージョンアップを行いました。
その後pythonのvenvで構築されたリポジトリのpytorchのバージョンをcudaのバージョンに合わせて再インストール作業を行いました。
数ステップ、コマンドを入力する必要があったので、shスクリプトにまとめました。対象となるリポジトリは10前後でvenvの相対ディレクトリと名称を同じ物にしていたことで、shスクリプトで作業が進みました。
導入後動作確認を行ってみて、動作不能になるソフトも多いかと思いましたが、試した範囲では問題なくバージョンアップが受け入れられた模様。

ただ、xformersというパッケージが未対応ということで、エラーが発生したそふとがありました。こちらは無くとも動作しそうなのでアンインストールしました。

最新では無いですが、なるべく新し目のバージョンで実行する環境が出来たと思いますので、この環境の維持を心掛けたいと思います。

あと、DreamBoothで学習したモデルで画像生成を行ってみました。Loraのそれと比べて学習素材となった画像の再現性は高いと感じました。ただ、プロンプトの内容とは全く連動されず、学習に使った画像がそのまま出力される感じなので、StableDiffusionとして機能しているとは言えないモデルとなりました。パラメーター調整など学習の設定を学んでいきたいと思います。