OneTrainer - how to use with float16
詳細
ファイルをダウンロード
モデル説明
まず、Stable Cascade Lora Training with OneTrainer | Civitai のチュートリアルに大変感謝します。理解するのが難しかったですが、ようやく動作するようになりました :)
心配しないでください!RTX 3060 Ti 8GB VRAM でも動作します。私は古いRyzen 7と32GB RAMの環境で(LoRAのトレーニングとワークフローの実行をしています)。
動作しているLoRA:
Stable Cascade Beksinski - v2.0 | Stable Diffusion LoRA | Civitai
プリセットとワークフローはzipファイルとして追加しています。
では、始めましょう!
json(プリセットファイル)を次のフォルダに配置してください。

ステップバイステップ:

私はドライブLに画像とtxtファイルを置きました。bfloat32は面白いですが、私のGPUでは非常に遅いので、すべてf16(bf16ではなく)に切り替えました。








私はBLIPを使ってキャプションを生成するためのデータセットツールを使用し、トリガー語をキャプションの最初に設定しました。
キャプションのヒント:まずBLIPでタグとキャプションの1行目を作成し、その後wd14キャプションを新しい行として追加します。結果:
"beksinskiart, a painting of a man kneeling down in the sand
traditional media, fire, no humans, solo, border"


より長いキャプションが必要な場合は、BLIPまたはBLIP2モデルでmax_tokensを追加する必要があります。


最後のウィンドウ:

テストワークフロー:

通常のワークフロー:

良い一日を!

トレーニング後、以下のプロンプトで私のワークフローを使用してください:
"beksinskiart, a painting of a man kneeling down in the sand
traditional media, fire, no humans, solo, border"
すると、このような結果が得られます:










