OneTrainer - how to use with float16

詳細

ファイルをダウンロード

モデル説明

まず、Stable Cascade Lora Training with OneTrainer | Civitai のチュートリアルに大変感謝します。理解するのが難しかったですが、ようやく動作するようになりました :)

心配しないでください!RTX 3060 Ti 8GB VRAM でも動作します。私は古いRyzen 7と32GB RAMの環境で(LoRAのトレーニングとワークフローの実行をしています)。

動作しているLoRA:

Stable Cascade Beksinski - v2.0 | Stable Diffusion LoRA | Civitai

プリセットとワークフローはzipファイルとして追加しています。

では、始めましょう!

json(プリセットファイル)を次のフォルダに配置してください。

ステップバイステップ:

私はドライブLに画像とtxtファイルを置きました。bfloat32は面白いですが、私のGPUでは非常に遅いので、すべてf16(bf16ではなく)に切り替えました。

私はBLIPを使ってキャプションを生成するためのデータセットツールを使用し、トリガー語をキャプションの最初に設定しました。

キャプションのヒント:まずBLIPでタグとキャプションの1行目を作成し、その後wd14キャプションを新しい行として追加します。結果:

"beksinskiart, a painting of a man kneeling down in the sand

traditional media, fire, no humans, solo, border"

より長いキャプションが必要な場合は、BLIPまたはBLIP2モデルでmax_tokensを追加する必要があります。

最後のウィンドウ:

テストワークフロー:

通常のワークフロー:

良い一日を!

トレーニング後、以下のプロンプトで私のワークフローを使用してください:

"beksinskiart, a painting of a man kneeling down in the sand

traditional media, fire, no humans, solo, border"

すると、このような結果が得られます:

このモデルで生成された画像

画像が見つかりません。