underground club

詳細

ファイルをダウンロード

モデル説明

hunyuan video:

オープンソースの'hunyuan'モデルのおかげで、このLORAのトレーニング機会を得ることができました。これは私が初めて動画用LORAをトレーニングした経験であり、まだ十分に理解できていない部分も多数ありますが、最終的な結果は予想以上に良かったです。以前のFLUXおよびXLのプロンプトを参考にしてください。それらは主にテーマ、シーン、照明、背景を含んでいます。

上記の例は画像ではなく、再生するにはクリックが必要なシンプルな動画です。複数の短い動画で構成されています。意味的理解は非常に優れており、生成が比較的容易であるため、フィルタリングをほとんど必要としませんでした。

私は512x512の解像度を使用しました。品質を向上させたい場合は解像度を上げることもできますが、その場合、処理速度はやや遅くなります。

もし過去に'hunyuan'を使ったことがない場合、公式ガイドとモデルダウンロードリンクはこちらです:https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/ その後、公式ワークフローに通常通り'LORA'ノードを追加するだけです。

FLUX 1 D :

Fluxは言語理解が優れており、画像の品質や細部の再現性も高いです。さまざまなプレイスタイルを試すことができます。

SDXL:

意味的理解が向上し、より興味深いコンテンツを生成できます。

解像度のサンプリングなどは、使用しているXLチェックポイントに応じて適切に設定することをお勧めします。

コンテンツが理想でない場合、プロンプトの変更だけでなく、異なるチェックポイントモデルを試すのが最善です。

私は大規模モデルとして、Dreamshaper XL/Jumpernaut XL/LEOSAM HelloWorld XLをよく使用しています。

他のチェックポイントはまだ試していませんので、各自でさまざまなモデルを試してみてください。

LORAの重みの推奨値:0.5~0.7

トレーニングデータセットは主にシーンに焦点を当てており、人物の写真はほとんど含まれていません。したがって、人物の写真を生成したい場合は、重みを0.5以下に下げてください。

SD1.5モデル:

地下クラブのLORAモデルを生成します。

推奨されるチェックポイントはリアリスティックなクラスです。

解像度は768×512を推奨します。

高解像度修復機能を使用することをお勧めします。

他のLORAと組み合わせることで、興味深い効果を得られます。

このモデルで生成された画像

画像が見つかりません。