AnimatedPonyReal
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
インディセントとアース・オブ・ラブのモデルを迅速にマージしたもので、いくつかの埋め込みと組み合わせることで、驚異的に現実的なワンショットAnimatediffの結果を生み出します。
この非常にシンプルなモデルは、推奨されるテキスト埋め込みと組み合わせて、512ピクセルの画像(Hotshotが最も動きを発揮するサイズ)を生成することを目的としています。そのうちの1枚をHotshotXLを用いて直接動画に変換し、最終的にサンプラーで1Kまでアップスケールします。このT2I2Vワークフローは、複数のコンテキストにわたってHotshotの一貫性(ある程度)を維持するのに役立ちますが、動きの整合性は犠牲になります。正確なワークフローについては、トレーニングデータをダウンロードし、ComfyUIでJSONを読み込んでください。必要な埋め込みも含まれており、それらをComfyUI/Models/Embeddingsに配置する必要があります。
特定のワークフロー用に、動画をComfyUIにダウンロードしてドロップできます。ノード構成は同じですが、ノイズ、サンプラー、LoRA、埋め込みなどの値は異なる場合があります。リアルなポニーのチェックポイントだけでなく、それ以外のものにもほぼ問題なく動作しますが、パラメータや埋め込み、ノイズ値の調整が必要になるかもしれません。
8〜64以上フレーム(1〜8秒)の1K動画を約2〜8分で生成するには、HotshotXL、いくつかのユーティリティモデル(VFI)およびVRAMが最低10GB以上のGPUを備えたComfyUIが必要です。
残念ながら、動画の時間的整合性はいまひとつです。動きと整合性の間には常に葛藤があり、両方を同時に得るには運が必要です。値を微調整するよりも、シードを変えて別のシーンを試すほうが、はるかに良い結果を得られることが多いです。
HotshotXLはこちらから入手できます:
https://huggingface.co/hotshotco/Hotshot-XL/tree/main
hsxl_temporal_layers.f16.safetensorsファイルをダウンロードし、ComfyUI/Models/animatediff_modelsフォルダに配置してください。