Genshin TCG Style [Wan 14B]
詳細
ファイルをダウンロード
モデル説明
トリガー単語: Genshin_TCG
モデル: Wan 2.1 t2i 14B
すべての例はLoRA強度1.0、CFG=6で生成されています
推論にはKijaiのワークフローを使用しました
プロンプトには、以下の構造をお勧めします:
"Genshin_TCG medium shot" + キャラクターの説明(外見、ポーズ、衣装) + キーとなるオブジェクト(武器/アーティファクト) + 背景 + 動的な要素。色のコントラスト(黒い鎧 vs 光るアクセント)と神秘的な雰囲気(星空、魔法の粒子)に特に注意を払ってください。
TCGカードのような金枠を追加したい場合は、プロンプトの最後に以下を追加してください:
フレームは、各角に星型のエンブレムと縁に繊細な模様を配した金縁で装飾され、洗練され、高級感あるビジュアル効果を生み出しています。
Wan 1.3Bの以前のバージョンは以下で確認できます: /model/1728768/genshin-tcg-style-wan-13b
トレーニング詳細
14Bバージョンのトレーニングは1.3Bバージョンよりもはるかに簡単です。動きはスムーズで、生成中にほとんどアーティファクトが発生しません。トレーニングには、Genshin Genius Invocation TCGカードゲームのカード54枚を含む短い動画のデータセットを使用しました。トレーニングにはdiffusion pipeを使用したため、以下にtomlファイルを掲載します。
データセット用:
resolutions = [[514, 304]]
enable_ar_bucket = true
min_ar = 0.5
max_ar = 2.0
num_ar_buckets = 7
frame_buckets = [1, 32, 33]
[[directory]]
path = "/home/user/Genshin_TCG_dataset/videos/304_514"
num_repeats = 5
resolutions = [[514, 304]]
[[directory]]
path = "/home/user/Genshin_TCG_dataset/videos/368_620"
num_repeats = 5
resolutions = [[620, 368]]
[[directory]]
path = "/home/user/Genshin_TCG_dataset/videos/492_828"
num_repeats = 5
resolutions = [[828, 492]]
トレーニング用:
output_dir = "/home/user/Genshin_TCG/14B"
dataset = "/home/user/config/dataset/dataset_v001.toml"
epochs = 80
micro_batch_size_per_gpu = 1
pipeline_stages = 1
gradient_accumulation_steps = 1
gradient_clipping = 1
warmup_steps = 10
eval_every_n_epochs = 1
eval_before_first_step = true
eval_micro_batch_size_per_gpu = 1
eval_gradient_accumulation_steps = 1
save_every_n_epochs = 1
activation_checkpointing = 'unsloth'
partition_method = "parameters"
save_dtype = "bfloat16"
caching_batch_size = 1
steps_per_print = 10
video_clip_mode = "single_beginning"
blocks_to_swap = 32
[model]
type = "wan"
ckpt_path = "/home/user/Wan2.1-T2V-14B"
dtype = "bfloat16"
transformer_dtype = "float8"
timestep_sample_method = "logit_normal"
[adapter]
type = "lora"
rank = 64
dtype = "bfloat16"
[optimizer]
type = 'AdamW8bitKahan'
lr = 5e-5
betas = [0.9, 0.99]
weight_decay = 0.01
stabilize = false
