Gorilla Press

詳細

ファイルをダウンロード

モデル説明

このFlux LyCorisは、ポーズの学習方法を確認するための初期学習テストとして、SimpleTunerを用いてローカルで学習されました。データセットは26枚の画像のみで構成されており、主に「gorilla press」が唯一のタグとして使用されています。数回の試行を経て、複数のエポックでマージを実施しましたが、学習率として1e-4から7e-4の範囲が最も効果的であることがわかりました。これは最も堅牢で汎用性のあるモデルではありませんが、ほとんどの場合、ポーズを正しく生成できます。

最終学習の設定は以下の通りです:

{ "--resume_from_checkpoint": "latest", "--data_backend_config": "config/multidatabackend.json", "--aspect_bucket_rounding": 1, "--seed": 42, "--minimum_image_size": 0, "--disable_benchmark": false, "--output_dir": "output/models", "--lora_type": "lycoris", "--lycoris_config": "config/lycoris_config.json", "--max_train_steps": 10000, "--num_train_epochs": 0, "--checkpointing_steps": 250, "--checkpoints_total_limit": 20, "--model_type": "lora", "--pretrained_model_name_or_path": "black-forest-labs/FLUX.1-dev", "--model_family": "flux", "--train_batch_size": 1, "--gradient_checkpointing": "true", "--caption_strategy": "textfile", "--caption_dropout_probability": 0.0, "--resolution_type": "pixel_area", "--resolution": 1024, "--validation_seed": 42, "--validation_steps": 250, "--validation_resolution": "1024x1024", "--validation_guidance": 3.5, "--validation_guidance_rescale": "0.0", "--validation_num_inference_steps": "20", "--validation_prompt": "gorilla press", "--mixed_precision": "bf16", "--optimizer": "adamw_bf16", "--snr_gamma": "2", "--input_perturbation": ".1", "--learning_rate": "7e-4", "--lr_scheduler": "constant", "--lr_warmup_steps": 100, "--base_model_precision": "int8-quanto", "--validation_torch_compile": "false" }

このモデルで生成された画像

画像が見つかりません。