Gorilla Press

세부 정보

모델 설명

이 Flux LyCoris는 포즈를 어떻게 학습할지 확인하기 위한 초기 학습 테스트로 SimpleTuner를 사용해 로컬에서 학습되었습니다. 데이터셋은 26장의 이미지로 구성되어 있으며, 주로 "gorilla press"만 태그로 사용되었습니다. 몇 차례의 시도가 필요했고, 다양한 에포크에서 병합도 이루어졌지만, 학습률 1e-4에서 7e-4 사이가 가장 효과적인 것으로 확인되었습니다. 가장 견고하거나 다양한 모델은 아니지만, 대부분의 경우 포즈를 잘 생성합니다.

최종 학습 설정은 다음과 같습니다:

{ "--resume_from_checkpoint": "latest", "--data_backend_config": "config/multidatabackend.json", "--aspect_bucket_rounding": 1, "--seed": 42, "--minimum_image_size": 0, "--disable_benchmark": false, "--output_dir": "output/models", "--lora_type": "lycoris", "--lycoris_config": "config/lycoris_config.json", "--max_train_steps": 10000, "--num_train_epochs": 0, "--checkpointing_steps": 250, "--checkpoints_total_limit": 20, "--model_type": "lora", "--pretrained_model_name_or_path": "black-forest-labs/FLUX.1-dev", "--model_family": "flux", "--train_batch_size": 1, "--gradient_checkpointing": "true", "--caption_strategy": "textfile", "--caption_dropout_probability": 0.0, "--resolution_type": "pixel_area", "--resolution": 1024, "--validation_seed": 42, "--validation_steps": 250, "--validation_resolution": "1024x1024", "--validation_guidance": 3.5, "--validation_guidance_rescale": "0.0", "--validation_num_inference_steps": "20", "--validation_prompt": "gorilla press", "--mixed_precision": "bf16", "--optimizer": "adamw_bf16", "--snr_gamma": "2", "--input_perturbation": ".1", "--learning_rate": "7e-4", "--lr_scheduler": "constant", "--lr_warmup_steps": 100, "--base_model_precision": "int8-quanto", "--validation_torch_compile": "false" }

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.