Studio Ghibli ๐จ Lumina-Image 2.0
์ธ๋ถ ์ ๋ณด
ํ์ผ ๋ค์ด๋ก๋
๋ชจ๋ธ ์ค๋ช
์ค๋ช
์๋์ Lumina 2๋ Ghibli ์คํ์ผ์ ์ดํดํ์ง ๋ชปํฉ๋๋ค. ์ ๊ฐ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํ๋ฉด ์์๋ณผ ์ ์๋ ํด๋ถํ์ ์ค๋ฅ๊ฐ ์๋ ๋๋ผ์ด ์ด๋ฏธ์ง๊ฐ ์์ฑ๋์ง๋ง, ์ด๋ Ghibli ์คํ์ผ์ด ์๋๋๋ค.
์ ๋ Ghibli ์์ ์คํ์ผ์ ๋งค์ฐ ์ข์ํ๋ฉฐ, ๋งค๋ฒ ์๋ก์ด ๋ชจ๋ธ์ ์ด ์คํ์ผ์ ๊ฐ๋ฅด์น๋ ค๊ณ ๋ ธ๋ ฅํด์์ต๋๋ค. ์ด๋ Lumina Image 2์ ๋ํ ์ ์ด๊ธฐ ์๋ ๊ฒฐ๊ณผ์ ๋๋ค. ๋ ๋์์ง ์๋ ์์ง๋ง, ๊ทธ๋ณด๋ค ๋ ๋๋น ์ง ์๋ ์์์ฃ ๐คท
์ฌ์ฉ๋ฒ
๊ฐค๋ฌ๋ฆฌ์ ๊ฐ ์ด๋ฏธ์ง์๋ ๋ด์ฅ๋ ์ํฌํ๋ก์ฐ๊ฐ ํฌํจ๋์ด ์์ผ๋ฏ๋ก, ๊ทธ๋ฅ ComfyUI์ ๋๋๊ทธํ์ธ์.
๊ฑฐ์ ๋ชจ๋ ๋งค๊ฐ๋ณ์๋ ๊ธฐ๋ณธ ์ํฌํ๋ก์ฐ์ ๋์ผํ๋ฉฐ, ๋ค์ ํญ๋ชฉ๋ง ๋ค๋ฆ
๋๋ค:
Steps: 40
Scheduler: sgm_uniform
(์ฐธ๊ณ : ์ด ์ค์ ์ด ๋ฐ๋์ ์ต์ ์ ์๋๋๋ค. ๋จ์ง ์ด ์ค์ ์ผ๋ก LoRA ์ถ๋ ฅ์ ํ ์คํธํ์ ๋ฟ์ ๋๋ค.)
๋ค๋ฅธ ์ํ๋ฌ๋ ์์ง ์ถฉ๋ถํ ํ ์คํธํ์ง ์์์ง๋ง, ๋ฃ๊ธฐ๋ก๋ gradient_estimation ์ํ๋ฌ๊ฐ ์ผ๋ถ ๊ฐ์ ์ ์ ๊ณตํ ์ ์๊ณ , CFG ๊ฐ์ ๋ฎ์ถ๋ฉด ํด๋ถํ์ ์ ํ๋๊ฐ ํฅ์๋ ๊ฐ๋ฅ์ฑ์ด ์๋ค๊ณ ํฉ๋๋ค.
ํ์ต
์ ๋ Ghibli ์ํ์ ํ๋ฉด ์บก์ฒ ์ผ๋ถ๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ, ์ด 184์ฅ(1024x1024)์ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํ์ต๋๋ค.
์ด ์ด๋ฏธ์ง๋ค์ JoyCaption Alpha Two(๋ก์ปฌ์์)๋ฅผ "์ค๋ช
์ /๊ธด" ๋ชจ๋๋ก ์ฌ์ฉํ์ฌ ์บก์
์ ์์ฑํ๊ณ , ๊ฐ ์บก์
์์ "You are an assistant designed to generate high-quality images based on user prompts.
(์ ๋ LLM ์ ๋์ด๊ฐ ๋ถํ์ํ๋ค๊ณ ์๊ฐํ์ง๋ง, ๊ทธ๋๋ ์ถ๊ฐํ์ต๋๋ค.)
ํ์ต์๋ ai-toolkit์ ์ฌ์ฉํ์ผ๋ฉฐ, ์ด ๋๊ตฌ๋ ์ต๊ทผ Lumina-2 ํ์ต ๋ธ๋์น๋ฅผ ์ฃผ ์ ์ฅ์์ ๋ณํฉํ์ต๋๋ค. ์ฐธ๊ณ ๋ก, Lumina-2 ํ์ต(LoRA ๋ฐ ์ ์ฒด ๋ฏธ์ธ ์กฐ์ )์ ์ง์ํ๋ ๋ ๋ค๋ฅธ ํ์ต ๋๊ตฌ๋ diffusion-pipe์ ๋๋ค. ์ ๋ ์ด๋ฅผ ํ ์คํธํด๋ณด์์ง๋ง, ์ ํ๊ฒฝ์์๋ ai-toolkit๋ณด๋ค ๋ ๋๋ ธ์ต๋๋ค.
์ฒ์์๋ ๊ธฐ๋ณธ ๊ตฌ์ฑ์ ์ฌ์ฉํ์ง๋ง, ๊ธฐ๋ณธ ํ์ต๋ฅ (1e-04)์ด ๋๋ฌด ๋๋ค๊ณ ํ๋จํ์ต๋๋ค. ์ฌ๋ฌ ์ต์ ํ๊ธฐ๋ฅผ ์คํํ ๊ฒฐ๊ณผ, 2000~3000 ๋จ๊ณ ํ LoRA์ ํ์ง์ด ์ข์ง ์์์ต๋๋ค. ๊ทธ ํ ํ์ต๋ฅ ์ 5e-05๋ก ๋ณ๊ฒฝํ๋๋ ๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ป์์ต๋๋ค. ์ต์ข ์ ์ผ๋ก 20,000๋จ๊ณ๊น์ง ํ์ตํ๊ธฐ๋ก ๊ฒฐ์ ํ์ต๋๋ค. ํ์ต์ ๋งค์ฐ ๋น ๋ฅด๊ฒ ์งํ๋์์ต๋๋ค(RTX 3090์์ ์ฝ 1.7์ด/๋จ๊ณ). ์๋ง๋ ์ง๋ ๋ ๋ฌ ๋์ ์ ๊ฐ ๋จ์ง HunyuanVideo๋ง ํ์ตํด์๊ธฐ ๋๋ฌธ์ผ ๊ฒ์ ๋๋ค ๐ ํ์ต์ด ๋๋ ํ, TensorBoard ๋ก๊ทธ์ ๋ฐ๋ผ ํ๋ จ ์ค์ ์ข์ ์ํ ํ์ง์ ๋ณด์๊ฑฐ๋ ์์ค์ด ๊ฐ์ฅ ๋ฎ์ ์ฒดํฌํฌ์ธํธ๋ฅผ ์ ํํ์ต๋๋ค. ๊ทธ ํ ComfyUI์์ ์๋์ผ๋ก ํ ์คํธํ๊ณ 17,200๋จ๊ณ์ ์ฒดํฌํฌ์ธํธ๋ฅผ ์ต์ข ์ ํํ์ต๋๋ค.
(์์ ํ ํ์ ํ๋ ๋ฐ๋ ์๋์ง๋ง, ์ฐ์ํ LoRA๋ฅผ ์ป๊ธฐ ์ํ ์ด ํ์ต ๋จ๊ณ ์๋ ํจ์ฌ ์ค์ผ ์ ์์ ๊ฒ์ด๋ผ ์๊ฐํฉ๋๋ค. ์ด๋ ๋จ์ง ์ฒซ ์๋์ผ ๋ฟ์ด๋ฉฐ, ๋์์ Lumina-2๊ฐ ์ผ๋ง๋ ์ค๋ซ๋์ ํ์ต๋ ์ ์๋์ง ํ ์คํธํ๊ณ ์ถ์์ต๋๋ค.)
์์ฝํ๋ฉด, ์ ๋ ๋ค์ ๋งค๊ฐ๋ณ์๋ฅผ ์ฌ์ฉํ์ต๋๋ค:
lr: 5e-5
optimizer: "adamw8bit"
optimizer_params.betas: [0.95, 0.98]
optimizer_params.weight_decay: 0.01
noise_offset: 0.1
lr_scheduler: "cosine"
๊ธฐํ ํ์ดํผํ๋ผ๋ฏธํฐ๋ ๋ชจ๋ ๊ธฐ๋ณธ๊ฐ ๊ทธ๋๋ก ์ฌ์ฉํ์ต๋๋ค. ๋ฐ์ดํฐ์ธํธ ๋ฐ ๊ตฌ์ฑ ํ์ผ์ ์ด LoRA์ ํจ๊ป ์ฒจ๋ถ๋์์ต๋๋ค.
(์ ๋ ๋ญํฌ 16์ ๊ทธ๋๋ก ๋๋ ๊ฒ์ด ์ค์์๋ค๊ณ ์๊ฐํฉ๋๋ค. Lumina-2 LoRA๋ ์คํ์ผ์ ์ธ๋ถ ์ฌํญ์ ์์ ํ ์ก์๋ด๋ ค๋ฉด ์ต์ ๋ญํฌ 32 ์ด์์ด ํ์ํฉ๋๋ค. ํ์ง๋ง ์ ๋ ์์ง ํ์ต ์ค์ ๋๋ค.)
ํธํ์ฑ
ํ ๊ฐ์ง ์ธ๊ธํ ์ : ai-toolkit์ ComfyUI์ ํธํ๋์ง ์๋ ํ์์ผ๋ก LoRA safetensors ํ์ผ์ ์ ์ฅํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ํ์ต ๋ฐ์ดํฐ์ ํฌํจ๋ _lumina2comfy.py ์คํฌ๋ฆฝํธ๋ฅผ ์ฌ์ฉํ์ฌ ai-toolkit์ผ๋ก ์์ฑ๋ LoRA ์ฒดํฌํฌ์ธํธ๋ฅผ ComfyUI ํธํ ํ์์ผ๋ก ๋ณํํ์ต๋๋ค. ์ฌ์ฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
python lumina2comfy.py "path/to/my/lora.safetensors"
(์ธ์๋ก ํด๋ ๊ฒฝ๋ก๋ฅผ ์ ๋ฌํ๋ฉด, ํด๋น ํด๋ ๋ด์ ๋ชจ๋ safetensors ํ์ผ์ ์ผ๊ด ๋ณํํฉ๋๋ค.)
๋๊ตฐ๊ฐ์๊ฒ ์ ์ฉํ ์ ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค. ๐
(์ฐธ๊ณ ๋ก, diffusion-pipe๋ LoRA ๋ณํ์ ํ์๋ก ํ์ง ์์ต๋๋ค. ์ด๋ฏธ ComfyUI ํธํ ํ์์ผ๋ก ํ์ผ์ ์ถ๋ ฅํฉ๋๋ค.)
์๊ฐ
ํ์ต์ ๋ํ ์ ์ฒซ์ธ์์ ๋งค์ฐ ๊ธ์ ์ ์ ๋๋ค. ์์ ํ ๋ฏธ์ธ ์กฐ์ ์ด ์ผ๋ง๋ ์ ๋ ์ง๋ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค(ํ ์คํธํ ์๊ฐ์ด๋ ์ ์ ํ ๋ฐ์ดํฐ์ ์ด ์๊ธฐ ๋๋ฌธ์), ์บ๋ฆญํฐ๋ ๊ฐ๋ LoRA ํ์ต๋ ์๋ํด๋ณด์ง ์์์ง๋ง, ์ด ๋ชจ๋ธ์ ์๋ก์ด ์คํ์ผ์ ๊ฐ๋ฅด์น๋ ๊ฒ์ ๋งค์ฐ ์ ๋งํด ๋ณด์ ๋๋ค.
์ ๊ฐ ๊ฐ์ง Lumina 2์ ๋ํ ์ด๋ณด์ ์ธ ํ๊ฐ๋, ๋ถ๋ช ํ Flux(2B ๋ 12B)๋ณด๋ค๋ ๋จ์ด์ง์ง๋ง, ์ ๋๋ฉ์ด์ /์ผ๋ฌ์คํธ๋ ์ด์ ์ฉ์ผ๋ก ํผํผํ ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ๋ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ํด๋ถํ์ ์ค๋ฅ๊ฐ ์์ง๋ง, ์ด ํด๋์ค์ ๋ชจ๋ ๋ชจ๋ธ์ด ํด๋ถํ์ ๋ฌธ์ ์ ์๋ฌ๋ฆฌ๋ฉฐ(ํ ์คํธ ๋ ๋๋ง๋ ์คํจํฉ๋๋ค). NSFW ์ฝํ ์ธ ์ ๋ํด์๋ ํ ์คํธํ์ง ์์์ง๋ง, ํ ์คํธํ ์ฌ๋๋ค์ ๋ณ๋ก ์ข์ง ์๋ค๊ณ ๋งํฉ๋๋ค.
์ด ๋ชจ๋ธ์ ๊ฐ์ฅ ๊ฐ๋ ฅํ ์ฅ์ ์ 16์ฑ๋ VAE์ ํ๋ฅญํ ํ๋กฌํํธ ์ค์์ฑ์ ๋๋ค(์ ๊ฐ ์ง๊ธ๊น์ง ๋ณธ ์ด๋ค ๋ชจ๋ธ๋ณด๋ค๋ ๋ ๋์ผ๋ฉฐ, ๋๋ก๋ Flux์ ๊ทผ์ ํ๊ธฐ๋ ํฉ๋๋ค). ๋ํ, ๋ชจ๋ T2I ๋ชจ๋ธ ์ค์์ ๊ฐ์ฅ ์ด์์ ์ธ ๋ผ์ด์ ์ค๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค(ํ์ง๋ง ๊ทธ๋ค์ ๋ถ๋ช Schnell์ VAE๋ก ์ ํํด์ผ ํฉ๋๋ค).
์ง์ ํ ์ง๋ฌธ์, ๋ฏธ์ธ ์กฐ์ ์ผ๋ก ํด๋ถํ์ ์ค๋ฅ๋ฅผ ๊ณ ์น ์ ์์๊น ํ๋ ๊ฒ์ ๋๋ค. ์ ๋ ๊ฐ๋ฅํ๋ค๊ณ ์๊ฐํ์ง๋ง, ํ์ ํ ์๋ ์์ต๋๋ค. ํ ์คํธ ์ค ์ป์ ๋ง์ ์ด๋ฏธ์ง์๋ ๋ค์ํ ์ ์ฒด ์๊ณก์ด ํฌํจ๋์ด ์์์ง๋ง, ๊ทธ ์ค ์ผ๋ถ๋ LoRA ํ์ผ ์๋ ์์ต๋๋ค.
์ปค๋ฎค๋ํฐ์ ์ง์์ด ์๋ค๋ฉด, ์ด ๋ชจ๋ธ์ ๋ ๋ค๋ฅธ NAI-XL์ด ๋ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ ์ ํ ์ ๋๋ฉ์ด์ ๋ฏธ์ธ ์กฐ์ ์ด ์๋ค๋ฉด, ์ด ๋ชจ๋ธ์ ์ํ์ง ์ํ์ด ์์ต๋๋ค. ๋ง์น ํ์ฌ SD3.5M์ด ์ํ์ ์ฒํด ์๋ ๊ฒ์ฒ๋ผ์. ๋ํ ์ค๋๋ ๋๊ฐ Kwai Kolors๋ PixArt Sigma, Hunyuan DIT์ ๊ธฐ์ตํ ๊น์? โน๏ธ




















