Studio Ghibli πŸŽ₯ HunyuanVideo

μ„ΈλΆ€ 정보

파일 λ‹€μš΄λ‘œλ“œ

λͺ¨λΈ μ„€λͺ…

면책사항

기본적인 HunyuanVideoλŠ” LoRA 없이도 일반적인 μ• λ‹ˆλ©”μ΄μ…˜ μŠ€νƒ€μΌμ„ 잘 μ΄ν•΄ν•˜λ©°, μŠ€νƒ€λ””μ˜€ μ§€λΈŒλ¦¬μ˜ 예술 μŠ€νƒ€μΌμ— λŒ€ν•΄ 일뢀 지식을 κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ 이 μŠ€νƒ€μΌμ€ μΌκ΄€λ˜μ§€ μ•ŠμœΌλ©°, ν”„λ‘¬ν”„νŠΈμ— 맀우 의쑴적이며 가끔 ν˜„μ‹€μ μΈ μŠ€νƒ€μΌλ‘œ λ˜λŒμ•„κ°€λŠ” κ²½μš°κ°€ μžˆμŠ΅λ‹ˆλ‹€. 그리고 셰이딩, νŒ”λ ˆνŠΈ, μ„  μž‘μ—…λ„ μƒλ‹Ήνžˆ λ‹€λ₯Ό 수 μžˆμŠ΅λ‹ˆλ‹€. κ·Έλž˜μ„œ 이 LoRAλ₯Ό λ§Œλ“€λ©°, HunyuanVideo에 μ§€λΈŒλ¦¬ 예술 μŠ€νƒ€μΌμ„ 더 κ°•ν™”ν•˜λ €κ³  μ‹œλ„ν–ˆμŠ΅λ‹ˆλ‹€.

이 LoRAλŠ” μ„Έ 번째 λ²„μ „μž…λ‹ˆλ‹€. 이전 두 버전은 μ„±κ³΅ν•˜μ§€ λͺ»ν–ˆκ³ , μ €λŠ” 이λ₯Ό κ³΅κ°œν•˜μ§€ μ•Šμ•˜μŠ΅λ‹ˆλ‹€.

μ—…λ°μ΄νŠΈ. 2025λ…„ 8μ›” 1일 λΆˆν–‰νžˆλ„, 이전 λͺ¨λΈμ„ μž‘μ—…ν•  μ—¬μœ  μ‹œκ°„μ΄ μ—†μ–΄ 이 λͺ¨λΈμ˜ μž¬ν•™μŠ΅μ€ 더 이상 κ³„νšλ˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

μ—…λ°μ΄νŠΈ. 2025λ…„ 3μ›” 14일 Wan2.1-14B-T2V을 일주일 λ™μ•ˆ ν…ŒμŠ€νŠΈν•œ κ²°κ³Ό, 이 λͺ¨λΈμ΄ HV보닀 μš°μˆ˜ν•¨μ„ 인정해야 ν•©λ‹ˆλ‹€. λ”°λΌμ„œ μ €λŠ” Wan ν•™μŠ΅μœΌλ‘œ μ „ν™˜ν•˜κΈ°λ‘œ κ²°μ •ν–ˆκ³ , 더 이상 HV λͺ¨λΈμ„ μΆœμ‹œν•  κ³„νšμ΄ μ—†μŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ μ €λŠ” 아직도 이 LoRAλ₯Ό μ™„μ„±ν•  의무λ₯Ό 느껴, ν–₯ν›„ λ‹€λ₯Έ κ³„νšλœ Flux/Wan λͺ¨λΈμ„ 마친 ν›„, λ‹¨μˆœ 이미지가 μ•„λ‹Œ μ˜μƒμœΌλ‘œ 적절히 ν•™μŠ΅λœ Ghibli LoRA μ—…λ°μ΄νŠΈλ₯Ό μΆœμ‹œν•˜κΈ° μœ„ν•΄ μ΅œμ„ μ„ λ‹€ν•˜κ² μŠ΅λ‹ˆλ‹€.

μ—…λ°μ΄νŠΈ. 2025λ…„ 3μ›” 2일 Lumina-2와 Wan-2.1에 λͺ°μž…ν•˜λ‹€κ°€ λ‹€μ‹œ Flux ν•™μŠ΅μœΌλ‘œ λŒμ•„μ™”κ³ , v0.7은 μ•½κ°„ 연기될 μ˜ˆμ •μž…λ‹ˆλ‹€. ν•˜μ§€λ§Œ ν™•μ‹€νžˆ μΆœμ‹œν•  μ˜ˆμ •μ΄λ©°(μ•„λ§ˆλ„ 또 λ‹€λ₯Έ μ• λ‹ˆλ©”μ΄μ…˜ LoRA와 ν•¨κ»˜)μž…λ‹ˆλ‹€.

μ—…λ°μ΄νŠΈ. 2025λ…„ 2μ›” 8일 v0.6 λŠ” μ‹€λ§μ΄μ—ˆμŠ΅λ‹ˆλ‹€. μ €λŠ” λͺ‡ κ°€μ§€ μœ„ν—˜ν•œ 결정을 λ‚΄λ ΈλŠ”λ°, 이 결정듀은 κ·Έ κ²°κ³Όλ₯Ό μ •λ‹Ήν™”ν•˜μ§€ λͺ»ν–ˆκ³ , RTX 3090μ—μ„œ 84μ‹œκ°„μ˜ ν•™μŠ΅ μ‹œκ°„μ— κ°’ν•˜μ§€ μ•Šμ•˜μŠ΅λ‹ˆλ‹€. v0.7을 κΈ°λŒ€ν•΄ μ£Όμ„Έμš”! πŸ™‚

μ—…λ°μ΄νŠΈ. 2025λ…„ 1μ›” 5일 musubi-tuner둜 v.0.4 ν•™μŠ΅μ„ μ™„λ£Œν–ˆμ§€λ§Œ, v0.3보닀 μ„±λŠ₯이 더 λ‚˜λΉ΄κΈ° λ•Œλ¬Έμ— κ³΅κ°œν•˜μ§€ μ•Šκ² μŠ΅λ‹ˆλ‹€( v0.5μ—λŠ” diffusion-pipeλ₯Ό μ‚¬μš©ν•©λ‹ˆλ‹€).

μ—…λ°μ΄νŠΈ. 2025λ…„ 1μ›” 21일 v0.5 ν•™μŠ΅ 쀑에 λ„ˆλ¬΄ λ§Žμ€ μ‹€μˆ˜λ₯Ό μ €μ§ˆλ €κ³ , λ”°λΌμ„œ 이 버전을 νκΈ°ν•˜κ³  ν–₯μƒλœ 데이터셋과 ν•™μŠ΅ νŒŒλΌλ―Έν„°λ‘œ μ²˜μŒλΆ€ν„° λ‹€μ‹œ μ‹œμž‘ν•˜κΈ°λ‘œ κ²°μ •ν–ˆμŠ΅λ‹ˆλ‹€(또 ν•œ 번 musubiλ₯Ό μ‹œλ„ν•΄ λ³΄κ² μŠ΅λ‹ˆλ‹€). 32μ‹œκ°„μ΄ λ‚­λΉ„λ˜μ—ˆμ§€λ§Œ, μ΄λŠ” 쒋은 κ²°κ³Όλ₯Ό μœ„ν•œ νˆ¬μžμž…λ‹ˆλ‹€ :)

μ‚¬μš©λ²•

μΆ”λ‘  μ‹œ μ €λŠ” κΈ°λ³Έ ComfyUI νŒŒμ΄ν”„λΌμΈμ— λ‹¨μˆœνžˆ μΆ”κ°€ LoRA λ‘œλ” λ…Έλ“œλ§Œ μ‚¬μš©ν•©λ‹ˆλ‹€. Kijai의 λž˜νΌλ„ μž‘λ™ν•  κ²ƒμž…λ‹ˆλ‹€(적어도 일주일 μ „μ—λŠ” μž‘λ™ν–ˆμ§€λ§Œ, κ·Έ μ΄ν›„λ‘œλŠ” λ„€μ΄ν‹°λΈŒ μ›Œν¬ν”Œλ‘œλ‘œ μ „ν™˜ν–ˆμŠ΅λ‹ˆλ‹€). νŒŒλΌλ―Έν„°λŠ” 기본값이며, λ‹€μŒλ§Œ λ‹€λ¦…λ‹ˆλ‹€:

guidance: 7.0
steps: 30

이 값듀이 μ΅œμ μ€ μ•„λ‹™λ‹ˆλ‹€. 단지 μ €λŠ” 주둜 이 κ°’λ“€λ‘œ 클립을 μƒμ„±ν–ˆμ„ 뿐이며, λ‹€λ₯Έ 쑰합이 더 λ‚˜μ€ κ²°κ³Όλ₯Ό λ‚Ό μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€.

ν˜„μž¬ μ‚¬μš©ν•˜λŠ” ν”„λ‘¬ν”„νŠΈ ν…œν”Œλ¦Ώμ€ λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

A scene from a Studio Ghibli animated film, featuring [CHARACTER DESCRIPTION], as they [ACTION] at [ENVIRONMENT], under [LIGHTING], with [ADDITIONAL SETTING DETAILS], while the camera [CAMERA WORK], emphasizing [MOOD AND AMBIANCE].

μ €λŠ” 일반적으둜 β€œblonde woman, barefeet, ocean seashore, fine weather” λ“±μ˜ νƒœκ·Έλ₯Ό LLM에 μž…λ ₯ν•˜κ³ , 이 ν…œν”Œλ¦Ώμ— 따라 μžμ—°μŠ€λŸ¬μš΄ μ–Έμ–΄λ‘œ μΌκ΄€λœ ν”„λ‘¬ν”„νŠΈλ₯Ό 생성해 달라고 μš”μ²­ν•©λ‹ˆλ‹€.

ν•™μŠ΅

μ €μ˜ ν•™μŠ΅ 방식이 μ΅œμ μ€ μ•„λ‹ˆλΌλŠ” 점을 λͺ…심해 μ£Όμ„Έμš”. μ €λŠ” 단지 ν…ŒμŠ€νŠΈμ™€ μ‹€ν—˜μ„ ν•˜κ³  μžˆμ„ 뿐이며, 이 LoRAκ°€ 효과λ₯Ό λ°œνœ˜ν•œ μ΄μœ κ°€ 쒋은 방법 λ•Œλ¬Έμ΄ μ•„λ‹ˆλΌ, 였히렀 λ‚˜μœ λ°©λ²•μž„μ—λ„ λΆˆκ΅¬ν•˜κ³  μž‘λ™ν–ˆμ„ κ°€λŠ₯성이 μžˆμŠ΅λ‹ˆλ‹€.

ν˜„μž¬ λ²„μ „μ˜ LoRAλŠ” λ‹€μ–‘ν•œ μ§€λΈŒλ¦¬ μ˜ν™”μ˜ 슀크린캑 185개(512x512)둜 ν•™μŠ΅λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 이 이미지듀은 CogVLM2λ₯Ό μ‚¬μš©ν•΄ μΊ‘μ…˜ν™”λ˜μ—ˆμŠ΅λ‹ˆλ‹€. μΊ‘μ…˜ 생성 ν”„λ‘¬ν”„νŠΈλŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

Create a very detailed description of this image as if it was a frame from Studio Ghibli movie. The description should necessarily 1) describe the main content of the scene, detail the scene's content, which notably includes scene transitions and camera movements that are integrated with the visual content, such as camera follows some subject 2) describe the environment in which the subject is situated 3) identify the type of video shot that highlights or emphasizes specific visual content, such as aerial shot, close-up shot, medium shot, or long shot 4) include description of the atmosphere of the video, such as cozy, tense, or mysterious. Do not use numbered lists or line breaks. IMPORTANT: output description MUST ALWAYS start with unaltered phrase 'A scene from Studio Ghibli animated film, featuring...', and then insert your detailed description.

ν•™μŠ΅μ—λŠ” diffusion-pipe.λ₯Ό μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€. λ‹€λ₯Έ κ°€λŠ₯ν•œ μ„ νƒμ§€λŠ” finetrainers (ν˜„μž¬ HV ν•™μŠ΅μ—λŠ” >24GB VRAM ν•„μš”), musubi-tuner (아직 쒋은 κ²°κ³Όλ₯Ό μ–»μ§€ λͺ»ν–ˆμ§€λ§Œ, μ†Œν”„νŠΈμ›¨μ–΄ 탓은 μ•„λ‹˜), 그리고 OneTrainer (아직 μ‹œλ„ν•˜μ§€ μ•ŠμŒ)μž…λ‹ˆλ‹€.

ν•™μŠ΅μ€ Windows 11 Home (WSL2), 64GB RAM, RTX 3090 단일 GPUμ—μ„œ μ§„ν–‰λ˜μ—ˆμŠ΅λ‹ˆλ‹€. ν•™μŠ΅ νŒŒλΌλ―Έν„°λŠ” κΈ°λ³Έκ°’(main, dataset)이며, λ‹€μŒλ§Œ λ³€κ²½λ˜μ—ˆμŠ΅λ‹ˆλ‹€:

rank = 16
lr = 6e-5

각 μ—ν¬ν¬λ§ˆλ‹€ μ €μž₯ν–ˆκ³ , 총 20 에포크λ₯Ό μ§„ν–‰ν–ˆμœΌλ©°, 각 μ—ν¬ν¬λŠ” 462 μŠ€ν…μœΌλ‘œ κ΅¬μ„±λ˜μ–΄ 총 9240 μŠ€ν…μ΄μ—ˆμŠ΅λ‹ˆλ‹€. RTX 3090μ—μ„œμ˜ μ†λ„λŠ” μ•½ 7초/μŠ€ν…μ΄μ—ˆκ³ , 각 μ—ν¬ν¬λŠ” μ•½ 1μ‹œκ°„ 미만이 μ†Œμš”λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 13λ²ˆμ§Έμ—μ„œ 20번째 에포크λ₯Ό ν…ŒμŠ€νŠΈν•œ κ²°κ³Ό, 19번째 에포크가 κ°€μž₯ 일관성이 λ†’κ³  μ—λŸ¬κ°€ κ°€μž₯ 적어 μ„ νƒν–ˆμŠ΅λ‹ˆλ‹€.

κ²°κ³ΌλŠ” μ—¬μ „νžˆ μ™„λ²½ν•˜μ§€ μ•Šμ§€λ§Œ, ν–₯μƒλœ 버전을 μ œκ³΅ν•˜κ³ μž ν•©λ‹ˆλ‹€. λ‹€μŒ 버전은 이미지가 μ•„λ‹Œ 클립으둜 ν•™μŠ΅λ  μ˜ˆμ •μ΄μ§€λ§Œ, 데이터셋 쀀비에 μ‹œκ°„μ΄ ν•„μš”ν•©λ‹ˆλ‹€.

λ˜ν•œ ν–₯ν›„ μΆœμ‹œλ  I2V λͺ¨λΈμ΄ μŠ€νƒ€μΌ LoRAλ₯Ό λ¬΄μ˜λ―Έν•˜κ²Œ λ§Œλ“€ κ°€λŠ₯성도 μžˆμŠ΅λ‹ˆλ‹€.

P.S.

μ΄λŸ¬ν•œ λ›°μ–΄λ‚œ 둜컬 λΉ„λ””μ˜€ λͺ¨λΈμ΄ λ‚˜μ™”λ‹€λŠ” 사싀에 μ—¬μ „νžˆ 놀라움을 금치 λͺ»ν•©λ‹ˆλ‹€. 이제 둜컬 λΉ„λ””μ˜€ 생성 뢄야에 μ§„μ •ν•œ Stable Diffusion의 μˆœκ°„μ΄ λ„λž˜ν–ˆλ‹€κ³  λŠλ‚λ‹ˆλ‹€. λ―Έλž˜μ— 더 λ›°μ–΄λ‚œ λͺ¨λΈμ΄ λ“±μž₯ν•  κ²ƒμž„μ€ λΆ„λͺ…ν•˜μ§€λ§Œ, HunyuanVideoλŠ” μ €μ—κ²ŒλŠ” λΆ„λͺ…νžˆ 처음이자 μœ μΌν•œ λͺ¨λΈμΌ κ²ƒμž…λ‹ˆλ‹€ ❀️

이 λͺ¨λΈλ‘œ λ§Œλ“  이미지

이미지λ₯Ό 찾을 수 μ—†μŠ΅λ‹ˆλ‹€.