Hitoshi Ashinano π¨ Lumina-Image 2.0
μΈλΆ μ 보
νμΌ λ€μ΄λ‘λ
λͺ¨λΈ μ€λͺ
μ€λͺ
μμλλ Έ νν μλ μ¬μ μ μ΄κ³ ν₯μ μ΄λ¦° λΆμκΈ°μ μ€ν 리ν λ§μΌλ‘ μ λͺ ν μΌλ³Έ λ§νκ°μ΄λ€. κ·Έμ κ°μ₯ μ λͺ ν μνμ 1994λ λ°λ·μμΈ γμμ½νλ§ μΉ΄μ΄λ€μ ν€μ½γλ‘, ννλ‘μ΄ ν¬μ€νΈμ±μΉΌλ¦½μ€ μΈκ³λ₯Ό λ°°κ²½μΌλ‘ ν μΌμμ μΈ κ³Όνμμ€ λ§νμ΄λ©°, 2006λ κΉμ§ γ무λΌμ¬ν€ μνν°λγμ μ°μ¬λμλ€. μ΄ μ리μ¦λ 2007λ μ μΌμ κ³Όνμμ€ λ§νμμΈ μΈμ΄μΏ€μμ μμνμΌλ©°, λ νΈμ OVA μ λλ©μ΄μ μΌλ‘λ μ μλμλ€.
λ°λ· μ΄μ , μμλλ Έλ γμ€ λ§μ΄ μ ―μ¨γμ μ°½μμ μΏμ€μΌ νμ§μλ§μ 보쑰 μκ°λ‘ μΌνλ€. λ λ€λ₯Έ μ£Όλͺ©ν λ§ν μνμ γPositioNγ(1999-2001)μΌλ‘, μΌμ μ λ§λ²μ μ¬μ€μ£Όμλ₯Ό νꡬνλ λ¨νΈ λ§νλ€. κ·Έμ νκΈ° μνμΌλ‘λ 2007λ ν νΈμ λ¨νΈμΌλ‘ μμνμ¬ μ΄ν μμ ν μ리μ¦λ‘ νμ₯λ γμΉ΄λΆ λ Έ μ΄μ¬ν€γκ° μλ€.
μμλλ Έμ μνμ λνκ° κ·Ήν μ κ³ , κ°λ ₯ν μ¬μ£ΌμΈκ³΅κ³Ό λͺ°μ κ° μλ λΆμκΈ°κ° νΉμ§μ΄λ©°, μ’ μ’ νμ¨ν¨κ³Ό κ²½μ΄λ‘μμ λΆλ¬μΌμΌν¨λ€.
μ¬μ©λ²
νΈλ¦¬κ±° λ¨μ΄λ **Hitoshi Ashinano style**μ΄λ€.
λ΄κ° κ²μνλ λͺ¨λ μ΄λ―Έμ§λ ComfyUIμ© μν¬νλ‘ λ©νλ°μ΄ν°λ₯Ό ν¬ν¨νλ€. μ°Έκ³ λ‘, λλ λ€μκ³Ό κ°μ μ€μ μ μ¬μ©νλ€:
shift: 6.0
steps: 40
cfg: 4.0
sampler: gradient_estimation
scheduler: sgm_uniform
νμ΅
λλ γμμ½νλ§ μΉ΄μ΄λ€μ ν€μ½γμμ 113μ₯μ κ³ ν΄μλ μ΄λ―Έμ§λ₯Ό μ¬μ©νλ€.
μΊ‘μ
μμ±μλ JoyCaption AlphaTwoλ₯Ό "κΈ°μ μ /κΈ΄" ν둬ννΈ λͺ¨λλ‘ μ¬μ©νμΌλ©°, λͺ¨λ μΊ‘μ
μ λ€μκ³Ό κ°μ λ¬Έκ΅¬λ‘ μμνλ€: "You are an assistant designed to generate high-quality images based on user prompts.
νμ΅μ RTX 3090, Windows 11, 64 GB RAM νκ²½μμ ai-toolkitμ μ¬μ©νμ¬ μ§ννλ€. 20,000μ€ν κΉμ§ νμ΅ν κ³νμ΄μμ§λ§, μ΄λ―Έ μΆ©λΆν μ°μν 체ν¬ν¬μΈνΈκ° μ‘΄μ¬νκ³ , νκ· μμ€μ΄ κ°μλ₯Ό λ©μ·κΈ° λλ¬Έμ 10,000μ€ν μμ νμ΅μ μ€λ¨νλ€. κ·Έλ¦¬κ³ LoRAλ₯Ό μ€μ νκ²½μμ ν μ€νΈν κΈ°λ€λ¦΄ μ μμκΈ° λλ¬Έμ΄λ€ :) λ€μν ν둬ννΈλ₯Ό ν μ€νΈν κ²°κ³Ό, 9,000μ€ν 체ν¬ν¬μΈνΈλ₯Ό μ ννλ€.
νμ΅ νμ΄νΌνλΌλ―Έν°λ κΈ°λ³Έκ°μ λ°λμΌλ, λ€μμ μμΈμ΄λ€:
network.linear: 32
network.linear_alpha: 32
datasets.caption_dropout_rate: 0.1
optimizer: lion
optimizer_params.betas: [0.95, 0.99]
optimizer_params.weight_decay: 0.05
optimizer_params.lr: 2e-5
optimizer_params.noise_offset: 0.1
optimizer_params.lr_scheduler: constant




















