1930s photography mode - FLUX
세부 정보
파일 다운로드
모델 설명
1930년대 사진 모드
제 연구의 일부이자 wooly flux 작업의 확장입니다. 반복적인 테스트를 통해 훈련에서 주요 사용 사례 몇 가지에 대해 ‘모두에게 맞는’ 솔루션에 근접하게 도달했습니다.
이번에는 TensorArt의 온라인 훈련 도구를 사용하여 학습되었습니다.
이 LoRA는 50장의 이미지를 사용하여 학습되었습니다. 그 중 30장은 제가 개발한 전용 캡션 형식으로 캡션을 부여했습니다:

1930s photography mode, glamorous lighting, satin textures, era 1930s Hollywood fashion, satin gown with flowing train, solo, glamorous eveningwear, Rating SFW, a woman in a luxurious satin gown stands with effortless poise in a vintage living room,¬ the fabric catching the light as her gown’s long train pools elegantly on the floor,¬ the warm glow of the setting amplifying the timeless glamour of her ensemble, dramatic lighting filter.
--
다음 10장의 이미지는 자연어로 다음과 같이 캡션을 부여했습니다:
깊은 밤, 비가 폭우처럼 쏟아져 내려, 단단한 땅과 주변의 금속 물체에 부딪히며 시끄럽고 리듬감 있는 소리를 낸다. 카메라는 큰 산업용 기둥이나 전봇대에 초점을 맞추고 있으며, 그 기초는 젖은 포장도로에 단단히 박혀 있다. 비는 기둥 측면을 따라 쏟아져 내려, 바닥에 고여 작은 시내를 만들어 가장 가까운 배수구 쪽으로 흘러간다. 모든 표면은 미끄럽고 반짝이며, 도로 저편의 가로등에서 흐릿하게 퍼지는 약한 빛을 반사한다.
거리는 비가 끊임없이 쏟아지는 것을 제외하고는 완전히 버려진 듯하다. 먼 곳에서 가끔 빛이 번쩍이는 것은 지나가는 자동차를 암시하지만, 사람이 보이지 않는다. 땅은 젖은 낙엽과 쓰레기로 뒤덮여 있으며, 물이 흐르는 사이 작은 소용돌이를 형성한다. 이 장면은 끊임없이 울리는 빗소리 외에는 기이할 정도로 조용하며, 고독과 우울한 분위기를 조성한다.
--
마지막 10장의 이미지는 많은 태그를 사용하여 다음과 같이 캡션을 부여했습니다:
rotary telephone, vintage phone, woman on phone, old telephone, analog phone, black and white, high contrast, soft lighting, woman, sweater, 1930s hairstyle, retro fashion, rotary dial, old technology, casual conversation, candid pose, old-style phone cord
--
저는 여전히 이 작업을 진행 중이며, 여러분이 스스로 스타일 LoRA를 만들기 시작하려면 이 조합이 좋은 기준점이 될 것 같습니다.
특히 캡션 스타일은 제 아이디어입니다:
캡션 구조와 그 역할 이해
모델은 시각적 프롬프트를 구조화된 캡션을 통해 해석하도록 학습됩니다. 이 캡션은 스타일, 캐릭터, 장면 요소를 정교하게 정의하여 모델의 출력을 안내합니다. 각 캡션 섹션은 정확하고 일관된 결과를 도출하기 위해 특정 정보를 제공합니다.
모드:
기능: 이미지를 렌더링해야 할 예술 매체 또는 스타일을 지정합니다 (예: 유화, 디지털, 3D 렌더링).
목적: 색상, 텍스처, 형태 표현 방식을 결정하여 출력의 전체적인 미감을 설정합니다.
추가 태그:
기능: 선택된 모드 내에서 사용된 기술을 설명합니다 (예: 부드러운 그라데이션, 두꺼운 윤곽선).
목적: 브러시 터치, 음영, 텍스처 적용 방식을 세밀하게 조정하여 예술적 접근법을 보완합니다.
시대:
기능: 특정 시기 또는 예술 운동을 정의합니다 (예: 1600년대 바르크, 2020년대 사이버펑크).
목적: 역사적이거나 미래지향적인 스타일을 참조하여 캐릭터 디자인, 건축, 분위기 등을 형성합니다.
패션 스타일:
기능: 피사체가 입은 의상 또는 복장을 설명합니다 (예: 스트리트웨어, 중세 갑옷).
목적: 의상에 초점을 맞추어 캐릭터의 외모와 정체성을 구성하며, 테마나 배경을 반영합니다.
피사체 수:
기능: 장면 내 인물 또는 피사체의 수를 지정합니다 (예: 싱글, 듀오).
목적: 장면의 구성을 조절하며, 단일 피사체에 집중할지 여러 캐릭터 간의 상호작용을 포함할지 결정합니다.
고유 스타일 식별자:
기능: 이미지를 독특하게 만드는 명확한 시각적 테마 또는 스타일을 식별합니다 (예: 기발한 판타지, 미래 전사).
목적: 장면에 특징적인 요소를 추가하여 모델이 명확한 분위기나 창의적 비전으로 출력하도록 안내합니다.
등급:
기능: 콘텐츠 등급을 표시합니다 (예: Rating SFW, Rating NSFW).
목적: 사용 목적에 따라 생성된 이미지가 적절한 기준을 준수하도록 보장합니다 (직장용 안전 또는 비안전).
프롬프트:
기능: 장면 자체를 세부적인 시각적 요소로 설명합니다 (예: “네온불빛이 밝은 도시에서 플라즈마 검을 들고 선 캐릭터”).
목적: 캐릭터, 물체, 그리고 장면 내 상호작용의 핵심 설명을 제공합니다.
필터:
기능: 최종 이미지에 적용할 시각적 효과를 정의합니다 (예: 부드러운 조명 필터, 세피아 톤).
목적: 색상 균형, 대비 또는 분위기 등을 변경하는 특정 시각적 처리를 통해 출력의 외관을 조정합니다.
전체 작동 방식:
캡션의 각 부분은 모델을 안내하는 고유한 역할을 합니다. 모드는 예술 스타일의 기초를 설정하고, 태그와 시대는 장면의 세부 사항을 정교하게 조정합니다. 패션 스타일과 피사체 수는 캐릭터를 형성하며, 고유 스타일 식별자는 명확하고 일관된 테마를 확보합니다. 마지막으로 프롬프트와 필터는 내러티브와 마무리 장치를 더해, 원하는 시각적 방향에 기반한 균형 잡힌 상세한 출력을 생성합니다.
이 구조화된 접근 방식은 아트 생성의 유연성과 정밀성을 보장하며, 다양한 창의적 가능성을 열어줍니다.



















