Cinematik HunyuanVideo LoRA

세부 정보

파일 다운로드

모델 설명

안녕하세요,

최근 실험 결과를 공유하고자 합니다. 목표는 Hunyuan 비디오에 더 나은 영화적 스타일을 적용할 수 있는 스타일 LoRA를 만들어보는 것이었습니다. Hunyuan은 훌륭한 비디오를 생성하지만, 우리가 즐겨왔던 거친 고전 영화 스타일을 만드는 데 여전히 어려움을 겪고 있습니다.

이 LoRA는 70년대 후반에서 90년대까지의 영화 스틸 이미지로 학습되었습니다. 그러나 인물들이 더 말을 많이 하는 경향이 있으며, 액션 중심 프롬프트에는 흐름이 부족합니다. 그러나 더 깊은 색상과 사실적인 인물을 원하신다면 이 LoRA는 충분히 효과적입니다.

이 LoRA는 인간이 아닌 존재(몬스터, 야수, 로봇 등)를 생성하는 데는 별로 좋지 않습니다. 이 경우 이를 인간으로 바꿔버립니다. 따라서 다양한 캐릭터를 원하신다면 강도를 [0.6 - 0.7]로 낮추는 것이 좋습니다.

데모 영상은 제 신뢰할 수 있지만 느린 4060TI로 제작했습니다. 최고의 생성 결과만 선택하지 않았습니다. LoRA가 가진 결점을 보여주고 싶었기 때문입니다. 짧은 설명 프롬프트를 작성하고, 영상을 생성한 후 순차적으로 배치했습니다. 또한 영상 해상도는 768x384이며, 속도를 위해 69프레임으로 실행했습니다. 제 GPU 성능이 제한적이기 때문에, 더 빠른 카드를 사용하시는 분들이 어떤 결과를 얻을지 궁금합니다.

학습 데이터셋은 약 280장의 이미지이며, 클라우드 기반 L40 GPU에서 50에포크(18,000회 이상) 학습했습니다.

트리거 단어:

cinematik

예시 프롬프트:

-- 마커스, 키가 날씬한 30세 남성, 짧은 버즈컷, 벨기에인의 얼굴 특징, 진한 군용 재킷, 녹색 카모 팬츠, 폐허가 된 세르비아 전쟁지역의 거리를 걷고 있음, cinematik, cinematic 8k high quality video

-- 로베르타, 35세 나이지리아 여성, 닌자 마스크로 머리가 가려져 있고, 체중이 있는 여성이 검은 닌자복을 입고 있음. 그녀는 그림자 속을 움직이며, 정교한 은신 능력으로 배경과 완벽히 융합됨. 배경은 창고 문이 열린 은행, cinematik, cinematic 8k high quality video

-- 요한, 20세 남성, 금발의 머리카락, 아프리카 계통이고 콩고인의 얼굴 특징, 검은 티셔츠와 파란 반바지를 입고 있음. 밤에 아프리카 마을의 목재 오두막에 불을 지르고 있으며, 불꽃이 하늘로 치솟고 있음, cinematik, cinematic 8k high quality video

-- 둘크, 사이버네틱 경찰, 타이트한 레더 트론 스타일 복장, 검은 반사형 헬멧을 착용하고 있으며, 사이버펑크 건물들을 매우 빠른 속도로 달리고 있음. 거리의 빛과 네온 사イン이 반사되고, 카메라는 그의 닫힌 헬멧 시야경 쪽으로 팬닝되고 있음, cinematik, cinematic 8k high quality video

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.