Flux.1 D - Creepy Stuff
세부 정보
파일 다운로드
모델 설명
아마도 지금 당분간 플럭스의 마지막 모델일 것입니다. 만약 흥미로운 무언가가 나타나지 않는 한 말이죠. 이유는 다양하지만 가장 큰 이유는 SDXL과 포니 모델에서 느꼈던 무작위성이 가장 재미있었기 때문입니다. 음악을 편안히 듣고 가사 사이사이에 무엇이 나오는지 관찰하는 것… 이런 방식은 플럭스로는 사실상 불가능합니다. 또, 이미지를 생성하는 데 필요한 리소스와 시간이 너무 많습니다. 특히 현재 상황에서는요. 몇 개의 LoRA를 추가하고 CFG 값을 높이면 RAM 사용량과 생성 시간이 폭증합니다. 플럭스로 한 장을 만드는 시간 동안 SDXL로 고해상도 보정을 적용한 10장의 배치를 이미 완성할 수 있었죠. 여전히 가끔 사용하겠지만, 주요 초점으로는 두지 않을 것입니다.
플럭스를 시작하게 된 주된 동기는 호기심과 벽에 머리를 부딪히는 것이었습니다. 플럭스에는 많은 장점이 있지만, 좀 더 들여다보니 제가 원하는 방식으로 동작하거나 기대하는 결과를 내주는 것에 대해서는 제가 이길 수 없는 싸움이라는 것을 깨달았습니다. 유연하지 못하고, LoRA나 랜덤 시드를 사용해도 특정 이미지나 스타일로 기본값이 고정되며, 개념이 누출됩니다(어떤 경우엔 나쁜 게 아닐 수도 있죠). 일부 플러그인이 작동하지 않습니다(지원되지 않거나 Forge의 Gradio 버전 문제), 카메라 각도에 대한 지식이 제한적이고, 심지어 현실적인 이미지라도 일종의 만화 같은 가짜 느낌이 드는 경우가 많습니다. 노이즈, 그레인, 안개 등이 제한적이며, 기타 여러 가지 문제점들이 있습니다.
그러나 플럭스가 뛰어난 점은 스타일에 매우 좋고, 깨끗한 이미지를 생성하며, 나쁜 학습 이미지도 유용한 결과로 바꿔줍니다. 대체로 해부학적 구조가 정확하고, 색상과 대비, 일관성, 텍스트 인코더 등이 우수합니다.
이 모델은 기본 플럭스 모델이 아닌 다음 모델로 학습되었습니다. /model/843551/fluxdev-dedistilled?modelVersionId=943787. 이 모델이 뭔가 다르게 작동할까요? 잘 모르겠습니다. 두 버전 모두로 동일한 LoRA를 학습시켜 비교해보고 싶었지만, 결국 그만두었습니다. 하지만 말하자면, 이 LoRA를 사이트 내 생성기와 함께 사용하려는 사람들에게는 조심해달라고 권하고 싶습니다. 작동하지 않을 가능성이 높은 것에 버즈를 소비하고 싶지 않다면요.
현재 이와 유사한 LoRA들이 꽤 많습니다(특히 할로윈 관련). 이들 중 일부는 더 나은 결과를 내는 것 같기도 합니다. 비록 제가 올린 모든 이미지가 거의 비슷해 보이지만, 실제로는 다양한 스타일과 테마를 사용했고, 그 중 일부는 공포와 전혀 관련이 없었습니다. 단지 현재 할로윈 콘텐츠를 중심으로 몇 가지 이론이나 직관을 시험해보기 위해 사용했을 뿐입니다.
행운을 빕니다.
부록: 제 갤러리의 일부 이전 이미지는 거의 동일한 LoRA를 사용했지만, Kohya의 설정과 스텝 수가 달랐습니다.















