Flux.1 D - Soothing Atmosphere

세부 정보

모델 설명

V.2.0

이미지 수와 스텝 수를 추가했습니다.

강도를 낮게 설정하는 것이 권장되며, 그 이유가 무엇이든 간에 모든 것이 끈적한 괴물이 될 수 있습니다.

이 디스틸된 버전이 제어하기 너무 어렵고 유연성이 제한적이기 때문에, Flux의 프로 버전을 출시해줬으면 정말 좋겠습니다. 몇 가지 프롬프트를 시도해보면 항상 특정 이미지나, 모델이 잘 알고 있고 학습된 내용으로만 결과가 도출되어 Flux의 전형적인 '무생명적' 외관(영화적, 사진적, 특정 동물이나 인물 등)이 나타납니다.

또한, 현재 존재하는 모든 완전 체크포인트들이 실제로 작동할 것이라고는 전혀 믿지 않습니다. 거의 모든 체크포인트를 테스트해보았지만, 항상 비정상적인 해부학적 구조나 극단적인 편향이 나타나는데, 이는 부정적 프롬프트나 프롬프트 가중치로도 해결할 수 없습니다. Flux는 이런 요소들을 사용하지 않기 때문입니다. 예를 들어, 옷을 입은 사람을 요청해도 항상 벌거벗은 상태의 인물 이미지가 생성됩니다. SDXL에서도 이런 방식이 실제로 작동했는지 의심스럽습니다. 저는 부정적 프롬프트를 거의 사용하지 않았지만, 원치 않는 요소들을 어느 정도 제거하는 데는 충분히 효과적이었습니다.

흥미롭게도, 스타일(예: 애니메이션)로 학습되거나 LoRA로 변형된 모든 체크포인트는 사실적인 이미지 생성에도 훌륭하게 작동합니다. 저는 거의 모든 이미지에 이 방식을 사용합니다(여기서는 시연을 위한 기본 FP8 체크포인트만 사용했습니다)... 정말 혼란스럽습니다.


이 체크포인트는 SDXL용으로 계획했던 데이터셋을 기반으로 학습되었습니다. 그러나 저는 만족할 만한 결과를 얻지 못했습니다. 현재는 몇 장의 이미지(기본 캡션만)로 이루어진 간단한 테스트이며, 학습 스텝은 단 800단계입니다. 나중에는 자연어로 변경할 예정입니다.

가장 자주 사용된 단어는 atmospheric, moody, calm, soothing, serene, mysterious... 그리고 assorted입니다(캡션 없는 이미지들... 사실 이건 캡션입니다. Kohya가 .txt 파일이 없으면 폴더 이름을 캡션으로 자동 사용한다는 걸 잊었습니다 :D)

  • 순서: 처음 두 이미지는 LoRA 적용/미적용, 그 이후에는 순서를 반전

  • 현재로서는 특정 경우에 더 큰/작은 영향을 미침

Flux LoRA를 여러 번 테스트해 보았고, 정말 기묘한 결과를 얻었습니다. 심지어 100~200스텝만으로도 개념을 학습했고, 기본 강도(1)를 낮추거나 높이는 것만으로도 큰 차이를 보였습니다. 하지만 항상 일부 요소가 남아있고, 학습된 이미지의 특정 부분만을 선택해서 사용하는 것처럼 느껴집니다(예: 노란 옷만 원하고 그 외의 모든 것은 원하지 않는 경우처럼요).

지금까지 약 30개의 LoRA를 만들었습니다(모두 테스트용). 몇 장의 이미지로도 이렇게 놀라운 결과를 낼 수 있다는 것이 정말 경이롭습니다.

아마도 우연일지도 모릅니다. 누가 알겠습니까?

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.