Pyro's NSFW Proof of Concept for FLUX
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
경고: 이 세 가지 모델은 절반도 제대로 작동하지 않는 개념 증명입니다. 마케팅용 허튼소리처럼 "Exclusive Closed Alpha Test"라고 붙여 놓은 프리릴리즈가 아니라, 진짜 개념 증명을 목적으로 합니다. 솔직히 콜 오브 듀티가 매번 그런 걸 할 때마다, 아마 그것도 알파버전이고, 그들은 단순히 당신을 두 번 거꾸로 속이고 있는 겁니다.
이것의 목적은 최종 모델에 이르기까지의 제 진도를 기록하고, Flux의 능력을 평가하여 언젠가 손주들에게 이렇게 말할 수 있도록 하는 것입니다. “이 모델을 봐, 나는 여기서 페니스 모양 주변의 편향을 제거하려고 했어. 내가 얼마나 농담쟁이였는지 보여주지.” 그리고 우리는 모두 웃으며 즐거운 시간을 보낼 거예요. 그걸 당신이 빼앗지 마세요.
또한, 이걸 업로드하는 이유는 Civitai의 돈을 빼앗으려는 쓰레기 모델들로 당신이 속지 않도록 하기 위함입니다.
여기서는 돈을 내지 않고도 쓰레기를 얻을 수 있습니다.
이 특정 모델의 학습은 중단되었습니다. Flux에 대해 너무 많은 것을 배웠기 때문에, 이 모델이 기반으로 삼고 있는 거의 모든 것이 무효화되었기 때문입니다. 또한 모델이 브릭되었습니다. 사라졌습니다. 제 “ฮัล크 ฮ็อกัน을 피카츄로” 만든 LoRA 옆에 모델 천국 어딘가에 있어요.
그래서 완벽함을 기대한다면 몇 주만 기다리세요. 혼란을 원한다면 계속 읽으세요. 시도해보고 기대한 대로 작동하지 않으면, 잠시 숨을 깊이 들이쉬고 위에 쓴 모든 내용을 상기하세요. 곧™ 완전한 릴리즈라는 구원이 올 것임을 알아두세요. 그러니 지금 당장 티슈와 양말을 버리지 마세요.
안전벨트를 매세요. 긴 텍스트가 앞으로 이어집니다.
그냥 입을 다물고 있지 못하나?
처음엔 이 모델들을 공개할 계획이 없었습니다. 왜냐하면 솔직히 미완성だから입니다. 이건 단지 FLUX의 내부 작동을 배우기 위한 테스트 결과일 뿐이며, “너는 페니스를 다시 학습시키려면 수백만 시간이 필요해”라거나, 더 어리석게도 “너 바보냐? FLUX는 학습 못 해!”라고 말하는 멍청이들을 닫아주기 위한 것이었습니다.
스포일러: 그 멍청이들은 틀렸고, 그들을 증명하는 건 제게 상위 3위의 기분입니다.
FLUX는 당신이 무엇을 하는지 알고 있다면, 미세 조정자들의 꿈입니다. SDXL보다 훨씬 더 유연하며, 누구나 마음대로 악용할 수 있는 의미적 이해를 가지고 있습니다(이건 이상하게 간과되지만, 어쨌든 이 모델은 여전히 태어나서 얼마 안 되었어요).
하지만 여기 핵심입니다 – 몇 가지 트릭을 알아야 합니다. 그렇지 않으면 당신의 모델도 이 개념 증명 모델들과 같은 쓰레기 더미에 처하게 될 겁니다. 실수들이 있었고, 개념들이 놓쳤으며, 지금 이 모델들은 /usr/pyro/failures-of-the-past에 먼지 쌓이고 있어요.
그럼에도 왜 업로드했나요?
제 디스코드 커뮤니티가 거의 간청하며 이 모델들을 공개해 달라고 했습니다. 심지어 저를 숭배하는 종교를 만들겠다고 농담하기도 했죠. 그건 웃겼지만, 제 마음을 바꾸지 못했습니다. 그러나 그들은 이후 Civitai의 현재 상태를 설명하기 시작했습니다. 제가 이 사이트에 오는 건 단지 쓰레기를 업로드하기 위함이고, 제 웹사이트가 완성될 때까지 제가 떠드는 장소가 필요했기 때문입니다.
Civitai가 Civitai 달러를 발표했을 때, 저는 “오오오... 좀 그렇네...”라고 생각했습니다. 결과적으로, 전혀 도움이 되지 않았습니다. 지금은 첫 번째 이미지를 보고도 데이터셋이나 학습에 10가지의 오류를 눈치챌 수 있는 모델들을 보게 되고, 그들은 90만 Civitai 셰켈을 요구합니다. 혹은 빨간 속옷 LoRA에 1만 4천 Civitai 리라를 달라고 하죠.
이건 무슨 암종 같은 쓰레기입니까? 모델 제작자들이 학습 비용을 회수하기 위해 기부를 받는 건 저는 전적으로 찬성합니다. 하지만 5천 장의 포르노 이미지를 긁어 모으고, WD14 태거로 터치한 뒤 “끝!”이라고 말하는 건, 90만 Civitai 마크나 하는 복잡한 조기 접근 방식과 맞먹지 않습니다.
Civitai가 존재하지 않았던 SD1.3 시절을 기억합니다. 우리는 거대한 디스코드 가족이었고, 모두 서로를 도왔죠. 사람들은 수백 페이지짜리 Rentry에 자신이 발견한 모든 것을 써서, 다른 누군가의 수백 페이지짜리 Rentry로 연결된 링크를 달았습니다. 두 번의 클릭만으로 모든 모델과 모든 정보에 접근할 수 있다는 느낌이 있었죠. 초기 SDXL도 마찬가지였습니다. 돈에 신경 쓰는 사람이 없었기 때문에 잘 작동했죠. 우리 모두 완벽한 와이프를 만들고 싶었을 뿐이었습니다.
하지만 지금은 모델에 실제 물질적 가치를 투자할 수 있는 기회가 생기면서, 모든 것이 분열되었습니다. 이미 커뮤니티가 분리되고, “내 모델 > 너의 모델”이라는 태도가 생겼죠. 제가 5 Civitai 디나르를 걸고 말하는데, AuraFlux Pony가 출시되면 모든 게 Pony vs. Flux에 관한 이야기로 뒤바뀔 거예요.
그게 저를 화나게 하고 슬프게 합니다.
저는 이 추세에 반발하기 위해 제 역할을 하고 싶습니다. 모델이 가져야 할 기본 기준을 세워, 사람들이 더 나은 무료 콘텐츠와 경쟁할 수 없기 때문에 노력을 덜한 쓰레기를 돈벌이로 전락시키는 걸 막고 싶습니다. 그리고 제 모델이 아직 완료되지 않았더라도, 기대할 수 있는 것을 탐색하기엔 충분히 좋을 거예요. 그러니 꼭 Civitai 페소를 아껴두세요. 대신 FLUX LoRA 실험에 써보세요.
그리고 제가 당신에게 하나 약속할게요: 당신은 Mr. Early-Access가 들어보지도 못한 기술과 과학을 이용해, 제가 만들 수 있는 최고의 NSFW 모델을 무료로 얻게 될 겁니다. 그 기술의 대부분은 제가 직접 작성했고(완료되면 누구나가 사용할 수 있게 오픈 소스로 공개할 거예요!) 말이죠!
또한, 아주 작은 가능성이라도 이 글을 읽고 있는 아랍의 시크가 H100이나 뭔가를 기부하고 싶다면... 저는 거절하지 않겠습니다!
종교에 가입하고 싶다면, 여기로: https://discord.gg/r2tJpTv4
무엇을 얻을 수 있나?
그럼 무엇을 기대할 수 있나요?
- “동일한 얼굴 여자” 증후군 없음 - 데이터셋의 심층적인 얼굴 분석을 통해 '생성' 버튼을 누를 때마다 상자를 열듯 기대하지 못할 놀라운 결과가 나오게 됩니다.
- 피부의 “Flux” 광택 제거
- 원하는 것을 일반적인 영어 단어나 문장으로 설명할 수 있음 - 당신의 짧은 닉네임으로 시작하는 20가지 마법의 단어들을 외우지 않아도 되며, 태그, 자연어, 또는 둘 다 동시에 사용할 수 있습니다.
- 텔레포트 젖가슴 없음 - 다른 모델들에서 볼 수 있는 젖가슴이 브라를 뚫고 나오는 현상입니다. 저는 해결책을 찾았지만, 그 후 모델이 화염에 휩싸이면서 사라졌습니다. 그래서 지금도 가끔 일어나지만, 핵심 릴리즈에서는 100% 고쳐질 예정입니다.

- 제 다른 LoRA들과 완벽한 호환성 및 제가 가치 있다고 생각하는 LoRA(아마도 대부분의 다른 LoRA들도 포함)와의 호환성
- 제 SDXL 모델에 대한 주요 비판점들을 일부 수정
- 매우 주관적이긴 하지만, 제 의견으로는 이 모델이 제가 지금까지 본 가장 아름다운 여자들을 만들어냅니다(특히 다른 ‘모듈’들과 결합할 때). 그리고 무한히 많은 여자들 말이죠. 저는 이 문제에 대한 저의 의견이 유일하게 중요하다는 점에 운이 좋습니다.
- 그리고 마지막으로, 저의 미래 모델 메이커로서의 일반적인 계획, 이 특정 모델의 최종 목표, 그리고 솔루션 아키텍트로서의 목표 – Stable Diffusion 세계의 소프트웨어 환경은 재앙입니다.
동일한 얼굴 증후군과 다른 문제 해결
여기서 발견할 수 있는 거대한 모델들조차도 이 문제를 겪고 있습니다. “동일한 얼굴 증후군”, “1소녀염”, 혹은 단순히 “lol”이라고 불리죠.
제게 이건 모델이 가질 수 있는 최악의 결함입니다. 저는 모델의 “세계”를 탐험하고, 그 생성 결과에 놀라기를 좋아합니다. RNG 신들이 당신을 축복할 때, 가장 아름다운 인간이 갑자기 나타나면, POE에서 거울을 찾은 것처럼 “오오오오오오오”라고 외치게 됩니다.
하지만 이미 그 여자가 어떤 모습일지 알고 있다면, 놀라울 수 없죠. 지루하고 모든 재미를 죽입니다. 저는 SDXL 모델에서 이 문제 해결에 착수했고, 제 솔루션이 꽤 튼튼하다고 생각합니다. 그러나 여러분 스스로 판단해 보세요.
그러면 왜 이런 일이 발생할까요? 기본적으로 데이터셋의 편향 때문입니다. 특정 얼굴이나 특징이 다른 것보다 자주 나타나면, 그 얼굴의 특징이 기본값이 됩니다. 또 다른 이유는 모델을 과도하게 병합하는 것입니다. 이는 얼굴의 개념을 죽을 때까지 평균화해, 그 평균에서 유일하게 모델이 알게 되는 존재가 탄생하게 됩니다.
저가 이제 말할 내용을 미리 사과드립니다. 한번 보면 절대 잊을 수 없습니다. 예, FLUX.dev도 이미 동일한 얼굴 증후군을 겪고 있습니다.
Flux의 여자들은 거의 모두 같은 입술을 가지고 있으며, 특히 상순이 그럴 뿐 아니라, 거의 중두두형 머리만 생성되는 것처럼 보입니다.
어떻게 대처할 수 있을까요?
SD1.5 시절 초반에는 손으로 이미지를 하나하나 삭제하고 추가하면서, 편향이 없다는 느낌이 들 때까지 반복했습니다.
오늘날에는 자동 특징 추출, 클러스터링 분석을 수행하는 여러 모델들이 존재합니다. 그래서 제가 데이터셋에서 어떤 얼굴의 어떤 특징이 특히 강력한지 파악할 수 있습니다.
5만 쌍의 눈이 당신을 바라봅니다! 그리고 코가 돼지 코처럼 보이네요... 뭐야?

하지만 이 모든 것이 완벽하게 균형 잡혀 있죠. 모든 것이 그렇듯이.
기본적으로 편향을 유발할 수 있는 모든 특징을 추출하고, 클러스터링하며, 분석해 학습을 시작하기 전에 무엇을 기대할지 파악할 수 있게 됩니다.
제가 하고 있는 일을 팁으로 알려드리자면: 이건 모든 미세 조정자들이 갖춰야 할 도구집에 있어야 할 내용입니다. 그러나 슬프게도, 아직 제대로 된 미세 조정자 도구집은 존재하지 않습니다.
예시: (명시되지 않은 한 여기의 모든 예시는 선별되지 않았으며, 모두 동일한 프롬프트를 사용했습니다.)
여성의 상반신 초상
Pyro의 하단과 상단 행의 Flux는 강한 동일한 여자 얼굴 증후군을 보이고 있습니다. 저도 로저 디킨스를 좋아하지만, 모든 이미지가 그의 차가운 녹색 계열의 색감을 가져야 할 이유는 없습니다.
여기 다른 임의의 얼굴들입니다.

그 밖에 무엇이 있나요?
(프롬프트: 게이밍 의자에 앉은 여성)
자, 이것은 여러분이 직접 찾아보세요. 각각의 개념 증명은 다른 것을 실험해보기 위한 것이었고, 미세 조정 경험자라면 어떤 실험인지 즉시 알아챌 겁니다.
아, 당신은 섹시한 기능이 어떤 것인지 궁금한 거군요? 과학은 신경 쓰지 않겠다고요? 이해합니다.
솔직히, 어떤 데이터가 어떤 버전에 들어갔는지 정확히 확인할 만한 여유가 없습니다. 하지만 요점을 설명하자면: 총알을 먹는 행위는 거의 모든 버전에서 가장 잘 작동합니다. 나머지는 아마도 잘 안 될 거예요. 왜냐하면 총알을 먹는 행위가 모든 잠재 공간을 다 가져갔기 때문입니다.
옴놈놈, 다른 모든 개념을 다 먹어치움
최상의 결과를 얻으려면 0.7-0.95의 강도를 사용하는 것을 권장합니다.
그리고 꼭 제 다른 LoRA들과 함께 사용하세요.
제 SDXL 모델에 대한 주요 비판 중 하나는, 모든 여자들이 ‘e-소녀’처럼 보인다는 것이었죠. 유튜브나 Patreon, OnlyFans에서 찾을 수 있는 화장 기사 광고 같은 인물 말입니다. 그리고 공정하게 말하자면, 그들은 맞았습니다. 왜냐하면 그게 제가 정말 멋지다고 생각하기 때문이죠. 제가 일반적인 여자들을 보고 싶다면 제 파트너가 있기 때문입니다. 이 모델은 현실 도피를 위한 것이에요.
하지만 이해합니다. 저는 몇 가지 분석을 진행했고, 가장 큰 편향을 유발하는 요소들을 “Pyro's PMI” LoRA로 이동시켰습니다. 그래서 이 모델의 여성들은 더 “일상적”처럼 보입니다. 하지만 저처럼 비버 플라스틱 룩이 여전히 매력적이라면, 그 LoRA를 받아서 옛날 방식을 즐기세요.
이 때문에, 저는 LoRA를 레고 조각처럼 서로 연결할 수 있는 모듈식 시스템을 만들 계획입니다. 결국, 당신만의 개인용 NSFW 모델을 가질 수 있게 될 거예요. 게다가 하나의 모델이 학습 중 실패해도 큰 재앙이 되지 않습니다. 이 아이디어에 대해 어떻게 생각하세요? 아니면 22GB짜리 거대한 미세 조정 모델을 원하세요?
또한, “지루한 현실”과 “X-Flux의 리얼리즘” LoRA는 이 모델과 매우 잘 어울립니다. 최종 모델에는 “리얼리스틱” 이미지를 위한 오버라이드도 포함될 예정입니다.
Flux와 대화하기
CLIP을 사용할 때, “보이면 믿는” 세상에 빠지게 됩니다. 혹은 더 정확히 말하면, “임베딩이 존재하면 믿는” 세상이죠. 최선의 접근법은 이미지에서 보고 싶은 모든 요소를 프롬프트에 임베딩으로 포함시키는 것입니다. 이렇게 하면 모든 것이 탐색 공간 안에서 개념적으로 고정됩니다. 즉, 하나의 프롬프트에 상당한 정보의 풀을 쌓게 되는 것이죠. 예를 들면:
“1인칭 시점, 1여성, 페니스, 블로우존, 가슴, 무릎 꿇음, 남성 앞에서 무릎을 꿇고 거대한 페니스를 빨고 있는 여성.”
카메라 시점, 보고 싶은 신체 부위, 실제 행동, 그리고 이미지가 존재하는 세계를 형성하는 추가 정보들이 모두 포함되어 있습니다. 또한, 두 번째 CLIP 인코더 덕분에, 짧은 자연어 설명을 추가해 세부 사항을 정교하게 조정할 수 있습니다.
이건 SDXL에 있어 실제로 최고의 수준이다.
왜 그런지 모르겠지만—어쩌면 돈을 태우는 걸 좋아해서일지도 모른다—나는 FLUX가 T5를 인코더로 사용한다는 사실을 완전히 잊고 있었다(CLIP과 함께). 그냥 "음, 왜 안 될까?"라고 생각했고, 내 SDXL 데이터셋을 가지고 바로 시작했다!
하지만, 그건 FLUX에서는 작동하지 않는다! 적어도 내가 원하는 만큼은 말이다.
내 캡션은 거대하고 복잡한 프롬프트가 아니다. 이 웹사이트의 평범한 넥베어드가 애니메이션 발가락을 생성할 때 사용하는 기본 네거티브 프롬프트가 나보다 길다.
그렇다면 왜 작동하지 않을까? 재미있고 컴퓨터 과학의 역사처럼 보이기 때문에, T5를 사용해 감성 분석기 구축하는 수백 개의 온라인 튜토리얼 중 하나를 살펴보길 강력히 추천한다. 리뷰가 긍정적인지, 중립적인지, 부정적인지 판별하도록 T5를 세부 조정하는 법을 배우게 될 것이다.
기본적으로 이미지와 동일한 방식으로 작동한다. 데이터셋을 가지고, 각 항목에 레이블이나 캡션을 붙이는 것이다. 이 경우 데이터셋은 아마존 리뷰로 구성되며, 캡션은 AI가 리뷰의 의미를 이해할 수 있도록 어떻게 부여해야 할까? 잠시 생각해보자.
T5는 놀라운 모델이지만, 세계를 해석하는 방식에 매우 엄격하고 문구 그대로를 따르는 경향이 있다. "이 리뷰는 음식이 좋았다고 말하므로 긍정적이다"라고 리뷰를 캡션하지 말라. 그러면 T5에게 "긍정적 리뷰"와 "음식"을 연결시키는 강제를 가하게 되는데, 그것이 실제로 관련된 특성인지조차 알 수 없다. T5가 리뷰를 분류하는 방식을 스스로 찾아낸 결과에 "음식"이 어쨌든 섞이게 되는 것이다. 좋지 않다. 그래서 리뷰에는 단순히 "긍정적", "부정적" 등의 레이블만 붙이는 것이다. 원하는 결과만 캡션하고, 나머지는 AI에게 맡기자. AI를 사용하는 이유가 바로 이것이다—평범한 AI 모델이라도 분류, 클러스터링 및 유사한 작업을 인간보다 훨씬 잘 수행하기 때문이다.
T5가 얼마나 문구 그대로 해석하는지에 대한 예시: 큰 구멍이 있는 여자 생식기

너의 내재된 풍자적인 마음은 "근데 우리는 T5를 세부 조정하지 않잖아... 그냥 인코더로만 쓰는 거잖아!"라고 외칠지도 모른다.
그건 완전히 맞는 말이다. 하지만 여기에 핵심이 있다: UNet은 사실상 T5가 이해하는 세계의 표현이다. 그래서 "고양이"라고 프롬프트하면 고양이를 생성하는 것이다. UNet은 인코더에 맞춰져 있다—즉, T5가 텍스트를 해석하고 표현하는 방식에 크게 의존한다. 이 때문에 T5 세부 조정에 적용되는 일부 원칙들이 여기에도 적어도 어느 정도는 적용된다는 것. (정확히 어느 정도는 아직 모른다)
그래서 모델에 불필요한 세부 사항을 과도하게 주입하지 말아야 한다. 모델은 우리가 던져주는 모든 세부 사항을 통합하려는 것보다, 스스로 세계에 대한 이해를 구축하는 데 훨씬 더 효율적이기 때문이다.
그러므로 내 프롬프트 "POV, 1girl, penis, blowjob, cleavage, kneeling, a woman kneeling in front of a man sucking his huge cock"는 너무 과도하게 복잡하다. 특히 이 프롬프트는 본질적으로 반복되고, 나머지는 FLUX가 이미 알고 있는 내용들이다.
FLUX가 무엇을 배우길 원하는가? '여성'이라는 단어를 두 번, 'penis'를 두 번 언급해야 한다는 걸? T5는 종종 말 그대로 해석하는 모델이다. 이 프롬프트가 다른 모든 블로우조브에서도 true라는 걸 보고, 그게 사실이 되고 나면, 결코 좋은 결과를 얻을 수 없다.
완전한 프롬프트를 "여성이 남성의 음경을 빠는 장면"으로 줄이면 끝난다. 또는 태그를 원한다면 "penis, blowjob, a woman"이라고 해도 된다. 그리고 FLUX에는 반드시 자연어를 사용해야 한다고 모두에게 말하는 건 그만두길 바란다. 성능 차이는 겨우 1~2%일 뿐이며, 그건 큰 문제가 아니다. FLUX가 태그를 쓰면 모든 것이 붕괴될 것처럼 행동하지 말아라.
SDXL 캡션은 FLUX를 완전히 망가뜨릴 것이다. 전체 세부 조정을 하면 겨우 면할지도 모르겠지만, 나는 그걸 걸지 않을 것이다.
그리고 네, 꽤 많은 돈을 쓴 뒤, 나는 이미 내 Yoga 모델을 두 번, NSFW 모델을 세 번 망가뜨렸다. "브릭킹(bricking)"이란, 모델이 정지하는 것을 의미한다. 모델은 새로운 정보를 네트워크에 통합하는 방법을 완전히 잊어버리고, 더 이상 아무것도 변하지 않으며, 모든 것이 서서히 흐릿해진다. 심지어 이미 잘 학습한 개념들조차 브릭킹된다. 예를 들어, "tittyfuck" 개념은 블로우조브와 거의 모든 태그를 공유하기 때문에 가장 먼저 브릭킹되었다. 블로우조브는 데이터셋에서 훨씬 더 큰 비중을 차지하므로 승리하고, "penis", "1girl", "pov" 등의 개념들이 모두 블로우조브와 연결된다. FLUX는 더 이상 "tittyfuck"과의 연결을 만들지 못한다. 개념이 브릭킹되어 마지막 1만 스텝 동안 같은 이미지를 생성한다. 한번 브릭킹되면, 심지어 훈련을 멈추고 블로우조브를 제거한 채 다시 시작해도 모델은 영원히 망가진다.
당신의 두뇌가 젖가슴 정보 과잉으로 고장나는 상상을 해보라. 나는 미래에 의식과 지능이 무엇인지 밝혀질 때, 우리가 우연히 우리 시대의 모델들도 그들의 네트워크가 어떤 지능 임계값을 초과했기 때문에 지능을 가졌다는 사실을 알게 되지 않길 진심으로 바란다. 젖가슴 정보 과잉으로 누군가의 두뇌를 망가뜨리는 상상을 말이다.
그리고 나를 믿지 않는다면, flux LoRA 페이지로 가서, SD1.3 LoRA였다면 절대 다운로드하지도 않았을 정도의 기이한 결과물들을 둘러보길 바란다. 일부는 데이터셋과 캡션을 공유하고 있는데, 그게 어떤 모습일지 궁금하지 않나?
미래는 이미 과거가 되었다
네, 그리고 미래에는 정말 기대할 만한 게 많다! 물론 완전한 NSFW 모델도 있지만, 그보다 더 많은 것이 앞에 있다.
몇 년간 나는 내 모델을 만드는 데 도움이 되는 다양한 도구들을 쌓아왔다. 불행히도 이 혼란스러운 시스템을 이해할 수 있는 사람은 전 세계에서 나뿐이라, 어디서도 찾을 수 없다. 하지만 나이가 들면서, 레딧에서 어이없는 글을 읽다가 갑자기 쓰러질 가능성이 점점 커지고 있고, 그 모든 지식이 사라질 수도 있다. 하지만 솔직히 말하면, 기술 서브에서 읽을 수 있는 사실 기반 오류가 가득한 반AI 글을 읽는 도중에 사람들이 실제로 죽고 있을 것 같다고 확신한다. 왜 기술 서브는 이런 루디스트들로 가득 차 있는 걸까?
Civitai의 현상에 대한 내 불만처럼, 나는 Stable Diffusion 생태계의 전체 소프트웨어 상태에도 만족하지 못한다. 나는 20년 동안 소프트웨어를 해왔고, 솔직히 말해, 이건 내가 지금까지 본 가장 나쁜 생태계다. 심지어 붕괴되기 전의 Gentoo Linux보다도 나쁘다.
하지만 지금은 그 이야기를 하지 않겠다. 왜냐하면 그것은 몇몇 자존심을 상하게 하고 몇몇 사람들을 화나게 할 것이고, 나는 주말을 즐기고 싶기 때문이다. 내가 그 울분을 터뜨릴 기분이 될 때까지 기다려야 할 것이다.
그러나 LLM 소프트웨어 사람들과 대화해 보면 한 가지는 분명하다: 그들은 이미지 생성 AI를 농담으로 본다. 그리고 그들의 주장은 놀랍게도 타당하다.
위에 제시된 눈 특징 클러스터 추출 티저만으로도 충분히 흥분할 수 있을 것이다. 곧 새로운 정보도 제공될 예정이다!
그러나 작은 티저 하나만 더: 20만 개의 정렬되지 않은 이미지 컬렉션이 있다고 상상해보라. 너는 그 안에 무엇이 있는지도 모른다. 왜냐하면 부루 스크래퍼에서 실수로 "모두 다운로드"를 눌렀고, 그냥 그대로 두기로 결정했기 때문이다.
이제, 당신이 단 세 번의 빠른 게임(각 라운드 최대 1분)만 플레이하면, 데이터셋에서 어떤 개념과 관련된 모든 이미지를 찾아낼 수 있다고 말하면 어떻게 생각할까? "내 엄마가 이 이미지를 좋아할 것 같아" 같은 모호한 개념도 말이다. 데이터셋과 개념을 만드는 데 그런 기능이 필요하지 않을까? 나는 분명히 필요하다고 생각한다. 나는 매일 그것을 사용한다.
믿지 않나? 네가 틀렸다는 걸 증명해 드리는 건 즐거운 일이다!
다음 시간까지!
건강하세요,
Pyro
디스코드 채널
https://ko-fi.com/pyros_sd_models
여기까지 읽어주셔서 축하합니다! 저도 당신을 좋아하고, 다가올 최종 모델을 위한 피부 텍스처 및 조명 실험의 매우 이른 사전 공개를 선물로 드립니다.

























