Otome TEST LORA

세부 정보

파일 다운로드

모델 설명

LORA는 Civitai에서만 일반 공개됩니다

LORAはCivitaiでのみ公開しています

TEST LORA

죄송합니다. 영어로 번역하지 않는 이유는 미세한 뉘앙스나 번역 오류를 발견하기 어려울 것 같기 때문입니다. 또한 영어가 모국어가 아닌 사용자가 많으므로, 일본어에서 다른 언어로 번역이 필요한 분들께서 직접 번역해 주시길 부탁드립니다.

이 LORA는 단순 테스트용입니다. 테스트 결과에 관심이 있으신 분은 자유롭게 사용해 주세요.

이 LORA는 향후 LORA 제작을 위한, 학습 이미지가 극단적으로 많은 경우의 테스트입니다.

저는 아직 수색 중인 상태에서 LORA를 제작하고 있으며, 이전부터 “학습 이미지는 많을수록 좋다”, “이미지 크기는 일관된 편이 좋다”는 흐릿한 정보들에 관심이 있었습니다.

그래서 한 번 LORA를 제작하고, 그 LORA를 사용해 1344✕768 크기로 통일된 이미지 800장으로 학습했습니다. 테스트의 일환으로 배경이 포함된 이미지가 약 80%를 차지합니다.
그러나 원래 비교 대상으로 ‘배경 없는 800장’이나 ‘크기 통일하지 않은 800장’ 같은 경우도 없었고, 1024✕1024 크기에서의 테스트도 하지 않았습니다. 이는 단지 감각적인 테스트이므로 과도한 기대는 하지 마십시오.

좋아하지 않는 캐릭터로 LORA를 처음부터 만들어 테스트하는 건 힘들기 때문에, 제가 가장 좋아하는 캐릭터인【오토메 도리의 사쿠라기 오토메】를 선택했습니다.

사쿠라기 오토메는 이미 전세계적으로 훌륭한 LORA를 Illustrious에서 제작하셨습니다. 정말 뛰어난 LORA로, 저도 여러 장의 이미지를 만들어 올렸습니다.

사쿠라기 오토메 LORA를 원하시는 분은 /model/1121521 를 이용해 주세요.

이 LORA는 단순 테스트용입니다. 테스트 결과에 관심이 있으신 분은 자유롭게 사용해 주세요.

결과 소감: 첫 번째 단계의 LORA로 공개할 수 있을 만큼의 수준이었습니다. 이번에는 이 LORA를 사용해 통일된 이미지로 다량 학습하는 테스트를 진행했습니다. 가장 기대했던 것은 “나쁜 부분의 평균화”였습니다.
그런데 솔직히 별로 달라지지 않았습니다. 분명히 좋아졌다고 느껴지긴 하지만, 극적인 변화는 아닙니다. “세부 부분까지 충분히 비교했는가?”라고 묻는다면, 시간적으로 아직 부족한 면이 많습니다. 그러나 대충 봤을 때 ‘머리카락 질감’, ‘학습된 옷’, ‘통통한 느낌’은 꽤 나쁘지 않다고 생각합니다.
정보가 부족하지만, 8가지 정도 다른 머리색 체크포인트로 테스트한 결과 “너는 누구야?” 같은 이상한 이미지는 나오지 않았습니다. 그래서 지금까지 가장 큰 효과라고 생각합니다. 또한, 이는 테스트 전부터 경험적으로 느꼈던 점인데 안정감일까요? 다양한 포즈와 표정에서도 꽤 잘 버텨냅니다.

제 GPU는 생성 외의 목적을 위해 선택한 Intel ARC770 16GB로, 성능이 다소 애매합니다. 속도도 그리 빠르지 않아, 원본 이미지 800장을 만드는 시간적 비용과 맞는지 묻는다면 아닙니다.

진심으로 좋아하는 캐릭터의 최고급 LORA를 원하고, 할 수 있는 모든 것을 다 해보려는 사람이라면 충분히 가치 있는 테스트입니다.

즉, 저에게 오토메쨩은 정말 좋아하는 캐릭터이기 때문에 후회하지 않습니다! (웃음)

테스트 목적 중 하나가 더 있습니다. 현재 저는 로컬에서 LORA를 제작하지 않고 있습니다. GPU 점유 시간이 길어, 그 동안 제 일(광의적으로는 식품 관련 자영업이며, PC를 매우 자주 사용하고, 여러 대의 보조 PC도 운영 중입니다)에 매우 큰 영향을 주기 때문입니다. 따라서 Civitai에서 생성하는 것이 더 편리합니다.
뭐라고요? “일과 사생활을 분리해라?” 맞습니다!
하지만 자영업자 중에 그 정도로 체계적으로 관리하는 분들은 이미 벌써 회사가 되어 있을 겁니다. 자영업의 본질이 바로 주머니까지 하나라는 점이죠…

잡담은 이만.

그러니 떠오른 문제가 Buzz 비용입니다. “한 번에 완성하면 좋다”는 건 충분히 알고 있습니다. 하지만 원본이 애니메이션이라면 몰라도, 저의 애니메이션 취향은 매우 편향되어 있습니다. 말하자면 잘 모르는 캐릭터들이 많다는 뜻입니다. 모르면 좋아할 수 없고, 좋아하지 않는 건 만들 수 없죠. 웃음. 원본은 만화나 라이트 노벨 삽화입니다.
또한 “원작을 읽고 있다(만화, 노벨 가리지 않고)”는 경우, 원본 데이터의 대부분이 흑백인 경우가 매우 많습니다… 아니, 거의 전부입니다. (汗)

따라서 한 번에 성공하는 경우는 거의 없고, “컬러 이미지 느낌이 다르다”는 문제가 자주 발생합니다. (단 한 장이라도 컬러가 있으면 대체로 괜찮습니다.) 컬러를 예로 들었지만, 만화는 전신 이미지나 뒷모습, 앉은 자세(이 정도까지 가면 애니메이션도 마찬가지입니다)가 아예 없는 경우가 흔합니다. 그래서 “스타일에 어색함”이 생기기 쉽습니다.
그러면 한 개의 LORA를 조정하며 2라운드, 3라운드를 반복하게 됩니다. (네, 그게 얼마나 수고스러운지 저는 알고 있습니다.)
결과, Buzz가 아무리 많아도 부족합니다!^^;

3라운드면 (최소) 1500 Buzz입니다. … 보통 최소로 끝나지 않습니다.
그래서 어찌저찌 2라운드로 끝내고 싶었고, 그것이 바로 이번 테스트의 동기입니다.
참고로 이번 테스트(초기 생성: 500 Buzz)
초기 결과를 바탕으로 프롬프트를 조정했습니다. 프롬프트로 조정되지 않는 부분은 포토샵으로 수정했습니다. 이 데이터로 약 800장. (2라운드, 800장 데이터로 LORA 생성 비용은 약 1000 Buzz)… 예상보다 비싸지 않네요.
어쨌든 Buzz는 2라운드로 마무리되어 다행입니다.
800장을 만드는 건 와일드카드를 사용해 방치하고 생성했기 때문에, 같은 방치라도 LORA 생성보다는 약간 수고를 덜었습니다.
약간 이번이 더 낫다… 정도의 수준입니다. 태그 편집 시간까지 포함하면 큰 이득입니다. 이미지 수는 많지만, 와일드카드를 통해 패턴화도 되기에 편리합니다.

여러분이 만든 이미지들 중 ‘이런 식으로 나왔어?’ 혹은 ‘좋잖아!’ 같은 사례는 장르나 결과를 가리지 않고, 참고 자료로 도움을 주신다면 정말 감사하겠습니다. (단, 새 규정을 꼭 확인해 주세요. 기저귀를 차고 있는 장면, 술에 취한 장면, 총을 겨눈 장면, 심지어 마인드 컨트롤 같은 동의 없는 행위는 엄격히 금지되어 있습니다.)
참고로 커버, 즉 LORA의 썸네일 이미지에 ‘R’이 붙어 있습니다. 스포츠맨이 시원하게 운동 후 수분 보충하는 모습…이라는 게 통하지 않았습니다. (웃음) 이건 너무 음란하다! 문제다, 라고 하더군요. 웃음.
자유롭고 솔직한 의견 기다리겠습니다. 감사합니다.

테스트 코너

아마 유용할지도 모른다고 생각해, 새로운 규정, 즉 clavata의 체크 기준 테스트를 겸하고 있습니다. 크게 한 것은 아니지만, 전혀 하지 않는 것보다는 나은 것 같아 참고용으로 올립니다.

여러분도 눈치채셨겠지만, 모든 이미지의 주제는 스포츠입니다. 따라서 원래는 SFW, 건전한 내용이어야 합니다. 아래에 (이미지: 등급)로 표기합니다.

  1. (수분 보충: R)
    이건 프롬프트가 잘못되었을지도 모릅니다. 운동 후의 휴식, 흐뭇한 감정을 내기 위해 “in heat”를 사용한 것이 원인일까요?

  2. (요가: R)
    여성이 요가를 할 때의 실제 복장으로 참고했는데, R이 나왔습니다. 요가가 ‘성인용 테마나 상황’? 불가사의합니다. 보통 요가는 건전한 활동으로 여겨지지 않나요? 이해할 수 없습니다.

  3. (복싱: PG)
    이미지의 별칭은 덴프시 롤입니다. (웃음) 스포츠이지만 폭력적 요소가 있으니 그 테스트도 겸했습니다. 결과는 SFW였지만, 글러브로 젖가슴이 가려져서일까요?

  4. (서핑: R)
    여성 서퍼의 매우 일반적인 스타일인데, 부적절하다고 합니다. 이것은 단순하고 과거의 판단 방식일 수도 있는데, 피부 노출 면적이 관련이 있을까요? AI의 업무에 어울리지 않으리라 바라지만…

  5. (롱레인지 사격: PG)
    피부 노출이 적지만, 총을 사용하는 만큼 폭력적으로 보일 수 있는 스포츠, 사격입니다. 표적을 겨냥하는 게 아니라 총을 들고 있지 않은 이미지이므로 SFW입니다. AI가 환장하지 않아서 안심했습니다. 잡담으로, 클레이 사격을 시도했으나(일본에서는 산탄총 보유 후 10년이 지나야 라이플 허가를 신청할 수 있어 최소 28세 이상입니다. 오토메쨩은 28세처럼 보이지 않죠) 수직 이중 산탄총이 생성되지 않아 포기했습니다. 심지어 수평 이중도 불가능했습니다. 펌프나 가스 오토도 경기로 가능하지만, 탄환 장전 여부가 먼 거리에서 식별하기 어려워 좋아하지 않습니다. 지역에 따라서는 싫어하기도 한다고 합니다. 산탄총 LORA를 만들어보고 싶군요…

  6. (테니스: R)
    젖가슴이야 말로 원인인가? 결국 피부 노출 면적일지도 모릅니다. 실망입니다.

  7. (농구: PG)
    젖가슴이 원인이 아니라고? 아! 젖가슴이 농구공으로 보였나!
    AI는 “유방이 세 개? 그런 인류도 있나? 차별이 되면 큰일이야” 라고 판단한 걸지도 모릅니다. 대단하네요, AI. 《Total Recall》의 뮤타트 같네요. 폴 버호벤도 놀라겠네요. (웃음)
    피부 노출 면적説이 더 신빙성 있게 보입니다… 인간 눈으로 보면 건강한 에로인데 말이죠. 미국 기업이라 농구에는 관대할 수도 있겠네요. 폴로 셔츠라면 “저건 안 돼!”라고 항의할지도 모르겠네요. (웃음)

  8. (보트: PG13)
    뭐요? PG13: “노출이 많은 옷”? 왜 그런 걸까요? 숏팬츠도 안 된다고요?
    역시 피부 노출? 금粉 쇼라면 전신 노출도 SFW가 될까요?

  9. (스카이다이빙: PG)
    완전히納得되는 SFW입니다. ‘등장 인물이 스스로 위험을 감수할 경우, 당국은 그 행동에 개입하지 않는다’는 원칙일까요?

  10. (말타기. 어린 말의 안장 적응: PG)
    계산이 아니라 우연의 산물이지만, 개인적으로 가장 좋아하는 이미지입니다. 원래는 일반적인 말타기를 시도했지만, 모든 체크포인트에서 말의 크기가 약간 작았습니다. 여러 장을 생성한 결과, 좋은 이미지를 뽑아냈습니다. 어린 말이라 하기엔 너무 크지만, 어딘가 이유로 훈련이 늦어졌을 수도 있겠죠. 말에 안장을 메고, “이치, 니, 이치, 니. 무서워하지 마. 잘했어. 똑똑한 녀석이구나.” 하며 옆에서 걷는 풍경입니다. 이런 일은 여성이 잘 합니다! 여성이 가진 힘을 실감할 때입니다.
    말은 갈색 피부색(보이지 않을 수도 있지만)인데, 분명 말과 사람을 구분하고 있습니다. 단순한 피부 노출 면적 이론이 아님을 확인하고 안심했습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.