Bad Card Template
세부 정보
파일 다운로드
모델 설명
v1.0을 사용하고 싶으시면 지침을 읽어 주세요. (https://civitai.com/articles/671)
이 모델은 보드게임/트레이딩카드게임용 카드 템플릿을 생성합니다.
Loras
bct2_basic: 카드를 만듭니다. 다소 과도하게(detail이 많고, 3D 요소가 많으며 색상이 약간 흐려짐), 나쁘게 보이지는 않음
bct2_2080_basic: 과도하게 세부적인 체크포인트를 제거한 카드 생성
프롬프트 작성법
활성화 단어 'bct2'
색상: '초록색', '용암 빨강색', '검정색과 골드 색'
스타일, 예술적 스타일 또는 세계관: '물감 스타일', '스팀펑크 오일 페인팅 스타일', '디지털 아트 스타일'
배경 설명: '검정 배경', '배경에 숲', '스크래치 무늬가 있는 배경'
카드 설명: '금장 장식이 있는 카드', '보석처럼 보이는 카드'
제목 배너 설명: '파란 제목 배너', ' hammergold 텍스트 배너'
일러스트 설명: '천둥이 있는 타원형 일러스트 영역', '검은 테두리 사진 프레임'
텍스트 박스 설명: '구름 질감이 있는 텍스트 박스'
스탯을 넣을 공간 설명: '좌상단에 심장 기호', '우하단에 방패 기호'
품질: '마스터피스, 최고 품질'
부정적 요소: 흐림, 잘못 그린 것, 보기 싫음, 저품질 (학습 데이터에서)
물론 이 모든 것이 이미지 생성 시 필수적이거나 정확히 반영되는 것은 아니지만, 이 모델이 학습된 방식입니다...
가중치 설정
대부분의 모델이 인간이나 웨이푸를 그려내고 싶어하기 때문에 이건 어려운 부분입니다.
풍경이나 물체를 잘 그리는 모델: 1.5~3.0
Lyriel 및 일부 애니메이션 모델: 2.5~4.5 (애니메이션 소녀를 그리려는 경향을 무시하기 위해)
웨이푸 베이직: 0.7~1.3
그림이 나왔다면 가중치가 너무 낮음, 자세한 카드가 나왔다면 가중치 적절함, 자세한 부분이 없는 카드면 가중치가 너무 높음, 가운데 블랙홀이 생기면 가중치가 너무 높음
표준 카드(직사각형 카드, 제목, 일러스트, 제목, 텍스트)를 얻고 싶다면 프롬프트에 'plain card style'를 추가하세요.
모든 경우에 새 체크포인트를 사용할 때는 Lora 가중치를 함께 사용한 Prompt X/Y/Z를 매우 권장합니다.
애니메이션 모델로 카드 만들기
이 모델은 OpenJourneyV4(실사형 모델)로 학습되었습니다.
애니메이션 모델로 카드를 만드는 것은 더 어려우며, 카드의 외형을 만들기 어렵습니다 (Lora 가중치 > 4.5가 필요하지만, 그 전에 Lora가 파손됨)
충분히 좋은 카드를 얻는 주된 요소는 Lora 가중치보다는 랜덤 시드입니다 (높은 대조도를 가진 시드가 필요함)
시도해 볼 것들:
여러 시드를 시도하고 좋은 것들을 재사용해 보기
좋은 시드 번호를 얻은 후 Lora 가중치 조정해 보기
위에서 언급한 대로 'plain card style' 추가해 보기
활성화 단어 'bct2'의 가중치를 낮춰 보세요. 이 모델들은 Booru 프롬프트를 사용하므로, 텍스트 계층에 있는 Lora는 의미가 없을 가능성이 있음
다른 가능성: Lyriel 또는 XenoEngine으로 카드를 생성한 후, 애니메이션 체크포인트로 이미지 2 이미지(img2img)를 실행하고 루프백 기능을 사용 (예: 0.6 덴이징, 50 스텝, 6회 루프백 반복, 0.2 루프백 최종 덴이징)
추가 주의사항
추가로 'add_details' Lora를 추천합니다 (카드를 더 만화 스타일이나 더 사실적으로 만들 수 있음) /model/82098/add-more-details-detail-enhancer-tweaker-lora
불필요한 세부사항을 정리하려면 http://cleanup.pictures를 사용할 수 있음
세그먼트 어벳 기반 확장 프로그램을 사용하여 카드의 관련 부분을 선택해 후처리할 수 있음
모델은 때때로 어두운 이미지를 생성합니다 (검은 배경과 검은 일러스트 프레임 사진으로 학습되었기 때문에, 프롬프트로 제거 가능)
특정 카드 형태를 얻기 위해 컨트론파워(CN)를 사용하는 기술은 여전히 유효함 (v1.0 지침 참조)
학습에 사용된 데이터셋은 공개되어 있습니다. 만약 처음부터 다시 학습해야 한다면 보조 키워드(예: '태블릿', '스마트폰', '트레이딩카드')도 사용했을 것임
텍스트 인버전(textual inversion)을 시도해 보았으나 실패함 (Lora와 충돌함). 하지만 하나의 단서를 얻음: 유용한 보조 프롬프트는 '📅' (캘린더 이모지)임. 프롬프트에 여러 개의 📅를 추가해 보았더니, 프롬프트에 더 잘 따르며, 보다 많은 아이콘(스탯 표시에 유용)을 생성하고 카드를 더 많은 부분으로 나누는 효과가 있음
추가 Lora는 /model/95424/pokeffects에서 확인 가능
아름다움 점수(aesthetic score)에 대한 설명
관찰한 바에 따르면, 4.5는 일반적인 카드, 5.5~6.0은 매우 보기 좋은 카드지만, 6.2 이상은 카드가 아니라 그림이 됨
따라서 'masterpiece, best quality'를 프롬프트에 포함하지 않으면 카드 형태 유지에 도움이 됨
이 모델은 사실적인 체크포인트로 학습되었으므로 5.5
6.0 이상의 점수를 받을 수 있지만, 애니메이션 모델에서는 약 5.05.5 정도만 가능함 (특정 Lora를 위해 데이터셋 구축 후 재학습 필요)
위치 배치에 대한 설명: 최신 신경망은 주의력 네트워크(attentional network)를 사용함 (이로 인해 이미지가 위아래로 한 픽셀 이동해도 크게 변하지 않음), 하지만 이는 특정 요소를 이미지 특정 부분에 정확히 배치하는 것을 어렵게 만듦. 정밀한 위치 배치가 필요한 보드게임 또는 카드 제작을 위해서는 컨트론파워, SDXL/SD3, 또는 주의력 강화 기능이 필요함 (컨트롤파워 색상 설명 마지막 참조)
유튜브 관련
이 유튜버는 AI/SD 시대에 보드게임 아티스트들이 어떻게 여전히 수익을 얻할 수 있는지 묻고 있음. (/watch?v=SdgzH2OSZDY) 이 Lora는 예술적으로 어색한 사람들을 위한 것이며 더 나은 프로토타입을 만들기 위해 제작됨. 이 주제에 대해 생각이 있다면 해당 영상에 시청해주고 코멘트 남기기
TCG 카드 제작의 중요한 규칙들에 관한 영상 (/watch?v=XDd4u2xnRtE)
유튜브에서 멋진 영상을 보았고, 몇 가지 의견이 있음
컴퓨터 비전의 '차폐 문제(occlusion problem)'는 다른 물체에 일부 가려진 물체를 인식하는 문제임. 이 방법은 카드의 서로 가려지는 부분들을 순차적으로 생성함으로써 이 문제를 해결함
컨트롤파워 기술은 bct-v1.0과 유사하지만, 텍스처 있는 마스크 샘플라인(latent)은 새로 접하는 개념임. 매우 작은 점들을 사용함으로써 초세밀한 질감(세부적인 스케일, 고주파 포리에)을 요청하는 것 같음
그러므로 제작자가 컨트롤파워로 엄격한 치수를 부여받아, 서로 다른 파트(클랜, 색상, 희귀도 등)를 생성하면서도 호환성을 유지하며 다양한 버전의 카드를 제작할 수 있다는 점은 정말 훌륭하다고 생각함
그는 모든 요소를 병합한 후 0.25 덴이징으로 최종 img2img를 실행함. 또한 카드의 모든 부분에 동일한 모델 사용해 카드 간 일관성을 유지함
방패 부분에 대해선, bct-v1.0과 루프백 컨트롤파워(원형은 컨트롤로 사용, 낮은 Lora 가중치)가 더 좋았을 것임. bct-v1.0 Lora는 '이미지 평면화 및 아이콘화' 역할을 하며, 더 잘 작동했을 것임
최종 텍스트 및 이미지 병합에 대해선, 완전한 게임 덱을 재생성해야 할 때 사용 가능한 알려진 카드 제작 소프트웨어를 추천함. 하지만 최종 img2img 병합은 이루어지지 않음
마지막 불만(심한 꼼꼼함을 요구하면): 포트레이트를 조합의 가장 깊은(가장 가려지는) 요소로 만들 수 있지만, 일부 부분(예: 이 영상에서 보석과 머리카락 일부)은 스크롤과 프레임 위에 위치할 수 있음. 이 현상이 무엇인지, 어떻게 자동화할 수 있는지 확신하지 못함
놀라운 최종 결과










