Creation NAIXL / 2025-Oct

세부 정보

파일 다운로드

모델 설명

Creation NAIXL V1-251001


중국어 / 영어

개요

이 모델은 NoobAI-XL의 Epsilon 시리즈 모델을 기반으로 하며, 새로운 데이터셋으로 학습되었습니다. 좋아해주셨으면 합니다. 저는 데이터셋 규모를 확장하여 지속적으로 학습을 진행하여 완성도를 높일 계획입니다. 5월 버전과 비교해 10월 버전은 여러 측면에서 크게 향상되었지만, 의미적 정확도는 상당히 저하되었으므로 추가 개선이 필요합니다.

모델 학습 세부사항

데이터셋

지속 학습에 사용된 데이터셋의 샘플은 주로 Pixiv에서 수집된 이미지이며, 프롬프트는 Pixiv에서 작가 또는 커뮤니티가 추가한 영어 태그와 Danbooru API를 통해 가져온 태그를 포함합니다.

Danbooru에 업로드되지 않은 이미지의 경우, Pixiv가 제공하는 태그가 적기 때문에 각 이미지에 대해 wd-tagger-v3를 사용하여 Danbooru 스타일 태그를 추론했습니다. 그 후, 로컬 인덱스와 Danbooru의 자동 완성 API를 활용하여 각 아티스트의 Pixiv 사용자명을 올바른 Danbooru 아티스트 태그로 매핑했습니다.

세부 내용은 다음과 같습니다:

  • Pixiv 월간 랭킹에서 2025년 1월부터 10월까지 매일 500장씩 이미지를 크롤링한 후 중복을 제거하고, 각 이미지의 영어 태그를 추출했습니다.

  • Pixiv R18 주간 랭킹에서 2025년 1월부터 5월까지 매일 이미지를 크롤링한 후 중복을 제거하고, 각 이미지의 영어 태그를 추출했습니다. R18 랭킹의 이미지를 더 이상 업데이트하지 않은 이유는 과도한 가림 처리 때문입니다.

  • Pixiv VISIONS 연감에서 약 50명의 일러스트레이터를 선정하여 2024년 11월 1일부터 2025년 10월 1일까지의 작품을 수집하고, 각 이미지의 영어 태그를 추출했습니다.

  • Pixiv의 소재 국가 정책으로 인해 대부분의 R18 작품이 검열을 받았기 때문에, Danbooru에서 order:score age:<1year 조건으로 약 7,000개의 양성 샘플을 선별하여 대부분의 게임 캐릭터를 포함하고, 부정적 샘플(bad hands, bad feet...)도 수집했습니다.

총 샘플 수: 21,345장

WEEKLY_RANKING_R18_API: str = "https://www.pixiv.net/ranking.php?mode=weekly_r18&date={date}&p={p}&format=json"

MONTHLY_RANKING_API: str = "https://www.pixiv.net/ranking.php?mode=monthly&date={date}&p={p}&format=json"

ILLUST_INFO_API: str = "https://www.pixiv.net/ajax/illust/{illust_id}?lang=en"

DANBOORU_SEARCH_API: str = "https://danbooru.donmai.us/posts.json?tags={tags}&page={page}&limit={limit}"

DANBOORU_AUTO_COMPLETE_API: str = "https://danbooru.donmai.us/autocomplete.json"

프롬프트 중복을 제거하고, 오류 프롬프트를 삭제하며, 짧거나 긴 프롬프트를 가진 학습 샘플을 제거했습니다. 다음 프롬프트를 포함하는 샘플도 제거했습니다.

chat log, fake screenshot, ai-generated, ai-generated illustration, announcement celebration, comic, manga, how to draw, multiple boys, multiple girls

작품의 인기순으로 자동 품질 태그를 부여했습니다(아래 참조).

생성 가이드

프롬프트

생성 시에는 항상 동일한 형식의 프롬프트를 사용해야 합니다. 두 가지 프롬프트 작성 방식이 지원됩니다.

  • 모든 언더스코어를 제거한 형태: robin \(honkai: star rail\) (권장. 학습에 사용된 프롬프트 형식과 동일합니다.)

  • 언더스코어를 포함한 형태: robin_\(honkai:_star_rail\);

권장 프롬프트 순서:

<1boy/1girl/1other/...>, <character>, <artists/styles>, <quality tags>, <composition tags>, <IP/franchise>, <more tags>

데이터셋에서 Pixiv의 “xxx n+ 북마크/사용자” 태그를 품질 프롬프트 태그로 매핑하여 모델의 품질 제어를 향상시켰습니다. 테스트 결과, 이러한 태그의 효과가 뚜렷하게 나타났습니다.

사용 가능한 품질 태그:

masterpiece         # n >= 10000
best quality        # 5000 <= n < 10000
high quality        # 1000 <= n < 5000
good quality        # 500 <= n < 1000
normal quality      # else

NAI-XL의 연도 프롬프트를 이어받아, 이제 year 2025를 사용할 수 있으며, newest는 2021~2025년 범위에 해당합니다.

또한 이미지 해상도를 다음과 같이 분류했습니다:

absurdres           # n > 9,000,000 (픽셀)
highres             # 4,000,000 < n <= 9,000,000 (픽셀)
midres              # 1,048,576 < n <= 4,000,000 (픽셀)
lowres              # else

데이터셋 구성 특성상 Danbooru 태그뿐 아니라 Pixiv 태그에 포함된 다양한 태그도 사용할 수 있습니다. 현재 이 태그들의 효과는 제한적이지만, 향후 반복을 통해 개선될 것으로 기대합니다.

제가 사용하는 부정적 프롬프트는 다음과 같습니다:

Suggest Negative Prompt:
lowres, (worst quality, bad quality, low quality:1.2), bad anatomy, bad perspective, bad hands, bad feet, bad pixiv id, anime screencap, watermark, artist name, censored, bar censor, mosaic censoring, amputee

기타

샘플러: Euler / Euler a

CFG: 4.0~6.5

반복 횟수: 주요 단계는 20단계 이상이어야 합니다.

기타 사항은 원본 모델과 동일하게 유지됩니다.


Introduction

This model is based on the Epsilon series from NoobAI-XL and was trained using a brand-new dataset. I hope you’ll like it. I will continue expanding the dataset and training the model until it becomes fully refined. Compared to the May version, the October version has seen significant improvements in multiple aspects. However, the semantic accuracy has decreased significantly and needs to be further improved.

Model Training Details

Dataset

The samples used for continued training were primarily collected from Pixiv.
Each image’s prompts include English tags added by the author or the community on Pixiv, along with additional tags retrieved via the Danbooru API.

For images not uploaded to Danbooru — since Pixiv generally provides fewer tags — I used wd-tagger-v3 to infer Danbooru-style tags for each image.
Then, using a local index and Danbooru’s autocomplete API, each artist’s Pixiv username was mapped to the correct Danbooru artist tag.

Details are as follows:

  • Crawled the Pixiv monthly ranking (regular) from January to October 2025, collecting 500 images per day, deduplicated, and extracted English tags for each image.

  • Crawled the Pixiv R18 weekly ranking from January to May 2025, deduplicated and extracted English tags for each image. (Did not continue updating R18 rankings due to excessive censorship.)

  • Selected works from about 50 illustrators featured in Pixiv VISIONS Yearbook, covering their works from Nov 1, 2024 to Oct 1, 2025, with English tags retrieved for each image.

  • Due to censorship policies in Pixiv’s host country, most R18 works are moderated, so an additional 7,000 positive samples were selected from Danbooru under order:score age:<1year, covering most popular game characters.
    Negative samples were also collected (e.g., bad hands, bad feet, etc.).

Total: 21,345 samples.

WEEKLY_RANKING_R18_API: str = "https://www.pixiv.net/ranking.php?mode=weekly_r18&date={date}&p={p}&format=json"

MONTHLY_RANKING_API: str = "https://www.pixiv.net/ranking.php?mode=monthly&date={date}&p={p}&format=json"

ILLUST_INFO_API: str = "https://www.pixiv.net/ajax/illust/{illust_id}?lang=en"

DANBOORU_SEARCH_API: str = "https://danbooru.donmai.us/posts.json?tags={tags}&page={page}&limit={limit}"

DANBOORU_AUTO_COMPLETE_API: str = "https://danbooru.donmai.us/autocomplete.json"

Duplicate prompts were removed, incorrect ones deleted, and samples with overly short or long prompts were discarded.
Samples containing any of the following prompt tags were also removed:

chat log, fake screenshot, ai-generated, ai-generated illustration, announcement celebration, comic, manga, how to draw, multiple boys, multiple girls

Quality tags were automatically assigned according to the artwork’s popularity (see below).

Generation Guidelines

Prompts

During generation, you should keep a consistent writing style for prompts. Two formats are supported:

  • Without underscores: robin \(honkai: star rail\)

  • With underscores: robin_\(honkai:_star_rail\)

Recommended prompt order:

<1boy/1girl/1other/...>, <character>, <artists/styles>, <quality tags>, <composition tags>, <IP/franchise>, <more tags>

Pixiv’s “xxx n+ bookmarks/users” tags were mapped to quality prompt tags to improve quality control.
After testing, these tags have shown significant effects.

Available quality tags:

masterpiece         # n >= 10000
best quality        # 5000 <= n < 10000
high quality        # 1000 <= n < 5000
good quality        # 500 <= n < 1000
normal quality      # else

The year tag system from NAI-XL is continued — you can now use year 2025,
and newest now corresponds to the range 2021–2025.

I also categorized images by resolution as follows:

absurdres           # n > 9,000,000 (pixels)
highres             # 4,000,000 < n <= 9,000,000 (pixels)
midres              # 1,048,576 < n <= 4,000,000 (pixels)
lowres              # else

Because of how the dataset is constructed, you can use not only Danbooru tags but also many Pixiv-specific tags.
Their current impact is limited, but with future iterations, they should become more effective.

Suggest Negative Prompt:
lowres, (worst quality, bad quality, low quality:1.2), bad anatomy, bad perspective, bad hands, bad feet, bad pixiv id, anime screencap, watermark, artist name, censored, bar censor, mosaic censoring, amputee

Other Settings

  • Sampler: Euler / Euler a

  • CFG: 4.0–6.5

  • Steps: Should exceed 20 during main generation phases

  • Unmentioned parts remain consistent with the base model.

Translated by GPT-5.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.