Naked transparent somewhat-realistic slimegirls

세부 정보

모델 설명

My first LoRA.

eng (translated using gemma-2-27b-it-Q3_K_S.gguf on my local 4070tis):

I was experimenting with how the model recalls information it vaguely knows but has forgotten due to insufficient image data during initial training. I aimed to create a novel concept based on the model's hallucinations, arising from its possession of data about both aspects.

Initially, I trained a LoRA on typical slime girls to test this first point. I observed that Flux.1 Dev had some understanding of this concept, but without LoRA, it couldn't generate the results I desired with the term "slime girl." The outcome was decent, but since a slime girl LoRA already existed for Flux, I decided to experiment further.

I couldn't find anything substantial online regarding "realistic slime girl," so I decided to bring this concept to life. The idea, as described above, is to leverage the model's ability to project new information from existing data, essentially hallucinating. While hallucinations are often considered detrimental to models, they can be strategically employed to achieve specific outcomes. This is similar to how LLMs invent facts when they lack information.

My plan involved training a LoRA on photos of nude people and images generated using the first LoRA with simple slimes. This resulted in two versions of this approach, and this model is the second one. The first also included a parallel dataset of 4000 filler images, most lacking captions (I compiled this dataset myself). This approach didn't yield satisfactory results, so I reduced the dataset, retaining only captioned images. Additionally, I heavily utilized AI-generated images within the dataset.

Ultimately, the LoRA produces intriguing outputs, and I'm satisfied with the test results. Later, I'll enhance the dataset to create slime girls with more diverse appearances and poses.

Furthermore, some images were inadvertently deleted from the dataset before training, and I unknowingly initiated the process. By the time I noticed, it was too late. Therefore, this is the first version, which can be further developed if I figure out how to resume training.

Some facts about training:

  1. I'm unsure why fluxgym doesn't function properly with ComfyUI, so this LoRA works incorrectly in ComfyUI and requires Forge.

  2. I'm uncertain how the LoRA will perform on the website because I lack a GPU capable of handling the unquantified version of Flux.1 Dev.

  3. Tags used in training and how to prompt:

    1. "colorless": Transparent, lacking additional blue, yellow, or other color hues, resembling water in transparency.

    2. "transparent": Transparent, allowing objects to be seen through. Omitting "transparent" will result in a non-transparent slime girl.

    3. "slime-girl": I used this as unique tokens, likely not associated with anything else (or maybe not, I'm unsure how it works).

    4. Prompts can be written in natural language.

    5. The dataset includes both female and male characteristics, but I haven't tested on slime-boys. I labeled them accordingly as "pussy," "boobs" for female images, and "dick" for dick pics (taken from an open dataset on huggingface).

    6. The object labeled "pussy" often appears absent in images. This suggests inadequate LoRA training, and for prompts necessitating increased significance for this word (e.g., (pussy:2)).

    7. "boobs with nipples": This indicated the presence of nipples on the slime girl during training. Not good results, but not the worst.

    8. To specify the color of the slime girl, any color should work, as far as I know. At least, blue, green, red, black, white, gray, brown, pink, orange, colorless, rainbow, and similar colors are present in the dataset.

If anyone knows how to fix the fluxgym training to make it work correctly in ComfyUI, please let me know. I've searched the entire internet, and I haven't found anything useful, only one non-functional conversion script for a similar but not the same problem.

I am physically located in Russia, so I don't have access to many buzz to thoroughly test this LoRA on the website.

рашен лангуаге:

Я экспериментировал с тем, как модель вспоминает то, что она явно немного знает, но подзабыла из-за того, что при изначальном обучении изображений было маловато, чтобы выдавать достаточно соответствующий запросу результат. А также попытался создать совершенно новый концепт модели, основанный на галлюцинациях модели, вызванных тем, что у нее есть данные как об одном аспекте, так и о другом.

Изначально я натренировал LoRA для обычных slime girl, чтобы как раз первый пункт опробовать: я заметил, что Flux.1 Dev имеет некоторое представление об этом концепте, но у него без LoRA не выходило получить то, что я от него хотел словом "slime girl". И получилось сносно, но LoRA для slime girl уже существовала для Flux, так что я решил немного еще поэкспериментировать.

В интернете я не находил ничего особо серьезного по запросу "realistic slime girl", так что я решил воплотить slime girl в реальность))

Идея, как описано выше, заключается в том, чтобы применить способность модели проецировать новое из известных данных, то есть, по сути, галлюционировать. Несмотря на то, что чаще галлюцинации рассматривают как что-то вредное для моделей, иногда можно применить их для достижения конкретного результата. Это можно сравнить с тем, как LLM начинает придумывать факты, если не знает чего-то.

План был следующий: обучить LoRA на фото с обнаженными людьми и изображениями, сгенерированными с применением первой LoRA с просто слаймами. По итогу, было две версии этого подхода, и эта модель - вторая. Первая содержала также параллельно датасет в 4000 картинок-филлеров, большинство из которых не содержало описаний (я собирал датасет сам). Идея не прижилась и я сократил датасет, оставив только то, что описал. Также, в датасете активно применялись сгенерированные ИИ изображения. Вроде, вышло не слишком плохо.

По итогу LoRA может делать что-то прикольное, и я доволен результатом этого теста. Позднее я попробую дополнить датасет, чтобы slime girl не были все на одно лицо и в одной дефолтной позе по умолчанию.

Также, некоторые изображения из датасета почему-то удалились до начала обучения, и я, не заметив это, начал его, а потом было поздно. Так что это - первая версия, которая впоследствии может быть дополнена, если я разберусь, как продолжить обучение.

Примечания:

  1. Я хз, почему fluxgym не хочет нормально работать с ComfyUI, поэтому в ComfyUI эта LoRA работает некорректно, нужно использовать Forge.

  2. Я хз, как себя покажет LoRA на сайте, потому что у меня нет ГПУ, способного уместить неквантифицированную версию Flux.1 Dev.

  3. В тренировке использовались следующие теги и как промптить:

    1. "colorless" - бесцветный, не имеющий цвета. Значит, что нет дополнительного синего, желтого или иного оттенка, напоминает воду по прозрачности

    2. "transparent" - прозрачный, объекты видимы насквозь. Значит, что если не написать "transparent", то slime girl выйдет непрозрачной.

    3. "slime-girl" - я применил именно через тире, чтобы это были уникальные токены, вряд ли с чем-либо ассоциируемые (ну или хз, как это работает, может, и зря)

    4. Писать промпт вроде можно на натуральном языке

    5. В датасете есть как женские особенности, так и мужские, но я не тестил на slime-boy)) Я их назвал соответственно "pussy", "boobs" для изображений с женщинами и "dick" для дикпиков. (взято из открытого датасета с huggingface)

    6. Чаще объект, именуемый "pussy" отсутствует на картинке. Видимо, плохо тренировал LoRA, приходится задавать повышенный уровень значимости этому слову ( это выглядит так: (pussy:2) )

    7. "boobs with nipples" - это при тренировке указывало, что у slime girl есть эти самые нипели. Не слишком идеально, но было хуже.

    8. Для указания цвета slime-girl можно использовать любой цвет, насколько мне известно. По крайней мере, всякие blue, green, red, black, white, gray, brown, pink, orange, colorless, rainbow и вот это все в датасете есть.

Если кто-нибудь знает, как починить тренировку fluxgym, чтобы все работало в ComfyUI, сообщите, пожалуйста. Я весь инет обрыл, нифигище не нашел по этому поводу, только один нерабочий скрипт конвертации для решения схожей, но не этой проблемы.

Физически я в России, так что buzzов у меня нема слишком много, чтобы протестить хорошенько на сайте.

이 모델로 만든 이미지