Z_Image_Lora_Soviet_GAZ21_22_v002

详情

模型描述

这是一个测试LoRA!

Z-Image-Turbo模型的开发者指出,该模型的语言为中文和英文。

然而,其测试编码器Qwen 3对俄语了如指掌!因此,Z-Image-Turbo模型能够很好地理解俄语查询。

该LoRA旨在测试俄语训练效果。数据集包含150张不同尺寸和长宽比的照片,所有详细描述均为俄语!

所有描述均使用Qwen 3VL 8B模型以俄语生成,并经过人工编辑。

该LoRA在AI-Toolkit中使用prodigy-plus-schedule-free优化器,在Z-Image-Turbo模型上使用zimage_turbo_training_adapter_v2.safetensors进行训练。

训练持续了30,000步;根据测试结果,选择了约训练27,000步的轮次。

该LoRA主要针对苏联GAZ-21汽车进行训练,部分涉及GAZ-22。数据集中还包含其他一些对象的单张照片,但LoRA对它们的记忆非常微弱:GAZ-M20、GAZ-51、Moskvich-408、LAZ公交车、苏联无轨电车,甚至图-134飞机。

不过,苏联环境、人物类型及其着装原本已被基础模型部分掌握,并通过训练得到了良好补充。

生成时的主要标签为:“Советская эпоха, 1960е годы, ГАЗ-21, ГАЗ-22”——这些查询标签建议使用俄语,而详细描述则可使用模型精通的其他语言。

示例查询如下:

"Советская эпоха, 1960е годы, ГАЗ-21, Professional night photography. Black GAZ-21 Volga car with the white inscription ССД on the front door stand near the entrance to a gloomy three-story concrete building with a blue neon sign Civitai. winter, snowfall, blizzard."

或完全使用俄语:

"Советская эпоха, 1960е годы, ГАЗ-22, Чёрно-белая фотография. На переднем плане — белый легковой автомобиль ГАЗ-22 с хромированными деталями, включая решётку радиатора и колпаки на колёсах. За ним — ещё один автомобиль, частично видимый. На заднем плане — самолёт ТУ-134 с надписью "АЭРОФЛОТ" на борту и логотипом авиакомпании. Вокруг автомобилей и самолёта — группа людей в деловой одежде, включая мужчин в костюмах и женщины в платьях. Некоторые стоят, другие сидят в автомобилях. Один мужчина в костюме и галстуке стоит рядом с автомобилем, другой мужчина в костюме и галстуке сидит в автомобиле. На самолёте видна лестница для посадки. Небо на заднем плане — облачное."

在训练过程中,发现TURBO模式出现故障

为生成高质量图像,我使用以下参数:

采样方法 - Res Multistep

调度类型 - Linear Quadratic

采样步数 - 30

Shift - 3

CFG Scale -3

--

俄语描述:

Эта тестовая LoRA! Разработчики модели Z-Image-Turbo указали, что языки модели — китайский и английский. Но её тестовый энкодер Qwen 3 отлично знает русский язык! И в итоге модель Z-Image-Turbo хорошо понимает запросы на русском языке!

Эта LoRA задумана как тест обучения на русском языке. Датасет — 150 фото разных размеров и соотношений сторон, и все их подробные описания на русском языке! Все описания создавались на русском языке на модели Qwen 3VL 8B и редактировались вручную. LoRA обучена в AI-Toolkit с использованием оптимизатора prodigy-plus-schedule-free на модели Z-Image-Turbo с использованием zimage_turbo_training_adapter_v2.safetensors. Обучение длилось 30 000 шагов, по итогу тестов была выбрана эпоха, которая отучилась около 27 000 шагов. LoRA обучалась на советские автомобили ГАЗ-21 и немного ГАЗ-22, также в датасете были единичные фото с другими объектами, которые LoRA запомнила — но очень плохо: ГАЗ-М20, ГАЗ-51, Москвич-408, автобус ЛАЗ, советские троллейбусы и даже самолёт ТУ-134. А вот советское окружение и типажи людей и их одежду изначальная модель более-менее знала + хорошо дополнила знания из обучения. Основные теги для генераций: "Советская эпоха, 1960е годы, ГАЗ-21, ГАЗ-22" — эти запрос-теги желательно так и использовать на русском, а вот подробное описание уже можно делать на другом языке, который хорошо знает модель. Пример такого запроса:

"Советская эпоха, 1960е годы, ГАЗ-21, Professional night photography. Black GAZ-21 Volga car with the white inscription ССД on the front door stand near the entrance to a gloomy three-story concrete building with a blue neon sign Civitai. winter, snowfall, blizzard."

Или полностью на русском:

"Советская эпоха, 1960е годы, ГАЗ-22, Чёрно-белая фотография. На переднем плане — белый легковой автомобиль ГАЗ-22 с хромированными деталями, включая решётку радиатора и колпаки на колёсах. За ним — ещё один автомобиль, частично видимый. На заднем плане — самолёт ТУ-134 с надписью "АЭРОФЛОТ" на борту и логотипом авиакомпании. Вокруг автомобилей и самолёта — группа людей в деловой одежде, включая мужчин в костюмах и женщин в платьях. Некоторые стоят, другие сидят в автомобилях. Один мужчина в костюме и галстуке стоит рядом с автомобилем, другой мужчина в костюме и галстуке сидит в автомобиле. На самолёте видна лестница для посадки. Небо на заднем плане — облачное."

В процессе обучения режим TURBO, несмотря на использование TURBO LoRA, был сломан, и для качественной генерации требуется около 30 шагов.

Sampling method - Res Multistep

Schedule type - Linear Quadratic

Sampling steps - 30

Shift - 3

CFG Scale -3

此模型生成的图像

未找到图像。