Z_Image_Lora_Soviet_GAZ21_22_v002
详情
下载文件
模型描述
这是一个测试LoRA!
Z-Image-Turbo模型的开发者指出,该模型的语言为中文和英文。
然而,其测试编码器Qwen 3对俄语了如指掌!因此,Z-Image-Turbo模型能够很好地理解俄语查询。
该LoRA旨在测试俄语训练效果。数据集包含150张不同尺寸和长宽比的照片,所有详细描述均为俄语!
所有描述均使用Qwen 3VL 8B模型以俄语生成,并经过人工编辑。
该LoRA在AI-Toolkit中使用prodigy-plus-schedule-free优化器,在Z-Image-Turbo模型上使用zimage_turbo_training_adapter_v2.safetensors进行训练。
训练持续了30,000步;根据测试结果,选择了约训练27,000步的轮次。
该LoRA主要针对苏联GAZ-21汽车进行训练,部分涉及GAZ-22。数据集中还包含其他一些对象的单张照片,但LoRA对它们的记忆非常微弱:GAZ-M20、GAZ-51、Moskvich-408、LAZ公交车、苏联无轨电车,甚至图-134飞机。
不过,苏联环境、人物类型及其着装原本已被基础模型部分掌握,并通过训练得到了良好补充。
生成时的主要标签为:“Советская эпоха, 1960е годы, ГАЗ-21, ГАЗ-22”——这些查询标签建议使用俄语,而详细描述则可使用模型精通的其他语言。
示例查询如下:
"Советская эпоха, 1960е годы, ГАЗ-21, Professional night photography. Black GAZ-21 Volga car with the white inscription ССД on the front door stand near the entrance to a gloomy three-story concrete building with a blue neon sign Civitai. winter, snowfall, blizzard."
或完全使用俄语:
"Советская эпоха, 1960е годы, ГАЗ-22, Чёрно-белая фотография. На переднем плане — белый легковой автомобиль ГАЗ-22 с хромированными деталями, включая решётку радиатора и колпаки на колёсах. За ним — ещё один автомобиль, частично видимый. На заднем плане — самолёт ТУ-134 с надписью "АЭРОФЛОТ" на борту и логотипом авиакомпании. Вокруг автомобилей и самолёта — группа людей в деловой одежде, включая мужчин в костюмах и женщины в платьях. Некоторые стоят, другие сидят в автомобилях. Один мужчина в костюме и галстуке стоит рядом с автомобилем, другой мужчина в костюме и галстуке сидит в автомобиле. На самолёте видна лестница для посадки. Небо на заднем плане — облачное."
在训练过程中,发现TURBO模式出现故障
为生成高质量图像,我使用以下参数:
采样方法 - Res Multistep
调度类型 - Linear Quadratic
采样步数 - 30
Shift - 3
CFG Scale -3
--
俄语描述:
Эта тестовая LoRA! Разработчики модели Z-Image-Turbo указали, что языки модели — китайский и английский. Но её тестовый энкодер Qwen 3 отлично знает русский язык! И в итоге модель Z-Image-Turbo хорошо понимает запросы на русском языке!
Эта LoRA задумана как тест обучения на русском языке. Датасет — 150 фото разных размеров и соотношений сторон, и все их подробные описания на русском языке! Все описания создавались на русском языке на модели Qwen 3VL 8B и редактировались вручную. LoRA обучена в AI-Toolkit с использованием оптимизатора prodigy-plus-schedule-free на модели Z-Image-Turbo с использованием zimage_turbo_training_adapter_v2.safetensors. Обучение длилось 30 000 шагов, по итогу тестов была выбрана эпоха, которая отучилась около 27 000 шагов. LoRA обучалась на советские автомобили ГАЗ-21 и немного ГАЗ-22, также в датасете были единичные фото с другими объектами, которые LoRA запомнила — но очень плохо: ГАЗ-М20, ГАЗ-51, Москвич-408, автобус ЛАЗ, советские троллейбусы и даже самолёт ТУ-134. А вот советское окружение и типажи людей и их одежду изначальная модель более-менее знала + хорошо дополнила знания из обучения. Основные теги для генераций: "Советская эпоха, 1960е годы, ГАЗ-21, ГАЗ-22" — эти запрос-теги желательно так и использовать на русском, а вот подробное описание уже можно делать на другом языке, который хорошо знает модель. Пример такого запроса:
"Советская эпоха, 1960е годы, ГАЗ-21, Professional night photography. Black GAZ-21 Volga car with the white inscription ССД on the front door stand near the entrance to a gloomy three-story concrete building with a blue neon sign Civitai. winter, snowfall, blizzard."
Или полностью на русском:
"Советская эпоха, 1960е годы, ГАЗ-22, Чёрно-белая фотография. На переднем плане — белый легковой автомобиль ГАЗ-22 с хромированными деталями, включая решётку радиатора и колпаки на колёсах. За ним — ещё один автомобиль, частично видимый. На заднем плане — самолёт ТУ-134 с надписью "АЭРОФЛОТ" на борту и логотипом авиакомпании. Вокруг автомобилей и самолёта — группа людей в деловой одежде, включая мужчин в костюмах и женщин в платьях. Некоторые стоят, другие сидят в автомобилях. Один мужчина в костюме и галстуке стоит рядом с автомобилем, другой мужчина в костюме и галстуке сидит в автомобиле. На самолёте видна лестница для посадки. Небо на заднем плане — облачное."
В процессе обучения режим TURBO, несмотря на использование TURBO LoRA, был сломан, и для качественной генерации требуется около 30 шагов.
Sampling method - Res Multistep
Schedule type - Linear Quadratic
Sampling steps - 30
Shift - 3
CFG Scale -3




















