🧩 Version Notes — yoiko_style_model V2.0
📘 概要 (Overview)
日本語:
yoiko_style_model V2.0 は、学習手法を見直し、SFT(Supervised Fine-Tuning)を用いて再構築したメジャーアップデート版です。
前バージョンでは、スタイルの「効き」が良くも悪くも強すぎる傾向があり、
一部のシーンでは絵柄が背景から浮いて見えてしまうことがありました。
V2.0 では、
という点を意識して SFT を行っています。
その結果、以前のバージョンと比べて
キャラクターやモチーフが背景になじみやすくなり、
画面全体のバランスが取りやすくなった
と感じています。
現状、自分の目指している方向性にかなり近づいた手応えのあるバージョンです。
一方で、この調整の副作用として、
モデルファイルサイズが約 12GB と非常に大きくなってしまっている点は明確な弱点です。
ダウンロードや保管、実行環境(VRAM・ストレージ)にそれなりの余裕が必要になるため、
扱いやすさという意味ではややヘビー級のモデルになっています。
English:
yoiko_style_model V2.0 is a major update rebuilt with a revised training approach using Supervised Fine-Tuning (SFT).
In the previous version, the style effect was sometimes too strong,
which could cause characters or subjects to look as if they were “floating” away from the background in certain prompts and compositions.
With V2.0, the focus was on:
Improving generalization, so the model behaves more stably across a wide range of prompts, and
Preserving the strong stylistic flavor while enhancing overall coherence in the image.
As a result, compared to earlier versions:
Characters and objects tend to blend more naturally with the background,
And the overall composition feels more balanced and unified.
From my perspective, this version gets much closer to the style and atmosphere I’ve been aiming for.
However, as a trade-off,
the model file has grown to around 12GB, which makes it harder to handle in terms of download size, storage, and hardware requirements.
Because of that, this version is best suited for users with enough VRAM and disk space who don’t mind dealing with a heavier model.
🧠 開発意図 (Purpose)
日本語:
このバージョンの開発意図は、
の 3 点にあります。
前バージョンを触っているうちに、
「派手に効くけど、常にそれがベストとは限らない」
「もう少し落ち着いた出力も選べるようにしたい」
と感じる場面が多くなり、
“強さ”よりも“バランス”を重視したチューニングに踏み切りました。
個人的には、V2.0 はこれまでの中でもかなり満足度の高い出来で、
「ようやく土台として胸を張って出せるライン」に届いた感覚があります。
今後はこの V2.0 を基準に、細かな表現の調整や、用途別の派生を検討していく予定です。
English:
The main goals behind this version were to:
Keep the satisfying, punchy style that earlier versions had,
While reducing unwanted side effects such as overly “pasted-on” or floating-looking subjects,
And improve generalization, so the model can be used more reliably across many different prompts and compositions.
While using the previous version, I often felt that:
“High intensity” isn’t always the best answer, and
It would be nice to have outputs that can be strong yet more controlled and cohesive.
This led me to shift the focus from pure intensity toward overall balance.
From my point of view, V2.0 is one of the most satisfying iterations so far—
it finally feels like a solid foundation I can confidently build upon.
Going forward, I plan to treat V2.0 as the new baseline and explore further refinements or specialized variants.
💻 制約・注意点 (Limitations & Notes)
日本語:
それでも、
「前より絵の浮きが気にならなくなった」
「全体のまとまりが取りやすくなった」
と感じてもらえたら、とても嬉しいです。
English:
The model size is around 12GB, which means:
There are still prompt patterns and edge cases that haven’t been fully tested yet,
so certain extreme compositions or settings may produce unexpected results.
Even so, I hope users will notice that
subjects feel less “detached” from the background and the overall image is easier to harmonize compared to previous versions.
💬 フィードバックのお願い (Feedback)
日本語:
V2.0 についてのフィードバックを心から歓迎します。
とくに:
など、実際に触ってみて感じたことをコメントで教えていただけると、
今後の微調整や派生バージョンの開発にとても役立ちます。
English:
Any feedback on V2.0 is greatly appreciated. In particular, I’d love to hear:
How it compares to earlier versions in your actual use cases,
Whether the “floating” feeling has improved (and in what situations it still appears, if any),
Your impressions of prompt responsiveness, LoRA/weight behavior, and composition stability.
Your comments will directly influence future tweaks and potential spin-off versions.
🪶 Thank you for trying yoiko_style_model V2.0.
Your experiments and feedback are a huge help in shaping where this style goes next.