Typhoon SD1.5
詳細
ファイルをダウンロード
このバージョンについて
モデル説明

🌪️ 台風 (Stable Diffusion 1.5 版)
V1 と V2 – 実験的な混乱から高解像度の混沌へ
「もともとTornado V3として始まったものが、独自のカテゴリー5の状況へと発展した。」
「より良い判断と資金の減少に逆らって、ここに台風のSD1.5版を提供します。」
台風(SD1.5)は、私のフラッグシップSDXLモデルの弟分で、好奇心、頑固さ、そしてはるかに少ないデータセット由来の後悔によって生み出されました。
(台風XL:/model/1610717/typhoon)
📌 TL;DR / 注意点:
台風はスタイル化されたモデルです。意図的に、映画的な照明、クリーンなディテール、そして特徴的な「レンダリングされたリアル」な美意識へと傾いています。完全な写実主義(スマートフォン級のポートレート、ポラロイド、フィルム粒状など)も可能ですが、生のリアリズムを出すにはより多くのプロンプトの工夫が必要です。デフォルトでは、鮮やかなディテールとやや超現実的な仕上げが期待できます——これが台風の独特な魅力の一部です。
この紹介ではネイティブ出力サンプルを使用しています:すべてのサンプル画像は、LoRAや外部修飾なしで生成されました。ご覧のものはモデルの本質的機能です。
📦 これは何ですか?
これは、段階的に訓練されたカスタムSD1.5モデルです:初期チェックポイントの微調整に続き、専用LoRAをトレーニング・マージ——すべて手作業で、非常にハードな方法で行いました。LoRAのガーゼと学習率のダクトテープで縫い合わせられたフランケンシュタインの怪物だと考えてください。
ベースは 'v1-5-pruned-emaonly' です。元のrunwayml/stable-diffusion-v1-5が利用できなくなったため。ベースモデルの選択は悪夢そのもの——ほとんどが過度に微調整されていて、あるいは全く認識できないほど劣化していました。このモデルはかろうじて生き残りました。
🔧 モデルの特徴
ポートレートレベルのディテール: 台風は、クリーンで高解像度のアップレンダリングに優れています。ADetailerは不要——ディテール保持はネイティブで非常に強く、再構築不要です。
ダイナミックな照明と奥行き: 再設計された光の挙動により、映画的なコントラストと空間構成が向上しています。
プロンプトのシンプルさ: トリガーワードは不要です。結果は自然で、プロンプトの意図に一貫して連動します。
台風は本来スタイル化されています。デフォルト出力は鮮やかで、ディテール豊か、軽くレンダリングされたもの——生のリアリズムより「クリーンなリアリズム」または「フォトリアリスティックに近い」外観を好みます。明るい照明、鋭く定義された特徴、そしてその特徴的なレンダリング仕上げが組み込まれています。ポートレート、ビューティーショット、コンセプトアートに優れていますが、丁寧にプロンプトを指示しない限り、粗野なドキュメンタリースタイルのリアリズムにはなりません。ただし、生のリアリズムも可能です——ただ、その結果を得るにはプロンプトで少し頑張る必要があります。高光沢のトリガーフレーズは避けましょう。
📚 トレーニングノート
データセットは完全に刷新され、768pxまでアップスケールされました。V1の過ちを修正しただけでなく、構成の多様性と一般的な解剖学的知識の向上にも寄与しています。全身画像を生成する際、椅子を投げつける回数が減るはずです。
マージに使用したLoRAはV1で512×512でトレーニングされましたが、現在は改善されたデータセットで裏付けられています。
すべてのサンプル画像は、LoRAなしで生成されています。
解像度のヒント: 512×512、512×768、または576×768で生成できますが、時折解剖学的な奇妙さが発生します。Hires Fixを使わない場合は、512×768から始めるのがおすすめです——しかし実際、これは大きな差を生みます。
🧠 内部構造
台風(SD1.5)はハイブリッドプロセスで作成されました:
初期ベースチェックポイントの微調整
プロジェクト固有のLoRAのセット——トレーニングされ、手動でベースにマージ
マージ強度と重みの慎重な調整——主に試行錯誤で
このプロセスを支援するために、私は2つのオープンソースツールを開発しました:
📊 LoRA Strength Analyzer
SSIMやBRISQUEなどの知覚的画像指標を用いてLoRAのマージを評価します。
📈 LoRA Epoch Analyzer
視覚的指標を用いて、異なるLoRAトレーニングエポックを比較し、最適チェックポイントを特定します。
⚠️ 制限事項
NSFW: ベースモデルは部分的に中和されています。台風は最善を尽くしますが、結果はまちまちです。うまくいくと本当に素晴らしいのですが、この領域での一貫性は期待しないでください。
解剖学的不具合とアーチファクト: データセットの修正によりV1から大幅に改善されていますが、エッジケースでの奇妙さはまだ発生する可能性があります。可能な限りHires Fixをご利用ください。
自然言語プロンプト: 好きではありません。最良の結果を得るには、簡潔で構造化されたプロンプトをお使いください。
🧠 プロンプトのヒント
このモデルは長く、飾り気のあるプロンプトが苦手です。Fluxではありません。おだててはいけません。短く、タグのようなプロンプトを好みます。ストカット。おそらくトレーニングセットがタグ中心だったためです。再び私の過ち、あるいはBooruのせいです。しかし真剣に言いますが、短く具体的にすることで最良の結果を得られます。
⚙️ 推奨設定
解像度: ベース生成には512x640 または 576x768
サンプラー: DPM++ 2M Karras、Euler、Euler A——よく使われるもの
CFG: ほとんどの画像で0.3 – 0.8
ステップ数: 20 – 40 が一般的に良いです。結果が悪い場合は±5ステップ調整してください
Hires Fix: 非常に推奨
ノイズ低減: 0.5 – 0.7(0.5 = ややソフトな画像)
アップスケール: 1.5 – 1.8x(Latent)= 高いほどアーチファクトが増加
Hires CFG: 7(私はHires FixのCFGをベースCFGと同じ値に設定しています——はい、強迫観念です…)
⚠️ クローズアップではADetailerや顔修復を使用しないでください。このモデルは既に目と顔をうまくレンダリングします。エッジケースでモデルが苦戦した場合にのみ使用してください。
💡 VAEメモ
開発中に古い.bin VAEファイルをテストしました——色が褪せ、全体的に10月のベルリンを経由したような見た目になりました。退屈で、陰鬱で……ご理解いただけるでしょう。
台風は以下のいずれかで最もよく動作します:
• VAEを一切ロードせず、または
• 公式の stabilityai/sd-vae-ft-ema を使用
結果が褪せたり無機質に見える場合は、VAEが原因である可能性が高いです。
🔒 ライセンスと使用
CreativeML OpenRAIL-M ライセンス下で配布されています。
このモデルを他のモデルにマージしないでください。
第三者生成サービスでこのモデルを使用しないでください。
個人・プライベートな生成には使用可能です。
商業的またはホスティング環境で使用したい場合は、まず私にご相談ください。
マージや再アップロードは美的なバランスを崩し、丁寧に調整されたLoRAのバランスを完全に台無しにします。それはやめましょう。
🚧 既知の問題
一部の狭い解像度で解剖学的な不具合が発生する可能性があります。
自然言語プロンプトには最適化されていません。
V2の改善されたデータセット解像度により、V1の全身歪みのほとんどが解消されていますが、エッジケースは残っています。
🌩️ ☕ 嵐を支えてください
私が構築しているもの——台風、竜巻、ツール、混沌——に興味を持ってくれて、それを維持する手助けをしたいなら、Ko-fiで支援を検討してください:
https://ko-fi.com/raxephion
すべての支援が、計算リソース、カフェイン、そして「なぜこれが壊れているの?」という絶叫を支えます。嵐を生き続けさせてくれてありがとう。




















