InstaPic - LoRa

詳細

ファイルをダウンロード

モデル説明

InstaPic

このLoRaの目的は、Instagram用のポストプロダクション画像を生成することです。

注意:

非常に重要な点として、このモデルはややオーバーフィッティングが発生しています。そのため、データセットで使用された標準的なキャプションと大きく異なるプロンプトを入力すると、特定のプロンプトよりも品質が低下します。これは、データセットのキャプションが照明、フェイシャルアクセサリー、より官能的なシーンに焦点を当てた単語を多く含んでいるためであり、このような単語をプロンプトに含めると、実際の品質が活性化されます。私が投稿したサンプルを見ると、いくつかは非常にリアルで、他のものはシンプルな要素を持っています。それ以外にも、ステップ数、CFG、サンプラー、スケジューラーを調整することは、前述のプロンプトと同様に、高品質な結果を得るために100%重要です。


テスト

画像はこちら


モデルバージョンとトレーニング詳細

トレーニング概要:

開発中に4つの異なるバージョンをトレーニングしました。それぞれ異なるアプローチとデータセットを使用していますが、バージョン1ミックスバージョン(V1+V3) のみをリリースします。なぜなら、ミックスバージョンはバージョン1単体よりも優れた結果を示しているからです。

[InstaPic V1 - 基礎版]

主要トレーニング仕様:

  • データセット:プロフェッショナルなポストプロダクションが施された600枚の厳選されたリアル画像

  • ランク:256(約4.4GBのLoRAファイル)

  • トレーニングツール:最適化されたパラメータを持つDiffusion Pipe

  • 焦点:Instagramスタイルのコンテンツとソーシャルメディアの美学

  • 解像度最適化:縦向きのInstagramフォーマット向けにトレーニング

高ランク(256)は、品質保持の実験として実施しました。このオリジナルバージョンはInstagramスタイルの生成の基盤を確立しています。

[InstaPic Mix(V1+V3)- 改良版]

高度な統合トレーニング:

  • ベース:バージョン1のデータセット

  • 強化:バージョン3のSDXL強化トレーニングデータと統合

  • 品質バージョン1単体より優れた結果

  • トレーニング:包括的なスタイルカバーを実現するマージトレーニング手法

[バージョンV2 & V4 - 実験版]

  • V2:大規模トレーニング実験(17,000枚、低解像度)

  • V4:StyleGANとVTONデータセットとのマルチソース融合

  • 状態開発のみ - リリース予定なし

  • 目的:将来のバージョンのための研究開発


利用可能なマージ済みモデル形式

リリース版:

InstaPic V1(オリジナル):

  • ランク256 - 4.4GB - オリジナル基礎モデル

InstaPic Mix(V1+V3)- 推奨:

  • FP16 - 最高品質のフル精度バージョン

  • FP8 E3M4FN - 品質を保ちつつ最適化された圧縮版

SDXLスタイルLoRA:

  • InstaPic Style SDXL - Big Love SDXLモデルを用いた画像から画像への処理を通じてV1画像でトレーニングされた強化版。詳細度とSDXL最適化品質が向上

事前マージ済みQwen Imageベースモデル:

オリジナルLoRAが埋め込まれた、そのまま使用可能なマージ済みバージョン:

  • BF16(フル精度)- 最高品質、ファイルサイズ大

  • Q8(高品質)- 品質と効率の優れたバランス

  • Q6(バランス型)- 適度な圧縮で良好な品質

  • Q4(効率型)- 最速推論、許容できる品質


🧩 プロンプトテンプレート(データセットスタイル)

高品質な結果を得るには、データセットのキャプションスタイルに基づいてこのテンプレートを使用してください:

1nst4p1c [髪型の詳細な記述]の女性が、[具体的な衣装アイテム]を着て、
[具体的なポーズ/位置]で[詳細な場所]にいます。
彼女は[表情]で、[手や体の位置]をとっています。
[体の露出度/衣装の詳細]。
背景は[特定の要素を含む詳細な背景記述]です。
照明は[照明タイプ]で、[照明効果]を伴っています。
全体的な美学は[美学の記述]です。
画像は[構図の詳細]を備えた、よく構成されています。
カメラアングルは[具体的な角度]で、被写体を[方向]から見ています。
被写界深度は[深度の記述]で、[焦点の詳細]です。

例(データセットスタイル):


1. ラティーナ – ルーフトップパーティー

1nst4p1c 長い濃い波状の髪を持つラティーナ女性が、ネオンピンクのクロップトップとグリッターが施された破れたデニムショートパンツを着て、夜のルーフトップテラスに自信満々に構えています。片手を腰に当て、もう片方の手にはプラスチックカップを持ち、表情は大胆で遊び心があります。bronzedな肌は紫と赤のネオンパーティーライトの下で自然に輝き、リアルな質感を示しています。背景には、踊る人々のぼやけたシルエットと遠くの都市のスカイラインが見えます。照明は鮮やかでシネマティックです。全体的な美学は都会的で官能的、ソーシャルメディア向けです。画像は縦向きに完璧に構成され、浅い被写界深度で彼女が引き立てられ、ルーフトップの雰囲気は柔らかくぼやけています。

2. ラグジュアリーカー – 夜の到着

1nst4p1c 長いストレートの金髪の女性が、短い黒いスパンコールドレスとハイヒールを着て、夜の高級ホテルの入り口前に停められた黒いランボルギーニから降りています。片手には小さなデザイナークラッチを持ち、表情は中立ながら自信に満ちています。白い肌にはホテルのゴールデンライトが自然なハイライトを浴びせています。背景にはぼやけたシャンデリアとガラス扉の近くのホテルスタッフが見えます。照明は温かくシネマティックで、車のネオン反射とゴールデントーンが混ざっています。全体的な美学はゴージャスで官能的、Instagramのラグジュアリースタイルです。画像は縦向きに完璧に構成され、女性とランボルギーニが鮮明に焦点を合わせ、背景は柔らかくぼやけています。

3. ジム – ミラー自撮り

1nst4p1c 長い黒髪をポニーテールに結んだブラジルのモレナ女性が、赤いスポーツブラとタイトなグレイレギンスを着て、現代的なジム内でミラー自撮りのポーズを取ります。片手にはスマホをわずかに傾けて持ち、ウエストを引き締め、楽しげな笑みで唇をわずかに開いています。明るいジムの天井照明の下、 tanされた肌に自然なハイライトが現れ、腕にはわずかに汗の質感があります。背景にはぼやけたダンベルと有酸素運動機器が見えます。照明はシャープでリアルで、体のラインを強調しています。全体的な美学はフィットネスインフルエンサーレベルの官能的で、ソーシャルメディア向けです。画像は縦向きに完璧に構成され、浅い被写界深度で彼女の反射に焦点を当て、ジムは柔らかく見えています。

4. ショッピングバッグ – ラグジュアリーライフスタイル

1nst4p1c 長い赤みがかった髪とそばかすを持つ女性が、ベージュのクロップトップとスリムジーンズを着て、ブランドのショッピングバッグをいくつか手に持ち、高級ショッピングストリートを歩んでいます。サングラスをかけ、カメラに向かって自信に満ちた笑みを浮かべています。白い肌は日光の下で柔らかな自然な質感を示しています。背景にはぼやけた高級ブランドの店舗とガラス窓が見えます。照明は明るい自然光で、シャープなディテールとリアルなトーンを生み出しています。全体的な美学はカジュアルラグジュアリーで、Instagramインフルエンサーレベルです。画像は縦向きに完璧に構成され、浅い被写界深度で彼女が引き立てられ、高級店舗は柔らかくぼやけています。

5. プールサイドサマー – 官能的ポーズ

1nst4p1c パステルピンクの髪を乱れたツイストアップにまとめた女性が、ターコイズのビキニとゴールドのベルトチェーンを身に着け、プールの縁に足を少し開いて座っています。腕を後ろに組んで体を傾け、カメラに控えめにセクシーな笑みを向けます。白い肌には水滴が輝き、日光を反射しています。背景にはターコイズのプールの水と遠くにぼやけたパームツリーが見えます。照明は明るい自然光で、鮮やかでシャープです。全体的な美学は夏らしく、官能的でインフルエンサーレベルです。画像は縦向きに完璧に構成され、浅い被写界深度で彼女の体に焦点を当て、プールの背景は柔らかくぼやけています。

6. 夜のネオンクラブ – パーティーの様子

1nst4p1c 細かい巻き髪を持つ黒人女性が、グリッターのシルバーミニドレスとホープイヤリングを着け、混雑したナイトクラブのバーのそばに立っています。片手にカクテルを持ち、もう片方の手をカウンターに置き、楽しげな表情で唇をわずかに開いています。暗い肌は紫と青のネオン反射に照らされ、リアルなハイライトが現れます。背景には踊る人々のぼやけたシルエットと輝くネオンサインが見えます。照明はドラマチックでカラフルで、彼女の肌とドレスにシネマティックな反射を投げています。全体的な美学は都会的で官能的、活気に満ちています。画像は縦向きに完璧に構成され、浅い被写界深度で彼女が際立っており、クラブのシーンは柔らかくぼやけています。

キーとなるデータセット要素(品質に非常に重要):

  • 具体的な衣装の詳細(ビキニトップ/ボトム、クロップトップなど)

  • 正確なポーズの記述(足を組んで座る、膝をつく、立ち寄るなど)

  • 体の露出度の記述(「体はほとんど見えている」、「ただこれだけを着ている」など)

  • 産業的/都市的な背景(建設現場、コンクリート、金属など)

  • 照明は常に「柔らかく拡散された」

  • 「よく構成されている」は常に含める

  • 特定のカメラアングル(やや高め、見下ろす角度など)

  • 被写界深度は常に明記する

LoRA推奨:

最高品質を得るには、ミックス版(V1+V3)を使用してください。 これはオリジナルのV1単体より優れた品質を示しています。


最適な解像度設定

推奨Instagram解像度:

  • ストーリーズ/リール:1080 x 1920(9:16アスペクト比)

  • 代替縦向き:1088 x 1920(トレーニング用に最適化)

  • 投稿:1080 x 1350(4:5アスペクト比)

  • スクエア投稿:1080 x 1080(1:1アスペクト比)

高品質解像度(16で割り切れる):

  • 1536 x 1024 - 横向きフォーマット

  • 1024 x 1536 - 縦向きフォーマット

  • 1536 x 864 - ワイドフォーマット

  • 864 x 1536 - タールフォーマット

  • 1152 x 1536 - 代替縦向き

  • 1536 x 1152 - 代替横向き

解像度ガイドライン:

  • すべての解像度は16で割り切れるようにすること

  • スクリーンドア効果を防ぐため、過度な高解像度を避けること

  • 本物のInstagram美学のため、縦向きフォーマットを推奨

  • このモデルでは「高さ > 幅」の比率が最適

  • さまざまなコンテンツタイプに合わせてアスペクト比をテストすること


推奨サンプラー/スケジューラー組み合わせ

標準ComfyUI(内蔵):

Euler Ancestral + スケジューラー:

  • euler_ancestral + beta

  • euler_ancestral + kl_optimal

  • euler_ancestral + simple

DEIS 3M + スケジューラー:

  • deis_3m + beta

RES4LYFカスタムノード必須:

注意:これらの組み合わせにはComfyUIにRES4LYFカスタムノードをインストールする必要があります

Res 2S + スケジューラー:

  • res_2s + simple

  • res_2s + beta

  • res_2s + beta57

  • res_2s + bong_tanget

DEIS 3M + 高度なスケジューラー:

  • deis_3m + beta57

Lightningモデル統合(8ステップ):

サンプル画像で示されたように、Lightning 8ステップモデルと互換性あり。高品質を維持したまま超高速生成が可能。

インストール注意:

beta57bong_tangetスケジューラーおよびいくつかの高度なサンプラーを使用するには、ComfyUI環境にRES4LYFカスタムノードをインストールしてください。

品質考慮事項:

  • Betaスケジューラー:一般的に滑らかなグラデーションを提供

  • Simpleスケジューラー:高速推論と良好な品質

  • KL_optimal:ディテールの多いテクスチャに最適

  • Beta57:強化されたBetaスケジューラー(RES4LYF必要)

  • Bong_tanget:ユニークな芸術的効果のための実験的スケジューラー(RES4LYF必要)


使用ガイドライン

トリガーワード:

1nst4p1c - プロンプトの最初に必ず含めてください

Instagram最適化プロンプト構造:

  1. トリガーワード1nst4p1c

  2. 被写体とスタイル:Instagramインフルエンサー、カジュアルセルフィー、ライフスタイルショット

  3. 構図:縦向きフレーミング、クローズアップ、ミディアムショット、全身

  4. Instagram要素:スマホの可視化、リングライト、モダンな背景

  5. 照明:自然光、柔らかい照明、ゴールデンアワー、リングライト効果

  6. 美学:Instagramフィルター風、ソーシャルメディア向け、インフルエンサーレベル


技術仕様

トレーニングインフラ:

  • 主なツール:Diffusion Pipe

  • ベースアーキテクチャ:SD 1.5/SDXLモデルと互換性あり

  • 最適化:Instagram専用のスタイルと構成

  • ポストプロセッシング:ソーシャルメディア強化パイプライン

パフォーマンス特性:

  • メモリ使用量:4.4GB(V1オリジナル)/可変(ミックス版)/可変(SDXL)

  • 最適解像度:16で割り切れる任意の解像度

  • 推論速度:標準で30–40ステップ、Lightningモデルでは8ステップ

  • スタイル一貫性:Instagram美学に対する信頼性が高い


品質特長

Instagram美学:

  • 本物のソーシャルメディアスタイル

  • モバイル写真の見た目

  • モダンな構図技術

  • ソーシャルメディア向けカラーグレーディング

  • インフルエンサー風ポージング

技術的優秀性:

  • 縦型フォーマット最適化

  • 自然な被写界深度とシャープなフォーカス

  • 一貫した照明と露出

  • プロフェッショナルなモバイル写真のシミュレーション

  • スクリーンドア効果防止最適化

  • 高速生成用のLightningモデル互換性


システム要件と依存関係

ComfyUI要件:

  • 標準インストール:基本的なComfyUI設定

  • RES4LYFカスタムノード:高度なスケジューラ(beta57bong_tanget)および一部のサンプラーに必要

  • インストール方法:適切な設定にはRES4LYFのドキュメントに従ってください

スクリーンドア効果の防止:

  • 高さ1920ピクセル以上の解像度を避ける

  • 推奨されるサンプラー/スケジューラの組み合わせを使用する

  • アーティファクトが発生した場合は異なるCFGスケールをテストする

  • 高解像度でのテクスチャの不規則性を監視する

このモデルで生成された画像

画像が見つかりません。