InstaPic

詳細

ファイルをダウンロード

モデル説明

InstaPic

このチェックポイントの目的は、ソーシャルメディア用コンテンツ作成に最適化された高品質な画像を生成することです。このマージは、私がトレーニングしたLoRAに基づいて行われたため、この説明にはLoRAの詳細も含まれています。


テスト

画像はこちら


モデルバージョンとトレーニング詳細

トレーニング概要:

開発中に4つの異なるバージョンをトレーニングしました。それぞれ異なるアプローチとデータセットを使用していますが、バージョン1ミックスバージョン(V1+V3) のみをリリースします。なぜなら、ミックスバージョンはV1単体よりも優れた結果を示したからです。

[InstaPic V1 - 基礎版]

主要トレーニング仕様:

  • データセット:プロフェッショナルなポストプロダクションを施した600枚の厳選されたリアル画像

  • ランク:256(約4.4GBのLoRAファイルに相当)

  • トレーニングツール:最適化されたパラメータを使用したDiffusion Pipe

  • 焦点:Instagramスタイルのコンテンツとソーシャルメディアの美学

  • 解像度最適化:縦型Instagramフォーマットに特化してトレーニング

高ランク(256)は、品質保持の実験的調査として実施しました。このオリジナルバージョンはInstagramスタイル生成の基礎を築きます。

[InstaPic ミックス(V1+V3)- 強化版]

高度な統合トレーニング:

  • ベース:バージョン1のデータセット

  • 強化:バージョン3のSDXL強化トレーニングデータと統合

  • 品質V1単体よりも優れた結果

  • トレーニング:包括的なスタイルカバーを実現するマージトレーニング手法

[バージョンV2 & V4 - 実験版]

  • V2:高ボリュームトレーニング実験(17,000枚の画像、低解像度)

  • V4:StyleGANとVTONデータセットとのマルチソース融合

  • 状態開発用のみ - リリース予定なし

  • 目的:今後のバージョンのための研究・開発


利用可能なモデル形式

リリース済みバージョン:

InstaPic V1(オリジナル):

  • ランク256 - 4.4GB - 基礎モデル

InstaPic ミックス(V1+V3)- 推奨:

  • FP16 - 最高品質のフル精度バージョン

  • FP8 E3M4FN - 品質を維持した最適化圧縮バージョン

SDXLスタイルLoRA:

  • InstaPic Style SDXL - Big Love SDXLモデルを使用して画像→画像処理したV1画像でトレーニングされた強化版。詳細度とSDXL最適化品質が向上しています。

事前マージ済み Qwen Imageベースモデル:

オリジナルLoRAが埋め込まれた、即時利用可能なマージ済みバージョン:

  • BF16(フル精度)- 最高品質、ファイルサイズ大

  • Q8(高品質)- 品質と効率の優れたバランス

  • Q6(バランス型)- 良好な品質と中程度の圧縮

  • Q4(効率型)- 良好な品質で最速の推論


🧩 プロンプトテンプレート(データセットスタイル)

最高品質を達成するには、以下のデータセットのキャプションスタイルに基づくテンプレートをご使用ください:

1nst4p1c [髪の詳細な説明]の女性が、[具体的な衣装アイテム]を着て、
[具体的なポーズ/位置]で[詳細な場所]にいます。
彼女は[表情]で、[手/身体の位置]をしています。
[身体の可視性/衣装の詳細]。
背景は[特定の要素を含む詳細な背景説明]です。
照明は[照明タイプ]で、[照明の効果]があります。
全体的な美学は[美学の説明]です。
画像は[構図の詳細]でよく構成されています。
カメラの角度は[特定の角度]で、被写体を[方向]から見ています。
被写界深度は[深度の説明]で、[焦点の詳細]があります。

例(データセットスタイル):

1. ベッドルームカジュアル

1nst4p1c 長い黒髪の女性が、白いクロップトップとレースのショートパンツを着て、ラップトップを膝の上に乗せてベッドに足を組んで座っています。彼女の表情は無表情で、指がキーボードに軽く置かれています。身体はほとんど見え、クロップトップで腹部が見えています。鎖骨に小さなタトゥーが見えています。背景にはぼやけたストリングライトと本が並ぶ木製の棚が見えます。照明は柔らかく拡散されており、肌に温かみのあるトーンを作り出しています。全体的な美学はカジュアルでややセクシーです。画像はよく構成されており、浅い被写界深度で女性に焦点を当て、背景は柔らかくぼやけています。カメラの角度はやや上方から、被写体を見下ろしています。

2. 都市部の屋上

1nst4p1c 長い波状の赤髪の女性が、黒のレザージャケットと破れたジーンズを着て、屋上の縁に立っています。彼女の表情は無表情で、手は手すりに置かれています。身体は少し観客から離れた角度を向いていますが、視線はカメラに向かっています。手首には小さな星のタトゥーが見えます。背景にはぼやけた都市のライトとコンクリートの建物、金属構造が見えます。照明は柔らかく拡散され、夕焼けの温かい金色のトーンが含まれています。全体的な美学は都会的で少しエッジの効いたスタイルです。画像はよく構成されており、女性は鮮明に焦点が合わせられ、背景はややぼやけています。カメラの角度は目線レベルで、被写体を正面から捉えています。

3. プールエリア

1nst4p1c 長い金髪を緩やかに波动させた女性が、花柄のビキニトップとマッチングのボトムを着て、プールの縁に座っています。彼女の表情は無表情で、手は身体を支えながら少し後ろに倒れています。脚は水に部分的に浸かっています。背景は青緑のプールの水とぼやけたパームツリー、プールサイドの家具です。照明は明るい自然光で、肌にハイライトを作り出しています。全体的な美学は夏らしくリラックスした雰囲気です。画像はよく構成されており、浅い被写界深度で女性に焦点が合わされています。カメラの角度はやや上方から、被写体を見下ろしています。

4. 工業的空間

1nst4p1c 長い黒髪の女性が、黒のビキニトップとフィッシュネットストッキングを着て、コンクリートの壁の近くでポーズをとっています。彼女の表情は無表情で、両手は顔の近くに置かれています。身体はほとんど見え、フィッシュネットストッキングが構図にテクスチャーを加えています。背景はぼやけた建設現場で、オレンジ〜茶色の壁と金属の足場が見えます。照明は柔らかく拡散され、ハッキリした影はありません。全体的な美学はカジュアルで少しエッジの効いたスタイルです。画像はよく構成されており、女性は鮮明に焦点が合わされ、背景は柔らかくぼやけています。カメラの角度はやや上方から、被写体を見下ろしています。

5. 自然の屋外

1nst4p1c 長い暗い髪の女性が、黒のストライプ入り黄色の水着を着て、水辺の岩の近くに立っています。彼女の表情は無表情で、両手は体の横にあります。身体はほとんど見え、水着は体にぴったりとフィットしています。背景にはぼやけた岩と水、自然の植物が見えます。照明は柔らかい自然光で、肌全体に均一な明るさをもたらしています。全体的な美学はミニマリズムで自然です。画像はよく構成されており、女性の身体は観客から少し角度をつけていますが、視線はカメラに向かっています。被写界深度は浅く、女性は鮮明に焦点が合わされ、背景はややぼやけています。

キーとなるデータセット要素(品質にとって非常に重要):

  • 具体的な衣装の詳細(ビキニトップ/ボトム、クロップトップなど)

  • 正確なポーズの説明(足を組んで座る、膝をつく、立ち寄るなど)

  • 身体の可視性の記述(「身体はほとんど見えている」、「ただの水着だけを着ている」など)

  • 工業的・都市的背景(建設現場、コンクリート、金属など)

  • 照明は常に「柔らかく拡散された」

  • 「よく構成されている」は常に含める

  • 特定のカメラアングル(やや上方から、見下ろす)

  • 被写界深度は常に記述する

LoRA推奨:

最高品質を得るには、ミックス(V1+V3)バージョンを使用してください。これはオリジナルのV1単体よりも優れた品質を示しています。


最適な解像度設定

推奨Instagram解像度:

  • ストーリーズ/リール:1080 x 1920(9:16アスペクト比)

  • 代替縦型:1088 x 1920(トレーニング最適化)

  • 投稿:1080 x 1350(4:5アスペクト比)

  • 正方形投稿:1080 x 1080(1:1アスペクト比)

高品質解像度(16で割り切れる):

  • 1536 x 1024 - 横長フォーマット

  • 1024 x 1536 - 縦長フォーマット

  • 1536 x 864 - ワイドフォーマット

  • 864 x 1536 - タールフォーマット

  • 1152 x 1536 - 代替縦長

  • 1536 x 1152 - 代替横長

解像度ガイドライン:

  • すべての解像度は16で割り切れる必要があります(最適な処理のため)

  • スクリーンドア効果を避けるため、過剰な高解像度は避けてください

  • Authentic Instagram美学には縦型フォーマットを推奨

  • このモデルには「高さ > 幅」の比率が最適です

  • さまざまなコンテンツタイプに合わせてアスペクト比をテストしてください


推奨サンプラー/スケジューラーの組み合わせ

標準ComfyUI(組み込み):

Euler Ancestral + スケジューラー:

  • euler_ancestral + beta

  • euler_ancestral + kl_optimal

  • euler_ancestral + simple

DEIS 3M + スケジューラー:

  • deis_3m + beta

RES4LYFカスタムノード必須:

注:これらの組み合わせにはComfyUIへのRES4LYFカスタムノードのインストールが必要です

Res 2S + スケジューラー:

  • res_2s + simple

  • res_2s + beta

  • res_2s + beta57

  • res_2s + bong_tanget

DEIS 3M + 高度なスケジューラー:

  • deis_3m + beta57

Lightningモデル統合(8ステップ):

サンプル画像で示されたように、Lightning 8ステップモデルと互換性があります。品質を維持しながら超高速生成を実現します。

インストール注意点:

beta57bong_tangetスケジューラーおよび一部の高度なサンプラーを使用するには、ComfyUI環境にRES4LYFカスタムノードをインストールしてください。

品質考慮事項:

  • Betaスケジューラー:一般的に滑らかなグラデーションを提供

  • Simpleスケジューラー:高速推論かつ良好な品質

  • KL_optimal:詳細なテクスチャに最適

  • Beta57:強化されたBetaスケジューラー(RES4LYF必須)

  • Bong_tanget:独自の芸術的効果を生み出す実験的スケジューラー(RES4LYF必須)


使用ガイドライン

トリガーワード:

1nst4p1c - プロンプトの冒頭には必ず含めてください

Instagram最適化プロンプト構造:

  1. トリガーワード1nst4p1c

  2. 被写体とスタイル:Instagramインフルエンサー、カジュアルセルフィー、ライフスタイルショット

  3. 構図:縦型フレーミング、クローズアップ、ミディアムショット、フルボディ

  4. Instagram要素:スマホが見える、リングライト、モダンな背景

  5. 照明:自然光、柔らかい照明、ゴールデンアワー、リングライト効果

  6. 美学:Instagramフィルター風、ソーシャルメディア対応、インフルエンサースタイル


技術仕様

トレーニングインフラ:

  • 主要ツール:Diffusion Pipe

  • ベースアーキテクチャ:SD 1.5/SDXLモデルと互換

  • 最適化:Instagram特有のスタイルと構図

  • ポストプロセッシング:ソーシャルメディア強化パイプライン

パフォーマンス特性:

  • メモリ使用量:4.4GB(V1オリジナル)/ 可変(ミックスバージョン)/ 可変(SDXL)

  • 最適解像度:16で割り切れる任意の解像度

  • 推論速度:標準30-40ステップ、Lightningモデルでは8ステップ

  • スタイルの一貫性:Instagram美学に対して高い信頼性


品質機能

Instagram美学:

  • オーセンティックなソーシャルメディアスタイル

  • モバイル写真風

  • モダンな構図技法

  • ソーシャルメディアカラーグレーディング

  • インフルエンサースタイルのポージング

技術的優れた点:

  • 縦型フォーマット最適化

  • 自然な被写界深度で鮮明な焦点

  • 一貫した照明と露出

  • プロフェッショナルモバイル写真のシミュレーション

  • スクリーンドア効果軽減最適化

  • 高速生成のためのLightningモデル互換性


システム要件と依存関係

ComfyUI要件:

  • 標準インストール:基本的なComfyUI設定

  • RES4LYFカスタムノード:高度なスケジューラー(beta57bong_tanget)および一部のサンプラーが必要

  • インストール:RES4LYFのドキュメントに従って正しく設定してください

スクリーンドア効果防止:

  • 高さ1920を超える解像度は避けてください

  • 推奨のサンプラー/スケジューラー組み合わせを使用してください

  • アーチファクトが現れた場合は異なるCFGスケールをテストしてください

  • 高解像度でのテクスチャの不規則性を監視してください

このモデルで生成された画像

画像が見つかりません。