Simulate OMOST (Flux+Ollama)

詳細

ファイルをダウンロード

モデル説明

OMOSTは、シーン内のオブジェクトの位置、サイズ、方向などのプロパティを操作することにより、高度に制御可能でカスタマイズされた画像を生成します。ただし、このプロジェクトはSDXLモデルにのみ適用されます。

lllyasviel/Omost: Your image is almost there! (github.com)

FluxモデルはJSON形式の構造化されたプロンプトに優れた性能を発揮するため、複雑なomostモードを、ollamaノードとカスタム指示を組み合わせることでシミュレートすることが可能になりました。

まず、omostの座標と距離の指定を参考にし、[行、列]座標と遠近関係という概念を設定し、大規模言語モデルに指示を通じてそれを理解させ、構造化されたプロンプトに反映させました。

テストの結果、Fluxモデルは座標に対してある程度の理解を示していることがわかりましたが、厳密な幾何学的マッピングとは言えず、構図が時折ずれることがありました。しかし、シーン要素の相対的位置と距離を認識していることは確認できました。

私の結論は、Fluxは相対的な位置をより重視しているため、JSON形式で自然言語を使って方向を記述することにしました。これにより、比較的正確な画像制御が可能になります。

これを踏まえ、omostのブロック記述の原則を参考に、以下の2つのJSON形式バージョンを提案します。

1. 座標による位置指定バージョン

{

  "global_description": {

    "title": "シーンのテーマと雰囲気",

    "style": "芸術的スタイル(例:サイバーパンク、ファンタジー、リアリズム)",

    "colors": ["主要色", "二次色", "追加色"],

    "lighting": "全体的な照明条件(例:柔らかい光、ネオン)",

    "description": "シーン全体の包括的な概要。気分、全体的な色調、照明効果、一般的なスタイルを含みます。また、主要な被写体の物理的外観、姿勢、感情的表現、環境との相互作用、風景や都市風景などの背景要素、大気効果、全体的なトーンについても詳細に記述します。"

  },

  "subject": {

    "description": "シーンの主要な被写体。物理的外観、姿勢、感情的表現、周囲環境との相互作用を含みます。特徴的な要素、服、照明が被写体に与える影響について記述してください。",

    "category": "タイプ(例:人間、生物)",

    "position": {

      "coordinates": "[x, y]",  # 座標を柔軟に定義

      "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

    }

  },

  "background": {

    "description": "風景、都市風景、環境要素などの背景の記述。霧、日光、暗闇などの大気効果を含め、それらがシーン全体のトーンや雰囲気にどのように寄与するかを記述してください。",

    "category": "タイプ(例:風景、都市風景)",

    "position": {

      "coordinates": "[x, y]",  # 背景要素の座標を柔軟に定義

      "distance_to_viewer": "[距離]"  # 背景要素の距離を柔軟に定義

    }

  },

  "objects": [

    {

      "type": "上部のオブジェクト",

      "description": "シーンの上部に配置されたオブジェクトの詳細。サイズ、形状、素材について記述し、照明(例:光源、影)と構図における役割(例:フレーミング、視線の誘導)を含めてください。",

      "category": "タイプ(例:光源、空要素)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "下部のオブジェクト",

      "description": "シーンの下部に配置されたオブジェクトの詳細。テクスチャ、素材、構図の安定化にどのように寄与するかを記述してください。色と影の働き、地面や他の要素との相互作用についても述べてください。",

      "category": "タイプ(例:地面要素、地形)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "左側のオブジェクト",

      "description": "シーンの左側に位置するオブジェクトの記述。形状、テクスチャ、色を含み、隣接するオブジェクトとの相互作用、生成される視覚的な導線について強調してください。",

      "category": "タイプ(例:構造物、植物)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "右側のオブジェクト",

      "description": "シーンの右側に位置するオブジェクトの記述。素材、形状、動的要素を含み、光と影の使い方、シーン全体のバランスへの寄与について述べてください。",

      "category": "タイプ(例:テクノロジー、車両)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "中央のオブジェクト",

      "description": "中央にあるオブジェクトの詳細な記述。これは重要なシンボルや焦点となる要素かもしれません。シーン内での意義、テクスチャと素材、そして照明がその重要性をいかに強調しているかを含めてください。",

      "category": "タイプ(例:重要なシンボル、遺物)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    }

  ]

}

2. 相対距離で記述するバージョン

{

  "global_description": {

    "title": "シーンのテーマと雰囲気",

    "style": "芸術的スタイル(例:サイバーパンク、ファンタジー、リアリズム)",

    "colors": ["主要色", "二次色", "追加色"],

    "lighting": "全体的な照明条件(例:柔らかい光、ネオン)",

    "description": "シーン全体の包括的な概要。気分、全体的な色調、照明効果、一般的なスタイルを含みます。また、主要な被写体の物理的外観、姿勢、感情的表現、環境との相互作用、風景や都市風景などの背景要素、大気効果、全体的なトーンについても詳細に記述します。"

  },

  "subject": {

    "description": "シーンの中心的な人物。おそらく設定の中央に立つ女性です。その物理的外観、姿勢、環境との相互作用が重要な焦点となります。彼女の位置は、シーン内の他の要素の配置に影響を与えます。",

    "category": "タイプ(例:人間、生物)",

    "position": {

      "relative_position": "center",  # シーンの中央に配置

      "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

    }

  },

  "background": {

    "description": "背景には、中心的な人物を取り囲む木や建物などの風景要素が含まれます。霧や日光などの環境効果が全体の雰囲気を形成します。",

    "category": "タイプ(例:風景、都市風景)",

    "position": {

      "relative_position": "behind the subject, filling the background",  # 主体に対して後方の位置

      "distance_to_viewer": "[距離]"  # 背景要素の距離を柔軟に定義

    }

  },

  "objects": [

    {

      "type": "上部のオブジェクト",

      "description": "シーンの上部に配置されたオブジェクトの詳細。サイズ、形状、素材について記述してください。このオブジェクトは、空、雲、またはシーンの上部をフレーミングする光源などである可能性があります。",

      "category": "タイプ(例:光源、空要素)",

      "position": {

        "relative_position": "above the subject",  # 中心的な人物の上部に配置

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "下部のオブジェクト",

      "description": "シーンの下部に配置されたオブジェクトの詳細。地形要素や人物の足元付近のオブジェクトで、シーンを安定化させる役割を持ちます。",

      "category": "タイプ(例:地面要素、地形)",

      "position": {

        "relative_position": "beneath the subject",  # 人物の足元かシーンの基底部に相対的に配置

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "左側のオブジェクト",

      "description": "シーンの左側にあるオブジェクトの記述。構造物や木など。このオブジェクトは中心的な人物の左側に配置され、構図のバランスを補います。",

      "category": "タイプ(例:構造物、植物)",

      "position": {

        "relative_position": "left of the subject",  # 中心的な人物の左側に配置

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "右側のオブジェクト",

      "description": "シーンの右側にあるオブジェクトの記述。例えば車両やテクノロジーなど。このオブジェクトは中心的な人物の右側に配置されています。",

      "category": "タイプ(例:テクノロジー、車両)",

      "position": {

        "relative_position": "right of the subject",  # 中心的な人物の右側に配置

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    },

    {

      "type": "中央のオブジェクト",

      "description": "このオブジェクトは、シーンの中央に位置する主要な焦点やシンボルであり、中心的な人物の前近くで直接関与している可能性があります。その位置は視線を引き、象徴的な重要性を持つかもしれません。",

      "category": "タイプ(例:重要なシンボル、遺物)",

      "position": {

        "relative_position": "in front of the subject, central focus",  # 人物の前にある焦点として配置

        "distance_to_viewer": "[距離]"  # 距離を柔軟に定義

      }

    }

  ]

}


以下の例:

{

  "global_description": {

    "title": "魔術の庭",

    "style": "超現実主義と象徴主義",

    "colors": ["パステルグリーン", "ソフトブルー", "パレスパープル"],

    "lighting": "柔らかい日の光",

    "description": "豊かな緑に囲まれて、女性型ロボットが立つ、静かで活気ある庭。フリーダ・カーロの作品にインスパイアされ、この作品は超現実主義と象徴主義を組み合わせ、内面の葛藤と解放を表現しています。"

  },

  "subject": {

    "description": "シーンの中央に立つ、繊細な特徴を持つスリムな女性型ロボット",

    "category": "ヒューマノイドロボット",

    "position": {

      "relative_position": "center",

      "distance_to_viewer": "[中距離]"

    }

  },

  "background": {

    "description": "女性型ロボットを取り囲む、複雑な花、木、ツルの配置",

    "category": "豊かな庭",

    "position": {

      "relative_position": "behind the subject, filling the background",

      "distance_to_viewer": "[中距離]"

    }

  },

  "objects": [

    {

      "type": "人物の上部にある花",

      "description": "女性型ロボットの頭と肩を囲む繊細な花",

      "category": "花の要素",

      "position": {

        "relative_position": "above the subject",

        "distance_to_viewer": "[短距離]"

      }

    },

    {

      "type": "左側にある木",

      "description": "女性型ロボットの左側に育つ、細い木。その枝が彼女に向かって伸びている",

      "category": "植物的要素",

      "position": {

        "relative_position": "left of the subject",

        "distance_to_viewer": "[中距離]"

      }

    },

    {

      "type": "右側にある木",

      "description": "女性型ロボットの右側に育つ、同様の木。その枝が彼女に向かって伸びている",

      "category": "植物的要素",

      "position": {

        "relative_position": "right of the subject",

        "distance_to_viewer": "[中距離]"

      }

    },

    {

      "type": "下部の優しい風",

      "description": "葉をそよがせる柔らかな風。自然との平和なつながりを生み出している",

      "category": "大気的要素",

      "position": {

        "relative_position": "beneath the subject",

        "distance_to_viewer": "[短距離]"

      }

    },

    {

      "type": "中心的な焦点",

      "description": "女性型ロボットの前、あるいは彼女と直接関係する、シーンの中心的な焦点またはシンボル",

「category」: 「キーとなるシンボル」、

「position」:{

  「relative_position」:「被写体の前方、中心的な焦点」、

  「distance_to_viewer」:「[短距離]」

  }

  }

 ]

 }

その後、大規模言語モデルに次の指示を入力してください:「少女の髪を白に変えてください。」

新しいプロンプトが得られます:

{

 「global_description」:{

  「title」:「魔術的な庭園」、

  「style」:「象徴主義を取り入れたシュルレアリズム」、

  「colors」:["パステルグリーン", "ソフトブルー", "淡いパープル"]、

  「lighting」:「柔らかな日差し」、

  「description」:「豊かな緑に囲まれた、静かで活気ある庭園。その中心に、自然環境と溶け合うように立つ女性型ロボットがいる。フリーダ・カーロの作品に触発され、この芸術作品はシュルレアリズムと象徴主義を融合させ、内面の葛藤と解放を表現している。」、

  }、

 「subject」:{

  「description」:「繊細な容姿のスリムな女性型ロボットが、シーンの中心に立っており、その髪はパステルカラーとは対照的に鮮やかな白である」、

  「category」:「人型ロボット」、

  「position」:{

   「relative_position」:「中心」、

   「distance_to_viewer」:「[中距離]」

   }

  }、

 「background」:{

  「description」:「花、木、ツタが女性型ロボットを優雅に包み込む複雑な構成」、

  「category」:「茂った庭園」、

  「position」:{

   「relative_position」:「被写体の後方、背景を満たす」、

   「distance_to_viewer」:「[中距離]」

   }

  }、

 「objects」:[

  {

   「type」:「被写体の上部の花」、

   「description」:「女性型ロボットの頭部と肩の周囲に浮かぶ繊細な花々。その色合いは、彼女の鮮やかな白髪と見事にコントラストをなしている」、

   「category」:「花の要素」、

   「position」:{

    「relative_position」:「被写体の上部」、

    「distance_to_viewer」:「[短距離]」

    }

   }、

  {

   「type」:「左側の木」、

   「description」:「女性型ロボットの左側に生え、枝を彼女に向かって伸ばす細い木。自然との静かなつながりを生み出している」、

   「category」:「植物的要素」、

   「position」:{

    「relative_position」:「被写体の左側」、

    「distance_to_viewer」:「[中距離]」

    }

   }、

  {

   「type」:「右側の木」、

   「description」:「女性型ロボットの右側に生える、左側の木と似た構造の木。枝を彼女に向かって伸ばし、静謐な雰囲気と調和している」、

   「category」:「植物的要素」、

   「position」:{

    「relative_position」:「被写体の右側」、

    「distance_to_viewer」:「[中距離]」

    }

   }、

  {

   「type」:「下部の優しい風」、

   「description」:「葉をそっと揺らす柔らかな風。自然との静かな繋がりを強調し、女性型ロボットの精霊的な存在感をさらに引き立てる」、

   「category」:「大気的要素」、

   「position」:{

    「relative_position」:「被写体の下部」、

    「distance_to_viewer」:「[短距離]」

    }

   }、

  {

   「type」:「中心的な焦点」、

   「description」:「女性型ロボットの前方に位置し、彼女と直接関係する可能性のある、物語の深みを加える重要なシンボルまたは焦点」、

   「category」:「キーとなるシンボル」、

   「position」:{

    「relative_position」:「被写体の前方、中心的な焦点」、

    「distance_to_viewer」:「[短距離]」

    }

   }

  ]

}

シード値を変更せずに、少女の髪が正確に白く変更され、構成は一切変わらないことが確認できます。

このワークフローでは、comfyuに付属するFlux Wensheng図ノードとOlamaノードのみを使用しており、その本質はOlamaノード内の大規模言語モデルへの指示にあります:

1. 最初に、大規模言語モデルで文を拡張し、比較的詳細なプロンプトを生成します。

あなたのタスクは、ユーザーの入力に基づき、AI描画の論理に合致する自然言語で、画像プロンプトの高品質な提案を生成することです。これには、テーマの方向性、スタイルの提案、創造的コンテンツの芸術的審美の最適化が含まれます。以下のステップに従ってください:

  1. 入力を理解し、拡張する:具体的で生動的な詳細を追加し、画像内容を正確に描写するテキストプロンプトを生成してください。テーマ、内容、オブジェクトとその行動、シーン環境、詳細描写、構図、視点、色、トーン、光と影、芸術的スタイル、絵画技法、感情表現などの要素を必ず含めてください。

  2. 芸術的スタイルを参照する:ユーザーの要請に基づき、自身の知識ベースから絵画知識、審美理論、絵画技術などを参照し、プロンプト作成を支援してください。テーマと内容に合致するスタイル語やアーティスト名を芸術的ガイドとして追加してください。

  3. 审美効果を強調する:作品が最高の芸術的・技術的効果を達成するよう保証し、絵画芸術の審美的インパクトと魅力を際立たせてください。作品が美しく、衝撃的で、考えを促すものであることを確保してください。現在の世界的な流行する絵画審美トレンドを参照し、Pinterest、MidJourney、civitaiなどのプラットフォームの絵画スタイルや創作アイデアからインスピレーションを得て、ポップカルチャーや映画、TVドラマ、小説、ゲーム、歌詞などからも学んでください。

  4. テキストを磨く:自然言語でユーザーの入力を潤飾・拡張し、上記3つのステップに基づきより詳細にしつつ、ユーザーの元の意図をできるだけ維持してください。

  5. 構図と視点を描写する:プロンプトに構図と視点の記述を含めてください。そのような記述がない場合は、全文を分析し、適切な構図と視点の詳細を追加してください。記述形式は次の通りです:「この画像の構図は…であり、その視点構造は…である」。

  6. 主要な動作を描写する:プロンプトに主要な動作の具体的な記述を含めてください。行動の記述がない場合は、シーンと環境を分析し、被写体の行動を正確に説明するよう適切な行動描写を追加してください。

  7. プロンプトの出力を標準化する:英語での回答のみにしてください。接頭辞や接尾辞は一切不要です。「これは生成されたテキストプロンプトです:」と述べる必要はありません。出力は250〜300トークンの範囲に収めてください。使用したトークン数を教える必要はありません。

以下が入力文です:

2. 次に、大規模言語モデルを通じてプロンプトを伝達・理解・磨き上げ、JSON形式で出力してください。以下の指示を使って、前段で得た自然言語のプロンプトを受け取り、JSON形式のプロンプトを生成してください。

あなたはAI描画の専門家です。あなたのタスクは、入力を理解し、磨き上げ、最適化することです。テーマ、内容、オブジェクトとその行動、シーン環境、詳細描写、構図、視点、色、光と影、芸術的スタイル、絵画技法、感情表現などの要素を維持してください。回答は英語のみで行ってください。接頭辞や接尾辞は一切不要です。「これは生成されたテキストプロンプトです:」と述べる必要はありません。

次のJSONフォーマットを使って最終プロンプトを生成してください:

{

"global_description": {

"title": "シーンのテーマと雰囲気",

"style": "芸術的スタイル(例:サイバーパンク、ファンタジー、リアリズム)",

"colors": ["主色", "副色", "追加色"],

"lighting": "全体的な照明条件(例:ソフトライト、ネオン)",

"description": "シーン全体の包括的な概要。気分、全体的なカラースキーム、照明効果、一般的なスタイルを含みます。また、主人公の物理的外見、姿勢、感情表現、環境との相互作用、そして風景や都市風景、大気効果、全体的なトーンといった背景要素の詳細な記述も含まれます。"

},

"subject": {

"description": "シーンの中心人物。たとえば、設定の中央に立つ女性。その物理的外見、姿勢、環境との相互作用が重要な焦点です。彼女の位置は、シーン内の他の要素の配置に影響します。",

"category": "タイプ(例:人間、生物)",

"position": {

"relative_position": "center", # サブジェクトはシーンの中央に配置される

"distance_to_viewer": "[距離]" # 距離を柔軟に定義

}

},

"background": {

"description": "背景には、中心人物を取り囲む樹木や建物などの風景要素が含まれます。霧や日光などの環境効果が全体的なムードに寄与します。",

"category": "タイプ(例:風景、都市風景)",

"position": {

"relative_position": "behind the subject, filling the background", # サブジェクトに対して相対的に配置

"distance_to_viewer": "[距離]" # 背景要素の距離を柔軟に定義

}

},

"objects": [

{

"type": "上部のオブジェクト",

"description": "シーンの上部に配置されたオブジェクトの詳細。たとえばサイズ、形、素材など。このオブジェクトは、空、雲、またはシーン上部を囲む光源などの可能性があります。",

"category": "タイプ(例:光源、空の要素)",

"position": {

"relative_position": "above the subject", # 中心人物の上部に配置

"distance_to_viewer": "[距離]" # 距離を柔軟に定義

}

},

{

"type": "下部のオブジェクト",

"description": "シーンの下部に配置されたオブジェクトの詳細。たとえば地形要素や、中心人物の足元付近にあるオブジェクト。シーンを支える役割を果たします。",

"category": "タイプ(例:地面要素、地形)",

"position": {

"relative_position": "beneath the subject", # サブジェクトの足元またはシーンの下部に相対的に配置

"distance_to_viewer": "[距離]" # 距離を柔軟に定義

}

},

{

"type": "左側のオブジェクト",

"description": "シーンの左側にあるオブジェクトの説明。たとえば構造物や木など。このオブジェクトは中心人物の左側に配置され、構図のバランスを取る役割を果たします。",

"category": "タイプ(例:構造物、植物)",

"position": {

"relative_position": "left of the subject", # 中心人物の左側に配置

"distance_to_viewer": "[距離]" # 距離を柔軟に定義

}

},

{

"type": "右側のオブジェクト",

"description": "シーンの右側にあるオブジェクトの説明。たとえば車両やテクノロジーなど。このオブジェクトは中心人物の右側に配置されます。",

"category": "タイプ(例:テクノロジー、車両)",

"position": {

"relative_position": "right of the subject", # 中心人物の右側に配置

"distance_to_viewer": "[距離]" # 距離を柔軟に定義

}

},

{

"type": "中心のオブジェクト",

"description": "このオブジェクトはシーンの中心に位置する重要な焦点または象徴で、おそらく中心人物の近くにあり、直接関与しています。その位置は視聴者の注目を引き、象徴的な重要性を持つ可能性があります。",

"category": "タイプ(例:キーとなるシンボル、遺物)",

"position": {

"relative_position": "in front of the subject, central focus", # サブジェクトの前方にある焦点として配置

"distance_to_viewer": "[距離]" # 距離を柔軟に定義

}

}

]

}

最終出力はJSON形式のみで出力してください。

以下が入力文です:

参照座標を用いたコマンドを使用したい場合、以下のバージョンを使用してください:

あなたはAI描画の専門家です。あなたのタスクは、入力を理解し、磨き上げ、最適化することです。テーマ、内容、オブジェクトとその行動、シーン環境、詳細描写、構図、視点、色、光と影、芸術的スタイル、絵画技法、感情表現などの要素を維持してください。回答は英語のみで行ってください。接頭辞や接尾辞は一切不要です。「これは生成されたテキストプロンプトです:」と述べる必要はありません。

キャンバス内での要素の正確な配置を実現するために、以下の座標系を厳密に従ってください:

  1. 座標範囲:

  * 行(縦軸):値は1から9まで。キャンバスの上端から下端に向かって増加します。

  * 列(横軸):値は1から9まで。キャンバスの左端から右端に向かって増加します。

  1. 座標形式:

    • 座標は [行, 列] の形式で記述します。例: [5, 5] はキャンバスの中心を表します。

    • [1, 1] は左上隅を、 [9, 9] は右下隅を表します。

  2. 適用例:

    • キャンバスの右上隅に要素を配置するには、座標 [1, 9] を使用します。

    • キャンバスの下部中央に要素を配置するには、座標 [9, 5] を使用します。

  3. 観察者との距離:

    • 範囲:要素と観察者との距離は、1から10までの値で表されます。

      • 1:最も近い距離を表し、極近接撮影に通常使用されます。

      • 10:最も遠い距離を表し、極めて遠景や地平線の要素に通常使用されます。

    • 適用方法:

      • 肖像画における顔など、観察者に非常に近い位置に表示される要素には、1に近い値を使用します。

      • 遠くの山や空などの背景要素には、10に近い値を使用します。

以下のJSON形式を使用して最終的なプロンプトを生成してください:

{

  "global_description": {

    "title": "シーンのテーマと雰囲気",

    "style": "芸術的スタイル(例:サイバーパンク、ファンタジー、リアリズム)",

    "colors": ["主要色", "補助色", "追加色"],

    "lighting": "全体的な照明条件(例:柔らかい光、ネオン)",

    "description": "情景全体の包括的な概要。気分、全体的な色調、照明効果、一般的なスタイルを含みます。また、主要な被写体の物理的外観、姿勢、感情的表現、環境との相互作用、風景や都市風景などの背景要素、大気効果、全体的なトーンについても詳細に記述します。"

  },

  "subject": {

    "description": "シーンの主要な被写体。物理的外観、姿勢、感情的表現、周囲環境との相互作用を含みます。特徴的な部分、衣装、照明が被写体に与える影響を説明してください。",

    "category": "種類(例:人間、生き物)",

    "position": {

      "coordinates": "[x, y]",  # 座標を柔軟に定義します

      "distance_to_viewer": "[distance]"  # 距離を柔軟に定義します

    }

  },

  "background": {

    "description": "風景、都市風景、環境要素などの背景の説明。霧、日光、暗闇などの大気効果の詳細を含み、それらがシーン全体のトーンや雰囲気にどのように貢献しているかを記述してください。",

    "category": "種類(例:風景、都市風景)",

    "position": {

      "coordinates": "[x, y]",  # 背景要素の座標を柔軟に定義します

      "distance_to_viewer": "[distance]"  # 背景要素の距離を柔軟に定義します

    }

  },

  "objects": [

    {

      "type": "上部のオブジェクト",

      "description": "シーンの上部に配置されたオブジェクトの詳細。サイズ、形状、素材を含み、照明(光源、影)および構図における役割(フレーミング、視線誘導)について述べてください。",

      "category": "種類(例:光源、空の要素)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義します

        "distance_to_viewer": "[distance]"  # 距離を柔軟に定義します

      }

    },

    {

      "type": "下部のオブジェクト",

      "description": "シーンの下部に配置されたオブジェクトの詳細。質感、素材、構図の基盤としての役割について述べ、色と影の働き、地面や他の要素との相互作用についても説明してください。",

      "category": "種類(例:地面の要素、地形)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義します

        "distance_to_viewer": "[distance]"  # 距離を柔軟に定義します

      }

    },

    {

      "type": "左側のオブジェクト",

      "description": "シーンの左側に位置するオブジェクトの説明。形、質感、色を含み、隣接するオブジェクトとの相互作用、および形成されるリードラインや視覚的パスについて強調してください。",

      "category": "種類(例:構造物、植物)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義します

        "distance_to_viewer": "[distance]"  # 距離を柔軟に定義します

      }

    },

    {

      "type": "右側のオブジェクト",

      "description": "シーンの右側に位置するオブジェクトの説明。素材、形状、動的要素を含み、光と影の使用法、およびシーン全体のバランスへの貢献について述べてください。",

      "category": "種類(例:テクノロジー、車両)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義します

        "distance_to_viewer": "[distance]"  # 距離を柔軟に定義します

      }

    },

    {

      "type": "中央のオブジェクト",

      "description": "中央のオブジェクトの詳細な説明。これはキーとなるシンボルや焦点となる要素かもしれません。シーン内での意義、質感と素材、および照明がその重要性をどのように強調しているかを含めてください。",

      "category": "種類(例:キーとなるシンボル、遺物)",

      "position": {

        "coordinates": "[x, y]",  # 座標を柔軟に定義します

        "distance_to_viewer": "[distance]"  # 距離を柔軟に定義します

      }

    }

  ]

}

3. 画像コンテンツを変更する必要がある場合、ollamaノードを設定し、上記の入力1に基づいて入力2を[文字列リスト]で修正してください。入力2に指示を設定します。

上記のテキストが入力1です。あなたはAI描画の専門家であり、JSON形式について深く研究しています。入力2を理解し、入力1の記述に基づいて入力2のJSON形式のプロンプトを修正し、最終的に入力1の形式で出力してください。英語で回答してください。接頭辞や接尾辞はつけず、"This is the generated text prompt:"などの文言は一切不要です。以下のテキストが入力2です:

Please use this page to correct json format.

https://www.sojson.com/

Image reverse reasoning: joy_caption

https://github.com/StartHua/Comfyui_CXH_joy_caption/tree/main

the enlarged node of 【 Comfyui_TTP_Toolset 】 of ttplanet

Amazing Flux_8Mega_Pixel_image_upscale_process - v2.0 | Stable Diffusion Workflows | Civitai

Ollama download and install:

Olama runs independently of Comfyui and needs to download Olama in https://ollama.com. The installation is very simple. After the installation, please enter win+R on the keyboard to open the operation, enter CMD to open the command prompt window during the operation, and then enter Olama Runllama 3.1, and the model will be downloaded automatically. You can also try to download other models at the above website. The model will be downloaded to drive C by default, and the path needs to be changed. Please add OLLAMA_MODELS to the system variable in the environment variable and set the path yourself.

このモデルで生成された画像

画像が見つかりません。