FLUX KONTEXT + PULID (EXPERIMENTAL)

詳細

ファイルをダウンロード

モデル説明

必ずお読みください!:

これは、pulid + redux + kontextを用いて顔と細部に高精度を実現することを目的とした実験的ワークフローです。

Flux kontextは一貫性を保つためのものであり、このワークフローでは顔の向きを変更することはできません。結果は入力画像に非常に依存します。つまり、環境は顔の位置に適したものでなければなりません。カメラに向かって正面を向いている場合、その状況に適したプロンプトを作成する必要があります。たとえば、入力画像がカメラを向いていれば、人物の横顔や後ろ姿を生成することはできません。これがこのワークフローを機能させるための最初の重要なルールです。

このワークフローは全身ショットには対応していません。ミディアムポートレートまたはクローズアップポートレート用に設計されています。

------------------------------------------------------------------------------------------------------------------

--- 低VRAM(6GB以下)用 ---

最初のサンプラーと2番目のサンプラーの両方で実行すると「メモリ不足」エラーが発生する可能性があります。その場合は、ワークフローを再実行してください。直到エラーが出なくなるまで繰り返してください。このワークフローは6GB VRAMで実行できるように設計されています。

--- デバイスエラー -----

これは実験的なものであるため、pulidでこのエラーが発生する可能性があります。私のComfyUIバージョンはv0.3.43です。私には動作しています。

-----------------------------------------------------------------------------------------------------------------

ダウンサンプリング因子(primitive)は重要で、参照画像の一致性を調整します。値を1に近づけると、オリジナル画像とより同一に、5に近づけるとプロンプトの指示に従った結果になります。推奨値は3〜4、あるいは5です。

-----------------------------------------------------------------------------------------------------------------

読むことを推奨する追加の注意点:

一部のウェブサイトの結果では、顔の一貫性が80%〜93%を達成しています。

顔にあまりにもズームインした画像をアップロードしないでください。キャラクターがミディアムポートレートの状態で、カメラに近すぎず、遠すぎない画像をアップロードしてください。OPENARTにアップロードした参照画像のようにしてください。

「2番目のサンプラー」であるHighres Groupは、顔の詳細を増やし、一貫性を高めるためのものです。使用を推奨しますが、クローズアップポートレートの場合は、最初のサンプラーだけで十分な場合があります。

全身ショットの作成は避けてください。これはポートレート用に設計されています。

Flux kontextは画像を生成するためのものではなく、「編集」するためのものです。完全に新しい画像を生成するのは、私の経験では別のタスクです。

このkontextでは、画像に「GPTのような」画像が入力されていると感じられます。FLUXの「リアリズム」のようなものではありません。そのため非現実的で「プラスチックのような」見た目になる問題が生じます。これを解決するには優れたLoRAが必要ですが、現時点では存在しません。

そこで、このワークフローではFlux Dev LoRAを使用しています。効果はありますか?はい、ただし強度を上げると画像がぼやけます。推奨値は最大1です。ちなみにLoRAを使用しないと、出力画像の顔はぼやけにくくなりますが、「プラスチック感」が再発します。

このタスクでは、私は1つのLoRAのみを使用してプラスチック感を軽減しています。以下にリンクを提供します。

LoRA(プロンプトにキーワードを必ず含めてください):

https://huggingface.co/prithivMLmods/Canopus-LoRA-Flux-UltraRealism-2.0/tree/main

LoRAのキーワード:Ultra realistic

----------------------------------------------------------------------------------------------

このワークフローに関するあなたの実験結果をお待ちしています。

この内容が気に入ったら、私のYouTubeチャンネルを購読してください:https://www.youtube.com/@AITold/videos

----------------------------------------------------------------------------------------------------------

このワークフローでうまく機能するプロンプトの例構造:

1- 超リアルisticな全身ショット。魅惑的なヘーゼルグリーンの瞳と自然なそばかすを備えた美しく、孤独な女性が、夜の汚れた24時間ダイナーの、古びた赤いビニール席に一人で座っている。カメラはテーブルを挟んで少し傾いた角度で、まるで同伴者が撮影したかのように配置されている。彼女はシンプルで大きめのグレーフーディーと快適なジーンズを着ており、繊細なベージュの編み上げネットのショールは席の背もたれにかけられている。両手で濃いセラミックのマグカップにブラックコーヒーを抱え、大きな窓の外の雨に濡れた街灯を見つめ、静かな悲しみに満ちた表情をしている。テーブルは、丸めたナプキンと半分食べられたパイで散らかっている。照明は、テーブル上のジュkeボックスの温かく黄色い光と、ダイナーの天井の冷たい青白色の蛍光灯が混ざり合い、複数の衝突する影を作り出している。低光量のため、画像はわずかにグレインが入っている。雰囲気は静かな深夜の内省的なもの。

2- 超リアルisticなミディアムショット。深夜のオンライン通話の、グレインとピクセル化されたスクリーンショット風。魅惑的なヘーゼルグリーンの瞳と自然なそばかすを備えた美しい女性が、薄暗い部屋のデスクに座っている。彼女はウェブカメラを直視しており、つまり視聴者を見つめている。疲れたが集中した、引き込まれるような表情だ。唯一の照明は、コンピューターモニターの冷たい青白い光で、彼女の顔に鋭いデジタルの輝きを落とし、深い影を生み出している。快適なルーズフィットのTシャツを着ており、繊細なベージュの編み上げネットのショールは椅子の背もたれにかかっている。背景は、本棚の隅、壁のポスター、そして雑然とした部屋の様子がぼんやりと映っている。画像の品質は意図的に低く、圧縮アーティファクトとデジタルノイズが明確に見える。まさに「アマチュア」ウェブカメラの美的感覚を完璧に捉えている。

3- 超リアルisticなポートレート。魅惑的なヘーゼルグリーンの瞳と自然なそばかすを備えた美しい女性が、夜の明るく無機質な24時間コンビニエンスストアの店内で、アマチュア写真のようなカジュアルで不自然なスタイルで撮影されている。写真は友人が彼女の気付かない瞬間を捉えたかのように、低い角度から撮られている。主な光源は、苛立たしい緑みがかった天井の蛍光灯で、彼女の目とあごの下に深い不自然な影を生み出し、肌を蒼白に見せている。彼女は通路に立ち、片手にチップスの袋、もう片手にソーダを握り、カメラを見上げて少し不機嫌な、「今、写真を撮ってるの?」という表情をしている。繊細なベージュの編み上げネットのショールは、シンプルなTシャツの上にゆるく羽織られており、明るくカラフルなブランドスナックの包装とまったく不釣り合いだ。彼女の特徴的な赤みがかったオレンジのビーズのネックレスとゴールドのペンダントが、平凡な環境とぶつかり合っている。構図はズレており、照明の悪さで色が薄れている。雰囲気は、不協和な日常の現実そのもの。

4- 超リアルisticなミディアムショット。魅惑的なヘーゼルグリーンの瞳と自然なそばかすを備えた美しい女性が、公園のベンチに座り、本を読んでいる最中に誰かに遮られた瞬間を捉えた、アマチュア写真のような侵入的なスタイルで撮影されている。彼女は膝の上に本を置いたまま、カメラを持っている人をまっすぐ見つめ、やや不満げで疑問に思ったような表情をしている。昼間の強い太陽が木の葉を透過し、彼女の顔や服に散らばった明るいスポットと深い影を生み出している。シンプルなサンダルドレスを着ており、繊細なベージュの編み上げネットのショールはベンチの隣に置かれている。カメラの焦点はややぼやけており、構図はバランスが悪く、一方の側に余白が多すぎている。この写真は、公共の場で突然中断された、本物のポーズのない瞬間を捉えている。

5- 超リアルisticなミディアムポートレート。魅惑的なヘーゼルグリーンの瞳と自然なそばかすを備えた美しい女性が、混雑した屋外のストリートフェアで、アマチュア写真のような混沌としたスナップショットスタイルで撮影されている。彼女はカメラをまっすぐ見つめており、表情は驚きとほのかな笑みが混ざったカジュアルなものだ。シンプルなサマードレスを着ている。正午の強い太陽が頭上にあり、目に深い「ラクーン」の影を生み出している。背景は、通りを歩く人々、カラフルな屋台テント、そしてランダムな物に反射する眩しい日差しの、雑然としたぼんやりしたボケの世界だ。構図は不完全で、隣の人の肩がフレームの端に侵入している。この写真は、にぎやかで忙しい1日の、一瞬だけの本物の瞬間を盗み撮ったような感覚だ。

このモデルで生成された画像

画像が見つかりません。