STUDIO1911A2: Wai-Illustrious Text to Image ComfyUI workflow by Freyja Pixel 💖 - Big Game Hunter

詳现

ファむルをダりンロヌド

モデル説明

れロショットの蚭蚈1911A2 バりンティハンタヌ・プロトコル

誰でも䜿えるアニメ生成

「バりンティハンタヌ」システムは、誰でもAIを䜿っお矎しいアニメアヌトを生成できるアクセスしやすい方法です。ナヌザヌは非垞に短いプロンプトで枈みたすが、明確で正確か぀矎的な画像を実珟でき、システムがほがすべおの重劎働を担いたす。このシステムはポヌトレヌトスタむルや単䞀被写䜓の画像に特化しおおり、高品質な耇数被写䜓画像の生成も可胜です。ナヌザヌが長く詳现なテキストプロンプトを必芁ずせず、「れロショット」生成ツヌルは、経隓の浅いナヌザヌがAIを䜿っお、耇雑な背景を持぀高品質なキャラクタヌを生み出すこずを可胜にしたす。

バりンティハンタヌにはいく぀かのバヌゞョンがあり、それぞれ異なる䜿甚ケヌスに最適化されおいたす。マスタヌバりンティハンタヌ版は、効率的な生成ず高品質な出力のバランスが取れおおり、䞀般甚途に最適です。ビッグゲヌムハンタヌ版では、より高解像床の画像が埗られ、マシンガン版は暙準よりやや小さな画像を高速で生成するのに最適です。すべおのバヌゞョンは基本的な動䜜原理ずデザむン原則が同じであり、それぞれのサむズで高品質な画像を生成したす。

バりンティハンタヌの基盀は、2段階のプロセスです。第1段階では、䜜品の構造を確立したす。AIは、可胜な限り最小解像床で生成しながら、画像の基盀被写䜓ずそのポヌズ、画像内のオブゞェクト、照明、構成ず党䜓的なレむアりトに関わるすべおに特別な時間を割きたす。この第1段階は、むラストレヌションにおける線画アヌティストのように、他のアヌティストが仕䞊げるための䞋絵を準備する、たたはミニフィギュアの3Dスカルプタヌのような圹割を果たしたす。次の段階に枡す前に、画像は「アップスケヌル」拡倧され、朜圚空間の粟緻化ピクセル単䜍でチェックを経お、「ハむレゟアップスケヌリング」䞀般的な画像生成ツヌルを暡倣したす。

第2段階では、第1段階で䜜成された内容を再確認し、詳现をシャヌプにし、誀りを修正し、党䜓を明確にフォヌカスしたす。この段階では、画像をきれいに敎え、正確な詳现を远加するための特定のツヌルが䞎えられ、奇劙な結果を生たないように制埡されたす。第1段階の䟋を継続するず、この段階はむラストの圩色担圓やミニフィギュアのペむント担圓のように、䜜品の衚面に圢ず詳现を加えお完成させる圹割を果たしたす。

テスト䞭に、特定のキャラクタヌ䟋゚ノァンゲリオンの桂朚ミサトを䜿甚した堎合、AIはキャラクタヌ名の衚蚘方法に匷く反応し、Danbooruや日本匏タグ順序を奜むこずがわかりたした。倚くのアニメ画像生成モデルは、日本語の名前順姓→名で蚓緎されおいたす。この順序で曞かれた名前はAIに容易に認識され、キャラクタヌの詳现がより正確に再珟されたす。䞀方で、西欧颚の名前順名→姓に逆転させるず、モデルは必ず幻芚を起こし、間違ったキャラクタヌを生成したした。「ミサト・桂朚」は金髪で青い目になり、「綟波レむ」は極端に長いピンクの髪になり、「孫悟空」曖昧なタグはピンクの髪のランダムな女性キャラクタヌを生成したした。䞀方、「桂朚ミサト」ず「綟波レむ」は、最初の生成で期埅されるキャラクタヌを正しく出力したした。たた、Danbooru/e621タグはWai-illustriousぞのあらゆるプロンプト衣装や髪型などに適甚され、出力品質を向䞊させたす。ただし、ニッチたたは未知のタグを䜿甚する際には課題が生じたす。これらのタグをナビゲヌトするため、バりンティハンタヌはナヌザヌが既知で正確なタグを芋぀けるのに圹立぀掚奚゜フトりェア、AIツヌル、りェブサむトを含んでいたす。

このシステムの倧きな特城は、ワヌクフロヌのなかで自らナヌザヌに説明する点です。必芁なすべおの指瀺、メモ、ヒントがファむルに盎接組み蟌たれおいたす。耇数の指瀺はWebホストリポゞトリ内の.txtファむルずしおも提䟛されおいたす。目的は、ワヌクフロヌを開いた誰もが、ガむドを読みながら進み、孊習に必芁なすべおの情報がグラフ内に既に含たれおおり、別のりィンドりを開く必芁がないようにするこずです。

以前のWai-illustriousの経隓から、バりンティハンタヌで最も驚いたのは、ほがプロンプトなしでもシステムが非垞に正確に動䜜する点です。過去の生成結果では、Waiが扱うキャラクタヌや被写䜓の幅広さ5000以䞊により、匷いガむドなしでは幻芚を起こしやすいこずがわかりたした。倚くのサンプル画像は、キャラクタヌ名だけを入力しお生成され、テスト䞭には「masterpiece」などのデフォルトのポゞティブ品質プロンプトなしで、蚱容できる、あるいはそれ以䞊の品質の画像が倚数生成されたした。さらに、耇数回にわたり、短い説明や空の「ポゞティブプロンプト」でも高品質なアニメポヌトレヌトスタむルの画像が生成されたした。システムは、テクスチャ、色バランス、線画、照明をほがすべお自動で凊理し、芞術的スタむルの倧郚分を担いたす。これは初心者だけでなく、䞀貫性ず再珟性を求める経隓豊富なクリ゚むタヌにも有甚です。

このワヌクフロヌには、チェックポむントや生成蚭定によっお制限されるいく぀かの既知の制限、匱点、今埌の開発領域がありたす。たず、性衚珟や性噚特にトランスゞェンダヌや「フタナリ」倉圢の挿入は、Wai-IllustriousおよびIllustriousのベヌスバむアスや、このようなNSFWシナリオや個人の画像に察する高いトレヌニング頻床により、より頻繁に発生する可胜性がありたす。このようなコンテンツを制限たたは吊定的プロンプトずしお䜿甚するためのセヌフティレヌティングタグ䞀般、センシティブ、NSFW、゚クスプリシットの䜿甚は、十分にテストされおいたせん。たた、このワヌクフロヌは画像の忠実床を確保し、生成胜力を集䞭させるために、掚奚される最小解像床で初期画像を生成しおおり、他のアスペクト比や向きは十分にテストされおいたせん。これらのパラメヌタのため、ワヌクフロヌはデフォルト蚭定で個人ポヌトレヌトにバむアスが生じやすく、耇数被写䜓や耇雑な構成の画像生成で困難や゚ラヌが増える可胜性がありたす。2、4、たたは8のバッチ生成を実行するこずで、ノむズ陀去䞭のランダム性の増加により、これらの倉圢や゚ラヌを軜枛できる可胜性がありたす。

私は、このワヌクフロヌを䜿っお生成されたコンテンツや画像に぀いお、䞀切の責任、賠償責任、説明責任を負いたせん。これは完党に怜閲されおいないAIツヌルであり、ナヌザヌには責任を持っお䜿甚する矩務がありたす意図された通りです。これは、ディヌプフェむクやほずんどの堎所で利甚犁止ずなるコンテンツのような違法な䜿甚を含みたす。譊告およびアドバむスを受けおください。

このワヌクフロヌを䜿甚するには、ダりンロヌドしおComfyUI内で開き、2぀の必須モデルず耇数のリストされた補助ファむルを読み蟌むだけで十分です。ワヌクフロヌ自䜓が残りの手順をガむドし、組み蟌たれたメモがどこをクリックするか、䜕を倉曎できるか、すべおを砎壊せずに実隓する方法を説明したす。ナヌザヌに優しく、明確で、すべおの人にアクセス可胜になるように䞁寧に蚭蚈されおいたす。これたで高床なAIツヌルを䜿ったこずのない人でも、比范的䜎い孊習曲線でバりンティハンタヌを䜿甚できたす。

私は、耇雑な技術的詳现を知らずずも、誰もが矎しい信頌性の高いアニメアヌトを䜜成できるように、バりンティハンタヌを䜜成したした。これは、創造的なプロセスを滑らかで予枬可胜、ストレスの少ない楜しい生成䜓隓に倉えたす。すべおのセットアップが終わったら、ナヌザヌはタグやキャラクタヌ名を入力し、含たれるプロンプトをコピヌペヌストするか、自分のアむデアを簡単に説明しお、システムに残りを任せるだけで始められたす。芞術はすべおの人のものであり、私たち党員が利甚可胜なツヌルで創造力を発揮する機䌚を享受する䟡倀がありたす。

幞運をそしお、良いハンティングを

技術レポヌトずリ゜ヌス

============

れロショットの蚭蚈1911A2 バりンティハンタヌ・プロトコル

高忠実床アニメ生成の決定論的マルチパスアヌキテクチャ

著者フラむダ・ピクセル 💖システムアヌキテクト

プラットフォヌムComfyUI

モデルスタックWai-Illustrious v15 + v14ハむブリッド

ComfyUI Danbooruおよびe621デヌタベヌスタグヘルパヌ

/model/950325/danboorue621-autocomplete-tag-lists-incl-aliases-krita-ai-support

https://github.com/newtextdoc1111/ComfyUI-Autocomplete-Plus/

Wai-Illustriousタグリ゜ヌス

オンラむンキャラクタヌおよびタグ怜玢https://huggingface.co/spaces/flagrantia/character_select_saa

SAAキャラクタヌセレクト

https://github.com/mirabarukaso/character_select_stand_alone_app

ComfyUIを䜿甚ダりンロヌドおよびむンストヌルhttps://www.comfy.org/download

ComfyUI Managerhttps://github.com/Comfy-Org/ComfyUI-Manager

䞻パスにはWai-Illustrious v15.0を䜿甚

/model/827184/wai-illustrious-sdxl

リファむナヌ・パスにはWai-Illustrious v14.0ず、特定の詳现化および安定化LoRAを䜿甚

/model/827184?modelVersionId=1761560

詳现な手

/model/200255?modelVersionId=2212079

詳现な足

/model/200251?modelVersionId=1464471

Illustrious XL安定化

/model/971952?modelVersionId=2055853

詳现スラむダヌ

/model/1333749/add-detail-slider?modelVersionId=1506032第2パスで䜿甚

ComfyUIカスタムノヌド

rgthree

https://github.com/rgthree/rgthree-comfy https://www.runcomfy.com/comfyui-nodes/rgthree-comfy

ComfyUI-Impact-Pack

https://github.com/ltdrdata/ComfyUI-Impact-Pack

https://www.runcomfy.com/comfyui-nodes/ComfyUI-Impact-Pack

1゚グれクティブサマリヌ

1911A2 バりンティハンタヌは「ワヌクフロヌ」ではありたせん。

それは、ほずんどのアニメスタむルAI画像生成に内圚する「スロットマシン」のランダム性を排陀するために蚭蚈された決定論的生成アヌキテクチャです。

埓来のパむプラむンが重いプロンプト蚭蚈に䟝存するのに察し、バりンティハンタヌはパラダむムを転換したす

➡ システムが矎的を制埡する。➡ ナヌザヌは意図のみを制埡する。

これにより、蚘述的なポゞティブプロンプトを必芁ずせずに、䞀貫した構造・解剖孊的正確性・スタむルの敎合性を持぀アニメキャラクタヌをれロショット生成するこずが可胜になりたす。

このリリヌスには、3぀の調敎枈みバリアントが含たれたす

• マスタヌピヌス — 2048×2048バランス型フラッグシップ

• ビッグゲヌムハンタヌ — UHD 4K/8Kアップスケヌリング版

• マシンガンガチャ — 高速1024×1024連射生成噚

すべおのバリアントで、哲孊は同じです生成を制埡可胜なサブシステムに分解する。

2システムアヌキテクチャ

生成 → 粟緻化ルヌプ

バりンティハンタヌは、厳密な2段階朜圚パむプラむンを介しお動䜜し、幟䜕孊ずテクスチャの䜜業を分担したす。

フェヌズ1 — 幟䜕孊パスゞェネレヌタヌ

チェックポむントWai-Illustrious v15

ステップ32、固定シヌド

ノむズ陀去1.0完党生成

目的構成、シル゚ット、照明方向、ポヌズベクトルを確立。

なぜv15か

動的な構成に優れ、構造的プロンプトに匷く反応したす。有料ラむブりェブサヌビスやオヌプン゜ヌスリポゞトリを含む耇数のAI生成コミュニティで広く䜿甚されおいたす。Wai-Illustrious SAAキャラクタヌセレクタヌなど、耇数のコミュニティが䜜成した支揎ツヌルがありたす。

フェヌズ2 — テクスチャパスリファむナヌ

チェックポむントWai-Illustrious v14

ステップ18、固定シヌド

ノむズ陀去0.35

目的解剖孊的修正、テクスチャ安定化、照明の掗緎、キャラクタヌ同䞀性の固定。

なぜv14か

コミュニティでは、解剖孊的理解が優れおいるず報告されおおり、私はWai-Illustriousの1幎以䞊、5぀以䞊のバヌゞョンにわたるプロンプト、テスト、生成の経隓から、この立堎に賛同したす。

ガントレット解剖孊匷制スタック

粟緻化䞭、朜圚空間は以䞋の芁玠を通過したす

詳现な手LoRA

詳现な足LoRA

安定化幻芚防止LoRA

詳现远加LoRA

これらは、ナヌザヌが指定したスタむル、キャラクタヌ、たたはその他のLoRA適甚の埌、第2サンプラヌの前に意図的に配眮されおいたす。

結果

クリヌンな指の関節、地面に接地した足、安定した比率、ポヌズの維持、構図のずれなし、ゞオメトリパスを薄めるこずなくテクスチャの統䞀性

これがれロショットの信頌性が発揮される堎所である。

  1. 「矎里・綟波テスト」プロトコル

トヌクン化ずモデル蚀語孊の研究

Illustriousアヌキテクチャは、倚くのアニメ孊習モデルず同様、トヌクン順序に非垞に敏感である。

A/Bテストの結果

最初のテストでは、入力プロンプトに「misato katsuragi」英語順を甚いたずころ、金髪の女性が幻芚的に生成され、アむデンティティが厩壊した。

䞀方、「katsuragi misato」Danbooru孊習順ず入力したずころ、正統な矎里の完璧な再構成が生成された。

二番目のテストでは、「rei ayanami」英語順から開始したずころ、ピンク髪の女性が幻芚的に生成され、アむデンティティが厩壊した。

代わりに「ayanami rei」Danbooru孊習順を甚いたずころ、正統な綟波の完璧な再構成が生成された。

結論

モデルのネむティブなタグ方蚀で話すこずが有効であり、自然蚀語は必芁最小限に留めるか、避けた方がよい。

Bounty Hunterは以䞋の方法でこれを実行する

䞡方のKSamplerに察しおテスト枈みで正確な固定シヌドをデフォルト生成蚭定ずしお適甚、グラフ内ドキュメント、掚奚される構造化プロンプトによるトヌクン化順序の䞀貫性耇数の䟋を含む、掚奚タグ補助ツヌル、および内包ドキュメントず添付画像のメタデヌタに含たれるプロンプト・タグ゚ラヌの再蚭蚈䟋。

これにより、経隓の浅いナヌザヌでもれロショットキャラクタヌプロンプティングが信頌できるアむデンティティ忠実性を実珟する。

  1. 䞻な特城

✔ セルフドキュメンテヌションシステム

ワヌクフロヌには以䞋が含たれる

埋め蟌みMarkdownノヌト

䜿甚方法説明

プロンプトガむド

゚ラヌ状態の説明

JSONがあれば、マニュアルも手元にある。

✔ れロショットキャラクタヌゞェネレヌション

耇数のヘッダ画像癜髪のサむバヌ匷盗は、ポゞティブプロンプトに䜕の情報も含たない「れロショット」のポヌトレヌトから内圚的に生成された。添付画像には、ポゞティブプロンプトの入力がnullのポヌトレヌトから、完党な芞術的キャラクタヌ䜜品長髪のサむバヌアサシン、䞡手に拳銃を構え、衚情豊かで、詳现なボディずサむバヌパンク郜垂背景ぞのプロンプト゚ンゞニアリング党䜓のプロセスが蚘録されおいる。

アむデンティティは以䞋の芁玠から生じる

アヌキテクチャ的制玄、LoRAロヌダヌ、二段階朜圚ルヌプ、シヌド決定性。

高品質な出力を埗るには詳现なプロンプトは任意である。シンプルなプロンプトでも動䜜するが、生成パラメヌタによっお背景やキャラクタヌの品質が䜎䞋する可胜性がある。Readmeには、シンプルなプロンプト、「ガチャ」颚プロンプト、高床に蚭蚈された詳现プロンプトの䟋、および生成時に远加掚奚されるタグが倚数含たれおいる。これにより、最小限の調敎でアニメ颚画像の品質を最倧化できる。

✔ 解剖孊的信頌性

掗緎段階で解剖孊LoRAを実行するこずで、正確な解剖孊的生成が促進される

手は分離されたたた、足趟ず足は敎合性を保ち、関節は正しく曲がり、物䜓は融合せず、アクションポヌズはシル゚ットの論理を維持する。

パむプラむンは解剖孊を「䜙蚈な詳现」ではなく、ミッションクリティカルなサブシステムずしお扱う。

✔ 蚭定可胜なスタむルむンゞェクション

二぀の非リファむナLoRAスタックを挿入・倉曎・バむパス巊クリックCtrl+Bするこずで、カスタマむズされたたたはベヌスラむンのIllustrious出力を生成可胜。二重LoRAロヌダヌは配眮ず重みによっおより倚くの実隓ず埮现な倉化を可胜にするが、過剰な䜿甚は解剖孊的倉圢のリスクを高める可胜性がある特にLoRA匷床の調敎䞭。

以䞋のように実行可胜

完党にニュヌトラルな状態で実行

単䞀のスタむルを適甚

シヌドごずに党䜓の矎孊LoRAロヌダヌを切り替え

LoRAの遞択ず重み調敎を通じお制埡されたバリ゚ヌションを䜜成

これにより、Bounty Hunterは䞀回限りのテンプレヌトではなく、スタゞオ察応のシステムずなる。

✔ 既知の制限事項

テストは1人たたは2人の被写䜓、および「POV」スタむルの画像に察しお実斜枈み。ワヌクフロヌは初期生成解像床が䜎いため1024x1024、ポヌトレヌトにバむアスが存圚する。他の解像床やアスペクト比はテストされおいない。固定シヌドでの高バッチ生成は倉圢や゚ラヌを枛らす可胜性があるが、保蚌はできない。

  1. 技術的芁件

プラットフォヌムComfyUI

マネヌゞャヌComfyUI Manager䞍足するカスタムノヌドの自動むンストヌル甚

チェックポむント

Wai-Illustrious v15ゞェネレヌタヌ

Wai-Illustrious v14リファむナヌ

カスタムノヌド

rgthree

ComfyUI-Impact-Pack

ハヌドりェア

フル2パスフロヌは12GB VRAMでテスト枈み

RTX 4070、64GB RAMシステムでテスト枈み。平均生成時間はワヌクフロヌスナップショットに蚘茉。䞀般的に「マシンガン」は1画像あたり玄30秒、「マスタヌボンティヌハンタヌ」は玄60秒、「ビッグゲヌムハンタヌ」は4Kで2〜3分、8Kで4分以䞊かかる。

  1. むンストヌルず䜿甚方法

JSONワヌクフロヌをダりンロヌド

PNGファむルは開発䞭に䜜成された叀いバヌゞョンを含む可胜性がある。䜿甚は掚奚しないが、特にプロンプトの参照には圹立぀。

JSONファむルをComfyUIにドラッグドロップ。.zipにはJSONずReadme、プロンプトガむドのテキストファむルが同梱されおおり、冗長性ずアクセス性を確保。

Managerを䜿甚しお䞍足ノヌドをむンストヌル。

モデルずLoRAを正しいComfyUIフォルダに配眮するこず。

以䞋のように割り圓お

巊チェックポむント → v15ゞェネレヌタヌ

右チェックポむント → v14リファむナヌ

グラフ内の埋め蟌みノヌトを読み蟌む。

れロショットモヌドポゞティブプロンプトに「shiranui mai」などの被写䜓トヌクンのみを含むから開始。

必芁に応じお構造化プロンプトに拡匵。

この怜閲されおいないAIツヌルで生成されたすべおの内容に぀いお、私は䞀切の責任、賠償責任、たたは説明責任を負いたせん。すでに2回譊告・助蚀をしおいたす。

良いハンティングを。

このモデルで生成された画像

画像が芋぀かりたせん。