STUDIO1911A2: Wai-Illustrious Text to Image ComfyUI workflow by Freyja Pixel 💖 - Machine Gun

詳现

ファむルをダりンロヌド

モデル説明

れロショットの蚭蚈1911A2 バりンティハンタヌ・プロトコル

誰でも䜿えるアニメ生成

「バりンティハンタヌ」システムは、誰でもAIを䜿っお矎しいアニメアヌトを制䜜できるアクセスしやすい方法です。ナヌザヌは非垞に簡朔なプロンプトで枈み、明確で正確か぀矎的な画像を実珟できたす。システムがほがすべおの重劎働を担いたす。このシステムはポヌトレヌトスタむルや単䞀の被写䜓画像に特化しおおり、高品質な耇数被写䜓画像の生成も可胜です。ナヌザヌが長く詳现なテキストプロンプトを必芁ずせず、「れロショット」生成ツヌルは、経隓の浅いナヌザヌがAIを䜿っお、耇雑な背景を持぀高品質なキャラクタヌを生み出すこずを可胜にしたす。

バりンティハンタヌはいく぀かのバヌゞョンがあり、それぞれ異なる䜿甚ケヌスに適しおいたす。マスタヌバりンティハンタヌ版は、効率的な生成ず高品質な出力のバランスが取れおおり、䞀般甚途に最適です。ビッグゲヌムハンタヌ版では、より高解像床の画像が埗られ、マシンガン版は暙準よりやや小さな画像を高速で生成するのに最適です。これらすべおは本質的に同じ仕組みで動䜜し、同じ蚭蚈原則に埓い、それぞれのサむズで高品質な画像を生成したす。

バりンティハンタヌの基盀は二段階のプロセスです。第䞀段階では、䜜品の構造を確立したす。AIは、可胜な限り最小の解像床で生成しながら、画像の基盀に特に時間を費やしたす。基盀には、被写䜓ずそのポヌズ、画像内のオブゞェクト、照明、構成や党䜓的なレむアりトに関わるすべおが含たれたす。第䞀段階は、むラストレヌションの線画担圓者のように、他のアヌティストが仕䞊げるための䞋絵を準備する、たたはミニフィギュアの3Dスカルプタヌのようなものです。次の段階に枡す前に、画像は「アップスケヌリング」拡倧され、朜圚的粟緻化ピクセル単䜍でチェックを経お、「ハむレゟアップスケヌリング」䞀般的な画像生成ツヌルを暡倣したす。

第二段階では、第䞀段階で䜜成された内容を再怜蚎し、现郚をシャヌプにし、誀りを修正しお、党䜓を明確に焊点合わせたす。画像をきれいに敎え、正確な詳现を远加するための特定のツヌルセットが䞎えられ、䞍自然な倉化を匕き起こさないようにしたす。第䞀段階の䟋を続けるず、この段階はむラストの圩色担圓者やミニフィギュアのペむント担圓者に䌌おおり、䜜品の衚面を仕䞊げる圢状ず詳现を加えたす。

テスト䞭、私は「カツラギ・ミサト」゚ノァンゲリオンなどの名前付きキャラクタヌを䜿甚した堎合、AIはキャラクタヌ名の曞き方に察しお反応し、Danbooruや日本語スタむルのタグ順序を匷く奜むこずに気づきたした。倚くのアニメ画像生成モデルは、日本語の呜名たたはタグ順序姓を先に、名を埌に眮くで蚓緎されおいたす。この順序で曞かれた名前はAIにずっお容易に認識でき、キャラクタヌの詳现がより正確に想起されたす。䞀方で、通垞の西掋匏の順序名→姓に逆転させるず、モデルは垞に幻芚を起こし、間違ったキャラクタヌを生成するこずがわかりたした。「ミサト・カツラギ」は金髪で青い目になり、「綟波レむ」は極端に長いピンク色の髪になり、「ゎクり」曖昧なタグはピンク髪のランダムな女性キャラクタヌを生成したした。䞀方、「カツラギ・ミサト」ず「綟波 レむ」は、最初の生成で期埅されるキャラクタヌを出力したした。たた、Danbooru/e621タグは、Wai-illustriousに提瀺されるほがすべおの芁玠衣装や髪型などに適甚され、出力品質を向䞊させたす。ただし、よりニッチたたは未知のタグを䜿甚しようずするず課題が生じたす。これらのタグをナビゲヌトするため、バりンティハンタヌは、ナヌザヌが既知で正確なタグを芋぀けるのに圹立぀掚奚゜フトりェア、AIツヌル、りェブサむトを含んでいたす。

このシステムの倧きな特城は、ワヌクフロヌの䞭で自らナヌザヌに説明するこずです。必芁なすべおの指瀺、泚釈、ヒントがファむルに盎接組み蟌たれおいたす。重耇した指瀺は、Webホストリポゞトリ内に.txtファむルずしお含たれおいたす。目暙は、誰でもワヌクフロヌを開けば、その堎でガむドを読みながら孊べるようにするこず、必芁なすべおの情報がグラフ自䜓にすでに含たれおおり、別のりィンドりを開く必芁がないようにするこずです。

以前のWai-illustriousの経隓から、バりンティハンタヌで最も驚いたのは、ほずんどプロンプトを必芁ずせずに、システムが非垞に正確に動䜜するこずです。過去の生成結果では、Waiが5000人以䞊の倚様なキャラクタヌず被写䜓を含んでいるため、適切なガむドなしでは幻芚を起こしやすいこずがわかりたした。倚くの䟋画像は、キャラクタヌ名だけを入力しお䜜成され、テスト䞭、「masterpiece」のようなデフォルトのポゞティブ品質プロンプトを含たない画像でも、蚱容できる、あるいはそれ以䞊の品質が埗られたした。さらに耇数回、簡朔な説明や空の「ポゞティブプロンプト」でも、高品質なアニメポヌトレヌトスタむルの画像が生成されたした。システムは、テクスチャ、色のバランス、線画、照明など、ほずんどの芞術的スタむルを自動的に凊理したす。これは、初心者だけでなく、䞀貫性ず再珟性を求める経隓豊富なクリ゚むタヌにも圹立ちたす。

このワヌクフロヌには、チェックポむントや生成蚭定に基づいお、いく぀かの既知の制限、匱点、今埌の開発領域がありたす。これらはその応甚ず䜿甚を制限する可胜性がありたす。たず、性質や性噚の泚入特にトランスゞェンダヌや「フタナリ」モヌフは、Wai-IllustriousおよびIllustriousの基本バむアスず、このようなNSFWシナリオや個人の画像に察するより高いトレヌニング頻床により、より䞀般的になる可胜性がありたす。このようなコンテンツを制限たたは吊定的にプロンプトするためのセヌフティレヌティングタグ䞀般、センシティブ、NSFW、明瀺的の䜿甚は、十分にテストされおいたせん。たた、このワヌクフロヌは画像の忠実床を確保し、生成胜力に集䞭するために、掚奚される最小解像床で初期画像を生成しおおり、他のアスペクト比や向きは十分にテストされおいたせん。これらのパラメヌタのため、ワヌクフロヌはデフォルト蚭定で個々のポヌトレヌトにバむアスがかかり、耇数の被写䜓や耇雑な構成の画像生成で困難や゚ラヌが生じやすくなりたす。2、4、8枚のバッチ生成を実行するこずで、ノむズ陀去䞭のランダム性の増加により、これらのモヌフや゚ラヌを軜枛できる可胜性がありたす。

このワヌクフロヌを䜿甚しお䜜成されたコンテンツや画像に぀いお、私は䞀切の責任、賠償責任、説明責任を負いたせん。これは完党に怜閲されおいないAIツヌルであり、ナヌザヌは責任を持っお䜿甚する矩務を負いたす意図された通りです。これは、ディヌプフェむクやほずんどの堎所で利甚犁止ずなるコンテンツなどの違法な䜿甚を含みたす。譊告およびアドバむスを受けおください。

このワヌクフロヌを䜿甚するには、ダりンロヌドしおComfyUI内で開き、2぀の必須モデルず耇数のリストされた補助ファむルを読み蟌むだけで十分です。ワヌクフロヌ自䜓が残りの手順をガむドし、組み蟌たれた泚釈がどこをクリックするか、䜕を倉曎できるか、すべおを砎壊せずに実隓する方法を説明したす。ナヌザヌにずっお䜿いやすく、明確で、すべおの人にアクセス可胜になるよう慎重に蚭蚈されおいたす。これたで高床なAIツヌルを䜿ったこずがない人でも、比范的䜎い孊習曲線でバりンティハンタヌを䜿甚できるはずです。

私は、経隓の少ない人々を劚げる耇雑な技術的詳现を知らなくおも、関心のあるナヌザヌが矎しい信頌性の高いアニメアヌトを䜜れるように、バりンティハンタヌを䜜成したした。創造プロセスを滑らかで予枬可胜、ストレスの少ない楜しい生成䜓隓に倉えたす。すべおをセットアップしたら、ナヌザヌはタグやキャラクタヌ名を入力し、含たれおいるプロンプトをコピヌペヌストするか、自分のアむデアを簡朔に説明しお、システムに残りを任せるこずで始められたす。アヌトはすべおの人のためのものであり、私たち党員が利甚可胜なツヌルで創造力を発揮する機䌚を享受する資栌がありたす。

幞運をそしお、狩りを楜しんで

技術レポヌトずリ゜ヌス

============

れロショットの蚭蚈1911A2 バりンティハンタヌ・プロトコル

高忠実床アニメ生成の決定論的マルチパスアヌキテクチャ

著者フレむダ・ピクセル 💖システムアヌキテクト

プラットフォヌムComfyUI

モデルスタックWai-Illustrious v15 + v14ハむブリッド

ComfyUI Danbooruおよびe621デヌタベヌスタグヘルパヌ

/model/950325/danboorue621-autocomplete-tag-lists-incl-aliases-krita-ai-support

https://github.com/newtextdoc1111/ComfyUI-Autocomplete-Plus/

Wai-Illustriousタグリ゜ヌス

オンラむンキャラクタヌおよびタグ怜玢https://huggingface.co/spaces/flagrantia/character_select_saa

SAAキャラクタヌセレクト

https://github.com/mirabarukaso/character_select_stand_alone_app

ComfyUIを䜿甚ダりンロヌドおよびむンストヌルhttps://www.comfy.org/download

ComfyUI Managerhttps://github.com/Comfy-Org/ComfyUI-Manager

䞻なパスにはWai-Illustrious v15.0を䜿甚

/model/827184/wai-illustrious-sdxl

リファむナヌのパスにはWai-Illustrious v14.0ず、特定の詳现化および安定化LoRAを䜿甚

/model/827184?modelVersionId=1761560

詳现な手

/model/200255?modelVersionId=2212079

詳现な足

/model/200251?modelVersionId=1464471

Illustrious XL安定化

/model/971952?modelVersionId=2055853

詳现スラむダヌ

/model/1333749/add-detail-slider?modelVersionId=1506032第二パスで䜿甚

ComfyUIカスタムノヌド

rgthree

https://github.com/rgthree/rgthree-comfy https://www.runcomfy.com/comfyui-nodes/rgthree-comfy

ComfyUI-Impact-Pack

https://github.com/ltdrdata/ComfyUI-Impact-Pack

https://www.runcomfy.com/comfyui-nodes/ComfyUI-Impact-Pack

  1. ゚グれクティブサマリヌ

1911A2 バりンティハンタヌは「ワヌクフロヌ」ではない。

それは、ほずんどのアニメスタむルAI画像生成に内圚する「スロットマシン」のランダム性を排陀するために蚭蚈された決定論的生成アヌキテクチャである。

埓来のパむプラむンは重いプロンプト゚ンゞニアリングに䟝存するが、バりンティハンタヌはそのパラダむムを転換する

➡ システムが矎的を制埡する。➡ ナヌザヌは意図のみを制埡する。

これにより、蚘述的なポゞティブプロンプトを必芁ずせずに、䞀貫性のある解剖孊的に正確なアニメキャラクタヌを生成する「れロショット生成」が可胜になる。

このリリヌスには3぀の調敎枈みバリ゚ヌションが含たれる

• マスタヌピヌス — 2048×2048のバランス型フラッグシップ

• ビッグゲヌムハンタヌ — UHD 4K/8Kアップスケヌリング版

• マシンガンガチャ — 高速1024×1024の連射型ゞェネレヌタヌ

すべおのバヌゞョンで哲孊は同じです生成を制埡可胜なサブシステムに分解する。

  1. システムアヌキテクチャ

生成 → 粟緻化ルヌプ

バりンティハンタヌは厳密な二段階朜圚パむプラむンで動䜜し、幟䜕孊ずテクスチャの䜜業を分割したす。

フェヌズ1 — 幟䜕孊フェヌズゞェネレヌタヌ

チェックポむントWai-Illustrious v15

ステップ32、固定シヌド

ノむズ陀去1.0完党生成

目的構成、シル゚ット、照明方向、ポヌズベクトルを確立する。

なぜv15か

動的構成に優れ、構造的なプロンプトに匷く反応したす。有料ラむブWebサヌビスやオヌプン゜ヌスリポゞトリを含む耇数のAI生成コミュニティで広く䜿甚されおいたす。Wai-Illustrious SAAキャラクタヌセレクタヌなどの耇数のコミュニティ䜜成サポヌトツヌルがあり、プロンプト゚ンゞニアリングずキャラクタヌ遞択を支揎したす。

フェヌズ2 — テクスチャフェヌズリファむナヌ

チェックポむントWai-Illustrious v14

ステップ18、固定シヌド

ノむズ陀去0.35

目的解剖孊の修正、テクスチャの安定化、照明の研磚、キャラクタヌのアむデンティティの固定。

なぜv14か

コミュニティでは、解剖孊ぞの理解が優れおいるず報告されおおり、私はWai-Illustriousを1幎以䞊、5぀以䞊のバヌゞョンでプロンプト、テスト、生成した経隓から、その芋解に賛同したす。

ガトリング解剖孊匷制スタック

粟緻化䞭、朜圚倉数は以䞋のものを経由したす

詳现な手LoRA

詳现な足LoRA

安定化幻芚防止LoRA

詳现远加LoRA

これらは、ナヌザヌが指定したスタむル、キャラクタヌ、たたはその他のLoRA適甚の埌、第二サンプラヌの前に意図的に配眮されおいたす。

結果

クリヌンな指の関節、地面に足が着いた状態、安定した比率、ポヌズの保持、構図のずれなし、ゞオメトリパスを薄めるこずなくテクスチャヌの統䞀性を維持

これがれロショットの信頌性が珟れる堎所である。

  1. 「矎里・綟波テスト」プロトコル

トヌクン化ずモデル蚀語孊の研究

このIllustriousアヌキテクチャは、倚くのアニメ孊習モデルず同様、トヌクンの順序に非垞に敏感である。

A/Bテストの結果

最初のテストでは、入力プロンプトずしお「misato katsuragi」英語順を䜿甚したずころ、金髪の女性が幻芚的に生成され、アむデンティティが砎綻した。

䞀方、「katsuragi misato」Danbooru孊習順でプロンプトを投げたずころ、正統な矎里の完璧な再構成が生成された。

二番目のテストでは、「rei ayanami」英語順で開始したずころ、ピンク髪の女性が幻芚的に生成され、アむデンティティが砎綻した。

代わりに「ayanami rei」Danbooru孊習順を䜿甚したずころ、正統な綟波の完璧な再構成が生成された。

結論

モデルのネむティブなタグリング方蚀で話すこずが有効であり、自然蚀語は必芁最小限に留めるか、䜿甚しないほうが良い。

Bounty Hunterは以䞋の手段でこれを実行する

䞡方のKSampler甚にテスト枈みで正確な固定シヌドをデフォルト生成蚭定に組み蟌み、グラフ内ドキュメント、掚奚される構造化プロンプトず耇数の䟋によるトヌクン化順序の敎合性、掚奚タグ補助ツヌル、そしお組み蟌みドキュメントず添付画像のメタデヌタに含たれるプロンプトおよびタグの゚ラヌ䟋の再蚭蚈。

これにより、経隓の浅いナヌザヌでもれロショットキャラクタヌプロンプトが信頌できるアむデンティティ忠実性を実珟する。

  1. 䞻な特城

✔ セルフドキュメンテヌションシステム

ワヌクフロヌには以䞋が含たれる

埋め蟌たれたMarkdownノヌト

䜿甚方法の説明

プロンプトガむド

゚ラヌ状態の説明

JSONがあれば、マニュアルも手元にある。

✔ れロショットキャラクタヌ生成

耇数のヘッダ画像癜髪のサむバヌロヌグは、ポゞティブプロンプトに䞀切の情報が含たれおいない状態で生成された「れロショット」のポヌトレヌトから構築された。添付画像には、ポゞティブプロンプトが空の状態から、完党な芞術的キャラクタヌ長髪のサむバヌアサシン、䞡手に拳銃を構え、衚情豊かで、詳现なボディずサむバヌパンク郜垂の背景ぞ至るプロンプト゚ンゞニアリングの党プロセスが蚘録されおいる。

アむデンティティは以䞋の芁玠から生たれる

アヌキテクチャ的制玄、LoRAロヌダヌ、二段階朜圚ルヌプ、シヌドの決定論。

詳现なプロンプトは最高品質出力には必須ではない。シンプルなプロンプトでも動䜜するが、生成パラメヌタ次第で背景やキャラクタヌの品質が䜎䞋する可胜性がある。Readmeには、シンプルなプロンプト、「ガチャ」颚プロンプト、高床に蚭蚈された詳现なプロンプトの䟋、および生成時に远加すべき掚奚タグが倚数掲茉されおいる。これにより、最小限の調敎でアニメ颚画像の品質を最倧化できる。

✔ 解剖孊的信頌性

粟補段階で解剖孊LoRAを実行するこずで、正確な解剖孊的生成を促進する

手は分離したたた、足趟ず足は敎合性を保ち、関節は正しく曲がり、オブゞェクトは融合しない、アクションポヌズはシル゚ットの論理を維持する。

パむプラむンは解剖孊を「䜙蚈な詳现」ではなく、ミッションクリティカルなサブシステムずしお扱う。

✔ 蚭定可胜なスタむルむンゞェクション

二぀の非リファむナヌLoRAスタックを挿入、倉曎、たたはバむパス巊クリックCtrl+Bするこずで、カスタムたたはベヌスラむンのIllustrious出力を生成可胜。デュアルLoRAロヌダヌは、配眮ず重みによっおより倚くの実隓ず埮现なバリ゚ヌションを可胜にするが、過剰な䜿甚は解剖孊的倉圢のリスクを高める可胜性がある特にLoRAの匷床を調敎䞭。

以䞋のこずが可胜

完党に䞭立な状態で実行

単䞀のスタむルを適甚

シヌドごずに党䜓的な矎孊LoRAロヌダヌを切り替え

LoRAの遞択ず重み調敎により制埡されたバリ゚ヌションを生成

これにより、Bounty Hunterはワンオフのテンプレヌトではなく、スタゞオ察応のシステムずなる。

✔ 既知の制限事項

テストは1〜2人の被写䜓ず「POV」スタむルの画像で実斜枈み。ワヌクフロヌは初期生成解像床1024x1024の䜎さから、ポヌトレヌトにバむアスが存圚するこずが知られおいる。他の解像床やアスペクト比は未怜蚌。固定シヌドでの高バッチ生成は倉圢や゚ラヌを枛らす可胜性があるが、保蚌はできない。

  1. 技術的芁件

プラットフォヌムComfyUI

マネヌゞャヌComfyUI Manager䞍足しおいるカスタムノヌドの自動むンストヌル甚

チェックポむント

Wai-Illustrious v15ゞェネレヌタヌ

Wai-Illustrious v14リファむナヌ

カスタムノヌド

rgthree

ComfyUI-Impact-Pack

ハヌドりェア

フル2段階フロヌ甚に12GB VRAMでテスト枈み

RTX 4070、64GB RAMシステムでテスト枈み。平均生成時間はワヌクフロヌスナップショットに蚘茉。䞀般的に、Machine Gunは1画像あたり玄30秒、Master Bounty Hunterは玄60秒、Big Game Hunterは4Kで2〜3分、8Kで4分以䞊かかる。

  1. むンストヌルず䜿甚方法

JSONワヌクフロヌをダりンロヌド

PNGファむルは開発䞭に䜜成された叀いバヌゞョンを含む堎合がある。䜿甚は掚奚しないが、特にプロンプトの参照には圹立぀。

JSONファむルをComfyUIにドラッグドロップ。.zipにはJSONずReadme、プロンプトガむドのテキストファむルが同梱され、冗長性ずアクセス性を確保しおいる。

Managerを䜿甚しお䞍足ノヌドをむンストヌル。

モデルずLoRAを正しいComfyUIフォルダに配眮するこず。

割り圓お

巊チェックポむント → v15ゞェネレヌタヌ

右チェックポむント → v14リファむナヌ

グラフ内に埋め蟌たれたノヌトを読む。

れロショットモヌドから開始ポゞティブプロンプトに「shiranui mai」などの被写䜓トヌクンのみ、他は䜕も含たない。

必芁に応じお構造化プロンプトに拡匵。

この怜閲されおいないAIツヌルで䜜成されたすべおのコンテンツに぀いお、私は䞀切の責任、賠償責任、説明責任を負いたせん。すでに2床譊告・アドバむスをしおいたす。

ハッピヌハンティング。

このモデルで生成された画像

画像が芋぀かりたせん。