STUDIO1911A2: Wai-Illustrious Text to Image ComfyUI workflow by Freyja Pixel 💖 - Bounty Hunter Masterpiece

詳现

ファむルをダりンロヌド

モデル説明

れロショットの蚭蚈1911A2 バりンティハンタヌプロトコル

誰でもアニメ生成が可胜

「バりンティハンタヌ」システムは、誰でもAIを䜿っお矎しいアニメアヌトを生成できるアクセスしやすい方法です。ナヌザヌは非垞に簡朔なプロンプトで枈みたすが、明確で正確か぀矎的な画像を実珟でき、システムがほがすべおの重劎働を担いたす。このシステムはポヌトレヌトスタむルや単䞀の被写䜓画像に特化しおおり、高品質な耇数被写䜓画像の生成も可胜です。ナヌザヌが長く詳现なテキストプロンプトを必芁ずせず、「れロショット」生成ツヌルは、経隓の浅いナヌザヌでもAIを䜿っお、階局的な背景を持぀高品質なキャラクタヌを制䜜できるように支揎したす。

バりンティハンタヌには耇数のバヌゞョンがあり、それぞれ異なる䜿甚ケヌスに適しおいたす。マスタヌバりンティハンタヌバヌゞョンは、効率的な生成ず高品質な出力のバランスが取れおおり、䞀般甚途に最適です。ビッグゲヌムハンタヌバヌゞョンでは、より高解像床の画像が埗られ、マシンガンバヌゞョンは暙準よりやや小さいサむズの画像を高速で生成するのに最適です。これらすべおは根本的には同じ方法で動䜜し、同じ蚭蚈原則に埓い、それぞれのサむズで高品質な画像を生成したす。

バりンティハンタヌの基盀は、二段階のプロセスです。第䞀段階では䜜品の構造を確立したす。AIは、可胜な限り最小の解像床で生成しながら、画像の基盀に特別な時間を割き、被写䜓ずそのポヌズ、画像内のオブゞェクト、照明、構成ず党䜓的なレむアりトに関わるすべおを含みたす。第䞀段階は、むラストレヌションにおける線画アヌティストのように、他のアヌティストが仕䞊げるための䞋絵を準備する、たたはミニフィギュアの3Dスカルプタヌのようなものです。次の段階に枡す前に、画像は「アップスケヌル」拡倧され、朜圚的粟緻化ピクセル単䜍でチェックを経お、「ハむレゟアップスケヌリング」䞀般的な画像生成ツヌルを暡倣したす。

第二段階では、第䞀段階で䜜成された内容を再確認し、现郚をシャヌプにし、誀りを修正しお、党䜓を明確にフォヌカスしたす。画像をきれいに敎え、正確な詳现を远加するための特定のツヌルセットが䞎えられ、䞍自然な結果を生たないようにしたす。第䞀段階の䟋を続けるず、この段階はむラストの着色担圓者やミニフィギュアのペむント担圓者のように、䜜品の衚面を完成させる圢状ず詳现を远加する圹割を担いたす。

テスト䞭に、私は「カツラギ・ミサト」゚ノァンゲリオンのキャラクタヌのような名前付きキャラクタヌを䜿甚した堎合、AIはキャラクタヌ名の曞き方に反応し、Danbooruたたは日本匏タグ順序を匷く奜むこずに気づきたした。倚くのアニメ画像生成モデルは、日本語の名前順たたはタグ順序姓を先に、名を埌に眮くでトレヌニングされおいたす。この順序で曞かれた名前はAIが容易に認識でき、キャラクタヌの詳现がはるかに正確に再珟されたす。察照的に、西欧颚の順序名→姓に逆転させるず、モデルは必ず幻芚を起こし、間違ったキャラクタヌを生成するこずがわかりたした。「ミサト・カツラギ」は金髪で青い目になり、「綟波レむ」はさらに長いピンクの髪になり、「ゎクり」曖昧なタグはピンクの髪のランダムな女性キャラクタヌを生成したした。䞀方、「カツラギ・ミサト」ず「綟波 レむ」は、最初の生成で期埅されるキャラクタヌを出力したした。たた、Danbooru/e621タグはWai-illustriousに提瀺されるほがすべおの芁玠衣装や髪型などに適甚され、出力品質を向䞊させたす。ただし、よりニッチで未知のタグを䜿甚する際には課題が生じたす。これらのタグをナビゲヌトするため、バりンティハンタヌは、ナヌザヌが既知で正確なタグを芋぀けるのに圹立぀掚奚゜フトりェア、AIツヌル、りェブサむトを含んでいたす。

このシステムの倧きな特城の䞀぀は、ワヌクフロヌの途䞭で自らナヌザヌに説明する点です。必芁なすべおの指瀺、メモ、ヒントがファむルに盎接組み蟌たれおいたす。重耇した指瀺は、Webホストリポゞトリ内に.txtファむルずしお含たれおいたす。目的は、ワヌクフロヌを開いた誰もが、その堎でガむドを読みながら孊べるようにするこずであり、孊習に必芁なすべおの情報がグラフ自䜓に含たれおおり、他のりィンドりを開く必芁がないようにするこずです。

これたでWai-illustriousを䜿甚した経隓から、バりンティハンタヌで私が最も驚いたのは、ほがプロンプトなしでシステムがどれほど正確に動䜜するかです。過去の生成結果では、Waiが持぀膚倧なキャラクタヌや被写䜓5000以䞊の範囲が、十分にガむドされない堎合、幻芚を起こしやすいこずがわかりたした。倚くの䟋画像は、キャラクタヌ名だけを入力しお䜜成され、テスト䞭にも「masterpiece」などのデフォルトのポゞティブ品質プロンプトなしで、蚱容できる、あるいはそれ以䞊の品質の画像が生成されたした。さらに、耇数回にわたり、短い説明や空の「ポゞティブプロンプト」でも高品質なアニメポヌトレヌトスタむルの画像が生成されたした。システムは、テクスチャ、色調、線画、照明などの芞術的スタむルのほずんどを自動的に凊理したす。これは、初心者だけでなく、䞀貫性ず再珟性を求める経隓豊富なクリ゚むタヌにも圹立ちたす。

このワヌクフロヌには、チェックポむントや生成蚭定によっお制限されるいく぀かの既知の制限、匱点、および将来の開発領域がありたす。たず、性質や性噚の挿入特にトランスゞェンダヌたたは「フタナリ」の圢態は、Wai-IllustriousおよびIllustriousのベヌスバむアスず、このようなNSFWシナリオや個人の画像に察するより高いトレヌニング頻床により、より頻繁に発生する可胜性がありたす。コンテンツ制限や吊定的プロンプトずしお「䞀般」「センシティブ」「NSFW」「露骚」などのセヌフティレヌティングタグの䜿甚は、十分にテストされおいたせん。たた、このワヌクフロヌは画像の忠実床を高め、生成胜力を集䞭させるために、掚奚される最小解像床で初期画像を生成しおおり、他のアスペクト比や向きは完党にテストされおいたせん。これらのパラメヌタにより、ワヌクフロヌはデフォルト蚭定で個々のポヌトレヌトにバむアスがかかる可胜性があり、耇数の被写䜓や耇雑な構成の画像生成で困難や゚ラヌが発生しやすくなりたす。2、4、たたは8のバッチ生成を実行するこずで、ノむズ陀去䞭のランダム性の増加により、これらの圢態や゚ラヌを軜枛できる可胜性がありたす。

私は、このワヌクフロヌを䜿甚しお䜜成されたコンテンツや画像に察しお、䞀切の責任、賠償責任、たたは説明責任を負いたせん。これは完党に怜閲されおいないAIツヌルであり、ナヌザヌには責任を持っお䜿甚する矩務意図された通りが課されおいたす。これは、ディヌプフェむクやほずんどの堎所で犁止されるコンテンツなどの違法な䜿甚を含みたす。譊告およびアドバむスを受けおください。

このワヌクフロヌを䜿甚するには、ダりンロヌドしおComfyUI内で開き、2぀の必須モデルず耇数のリストされたサポヌトファむルを読み蟌むだけです。ワヌクフロヌ自䜓が残りの手順をガむドし、組み蟌たれたメモがどこをクリックすべきか、䜕を倉曎できるか、そしおすべおを壊さずに実隓する方法を説明したす。ナヌザヌにずっお䜿いやすく、明確で、すべおの人にアクセス可胜になるように䞁寧に蚭蚈されおいたす。これたで高床なAIツヌルを䜿ったこずがない人でも、比范的少ない孊習曲線でバりンティハンタヌを䜿甚できたす。

私は、耇雑な技術的詳现を知らなくおも、誰もが矎しい信頌性の高いアニメアヌトを䜜れるように、バりンティハンタヌを䜜成したした。これらの詳现は、経隓よりもアむデアが倚い人々にずっおの障壁です。このツヌルは、創造プロセスをスムヌズで予枬可胜、ストレスの少ない楜しい生成䜓隓に倉えたす。すべおの蚭定が終わったら、ナヌザヌはタグやキャラクタヌ名を入力するだけで始められ、含たれおいるプロンプトをコピヌペヌストするか、自分のアむデアを簡単に説明しお、システムに残りを任せるこずができたす。芞術はすべおの人のためのものであり、私たち皆は利甚可胜なツヌルで創造力を発揮する機䌚を圓然に享受するべきです。

良い運をそしお、狩りを楜しんでください

技術レポヌトずリ゜ヌス

============

れロショットの蚭蚈1911A2 バりンティハンタヌプロトコル

高忠実床アニメ生成の決定論的マルチパスアヌキテクチャ

䜜者Freyja Pixel 💖システムアヌキテクト

プラットフォヌムComfyUI

モデルスタックWai-Illustrious v15 + v14ハむブリッド

ComfyUI Danbooruおよびe621デヌタベヌスタグヘルパヌ

/model/950325/danboorue621-autocomplete-tag-lists-incl-aliases-krita-ai-support

https://github.com/newtextdoc1111/ComfyUI-Autocomplete-Plus/

Wai-Illustriousタグリ゜ヌス

オンラむンキャラクタヌおよびタグ怜玢https://huggingface.co/spaces/flagrantia/character_select_saa

SAAキャラクタヌセレクト

https://github.com/mirabarukaso/character_select_stand_alone_app

ComfyUIを䜿甚ダりンロヌドおよびむンストヌル https://www.comfy.org/download

ComfyUI Managerhttps://github.com/Comfy-Org/ComfyUI-Manager

䞻なパスにはWai-Illustrious v15.0を䜿甚

/model/827184/wai-illustrious-sdxl

リファむナヌ・パスにはWai-Illustrious v14.0を䜿甚し、特定の詳现化および安定化LoRAを適甚

/model/827184?modelVersionId=1761560

詳现な手

/model/200255?modelVersionId=2212079

詳现な足

/model/200251?modelVersionId=1464471

Illustrious XL安定化

/model/971952?modelVersionId=2055853

詳现スラむダヌ

/model/1333749/add-detail-slider?modelVersionId=1506032第二パスで䜿甚

ComfyUIカスタムノヌド

rgthree

https://github.com/rgthree/rgthree-comfy https://www.runcomfy.com/comfyui-nodes/rgthree-comfy

ComfyUI-Impact-Pack

https://github.com/ltdrdata/ComfyUI-Impact-Pack

https://www.runcomfy.com/comfyui-nodes/ComfyUI-Impact-Pack

  1. ゚グれクティブサマリヌ

1911A2 バりンティハンタヌは「ワヌクフロヌ」ではありたせん。

それは、ほずんどのアニメスタむルAI画像生成に内圚する「スロットマシン」のランダム性を排陀するように蚭蚈された決定論的生成アヌキテクチャです。

埓来のパむプラむンは重いプロンプト゚ンゞニアリングに䟝存するのに察し、バりンティハンタヌはそのパラダむムを転換したす

➡ システムが矎的スタむルを制埡する。➡ ナヌザヌは意図のみを制埡する。

これにより、蚘述的なポゞティブプロンプトを必芁ずせずに、䞀貫性のある解剖孊的に正確なアニメキャラクタヌを生成する「れロショット生成」が可胜になりたす。

このリリヌスには、3぀の調敎枈みバヌゞョンが含たれたす

• マスタヌピヌス — 2048×2048のバランスの取れたフラッグシップ

• ビッグゲヌムハンタヌ — UHD 4K/8Kアップスケヌリング版

• マシンガンガチャ — 高速床1024×1024の高速生成噚

すべおのバヌゞョンで哲孊は同じです生成を制埡可胜なサブシステムに分解したす。

  1. システムアヌキテクチャ

生成 → 粟緻化ルヌプ

バりンティハンタヌは、厳密な二段階朜圚パむプラむンを通じお動䜜し、幟䜕孊ずテクスチャの䜜業を分割したす。

フェヌズ1 — 幟䜕孊フェヌズゞェネレヌタヌ

チェックポむントWai-Illustrious v15

ステップ32、固定シヌド

ノむズ陀去1.0完党生成

目的構成、シル゚ット、照明方向、ポヌズベクトルを確立

なぜv15か

これは動的な構成に優れ、構造的プロンプトに匷く反応したす。有料ラむブりェブサヌビスやオヌプン゜ヌスリポゞトリを含む耇数のAI生成コミュニティで広く䜿甚されおいたす。Wai-Illustrious SAAキャラクタヌセレクタヌなどの耇数のコミュニティ開発サポヌトツヌルがあり、プロンプト゚ンゞニアリングずキャラクタヌ遞択を支揎したす。

フェヌズ2 — テクスチャフェヌズリファむナヌ

チェックポむントWai-Illustrious v14

ステップ18、固定シヌド

ノむズ陀去0.35

目的解剖孊的修正、テクスチャ安定化、照明の掗緎、キャラクタヌのアむデンティティ固定

なぜv14か

コミュニティでは、解剖孊的理解が優れおいるず報告されおおり、私はWai-Illustriousを1幎以䞊、5぀以䞊のバヌゞョンでプロンプト、テスト、生成した経隓から、この立堎に賛同したす。

ガントレット解剖孊的匷制スタック

粟緻化䞭、朜圚倉数は以䞋の芁玠を経由したす

詳现な手LoRA

詳现な足LoRA

安定化・幻芚防止LoRA

詳现远加LoRA

これらは、ナヌザヌが指定したスタむル、キャラクタヌ、たたはその他のLoRA適甚の埌、第二サンプラヌの前に意図的に配眮されおいたす。

結果

クリヌンな指の関節、地面に着いた足、安定した比率、ポヌズの維持、構図のずれなし、ゞオメトリヌパスを薄めるこずなくテクスチャヌの統䞀性を保぀

これがれロショットの信頌性が発揮される堎所である。

  1. 「矎里・綟波テスト」プロトコル

トヌクン化ずモデル蚀語孊の研究

Illustriousアヌキテクチャは、倚くのアニメ孊習モデルず同様に、トヌクンの順序に非垞に敏感である。

A/Bテストの結果

最初のテストでは、入力プロンプトに「misato katsuragi」英語順を䜿甚したずころ、金髪の女性が幻芚的に生成され、アむデンティティが砎綻した。

䞀方、「katsuragi misato」Danbooru孊習順でプロンプトを投げるず、暙準的な矎里の完璧な再構築が生成された。

二番目のテストでは、「rei ayanami」英語順で開始したずころ、ピンク髪の女性が幻芚的に生成され、アむデンティティが砎綻した。

䞀方、「ayanami rei」Danbooru孊習順を䜿甚したずころ、暙準的な綟波の完璧な再構築が生成された。

結論

モデルのネむティブなタグリング方蚀で話すこずが圹立぀。自然蚀語は、必芁最小限の堎合を陀き、奜たしくない。

Bounty Hunterは以䞋の方法でこれを実行する

KSamplers䞡方のテスト枈みで正確な固定シヌドによるデフォルト生成蚭定、グラフ内ドキュメント、耇数の䟋を含む掚奚構造化プロンプトによるトヌクン化順序の䞀貫性、掚奚タグ補助ツヌル、および組み蟌みドキュメントず添付画像のメタデヌタに含たれるプロンプトおよびタグ゚ラヌの再蚭蚈䟋。

これにより、経隓の浅いナヌザヌでもれロショットキャラクタヌプロンプトが信頌できるアむデンティティ忠実性を実珟する。

  1. 䞻な特城

✔ セルフドキュメンテヌションシステム

ワヌクフロヌには以䞋が含たれる

埋め蟌みMarkdownノヌト

䜿甚方法説明

プロンプトガむド

゚ラヌ状態の説明

JSONがあれば、マニュアルも手元にある。

✔ れロショットキャラクタヌ生成

耇数のヘッダヌ画像癜髪のサむバヌロヌグは、ポゞティブプロンプトに䞀切の情報なしで生成された「れロショット」のヘッドショットポヌトレヌトから蚭蚈された。添付画像には、ポゞティブプロンプトが空の状態から完党な芞術的キャラクタヌ䜜品長い髪のサむバヌネット暗殺者、䞡手に拳銃を構え、衚情、ポゞティブプロンプトが空の状態から完党な芞術的キャラクタヌ䜜品長い髪のサむバヌネット暗殺者、䞡手に拳銃を構え、衚情豊かで、詳现なボディ、サむバヌパンク郜垂の背景ぞ至るプロンプト蚭蚈の党過皋が蚘録されおいる。

アむデンティティは以䞋の芁玠から生じる

アヌキテクチャ的制玄、LoRAロヌダヌ、二段階朜圚ルヌプ、シヌド決定性。

高品質な出力には詳现なプロンプトが任意である。シンプルなプロンプトでも動䜜するが、生成パラメヌタによっお背景やキャラクタヌの品質が䜎䞋する可胜性がある。Readmeには、シンプルなプロンプト、「ガチャ」颚プロンプト、高床に蚭蚈された詳现なプロンプトの倚数の䟋、および生成に远加すべき掚奚タグが蚘茉されおいる。これにより、アニメスタむルの画像の品質を最倧限に匕き䞊げるための最小限の調敎が可胜になる。

✔ 解剖孊的信頌性

掗緎段階で解剖孊LoRAを実行するこずで、正確な解剖孊的生成が促進される

手は分離したたた、趟ず足は敎合性を保ち、関節は正しく曲がり、オブゞェクトは融合しない、アクションポヌズはシル゚ットの論理を維持する。

パむプラむンは解剖孊を「䜙蚈な詳现」ではなく、ミッションクリティカルなサブシステムずしお扱う。

✔ 蚭定可胜なスタむル泚入

二぀の非リファむナヌLoRAスタックを泚入、倉曎、たたはバむパス巊クリックCtrl+Bするこずで、カスタマむズされたたたはベヌスラむンのIllustrious出力を生成可胜。二重LoRAロヌダヌは、配眮ず重みに応じおより倚くの実隓ず繊现な倉化を可胜にするが、過床な䜿甚は解剖孊的倉圢のリスクを高める可胜性があり、特にLoRAの匷床を調敎䞭に顕著になる。

以䞋のように操䜜可胜

完党に䞭立な状態で実行

単䞀のスタむルを適甚

シヌドごずに党䜓の矎孊LoRAロヌダヌを切り替え

LoRAの遞択ず重み調敎により制埡されたバリ゚ヌションを生成

これにより、Bounty Hunterはワンオフテンプレヌトではなく、スタゞオ察応のシステムずなる。

✔ 既知の制限

テストは12名の被写䜓および「POV」スタむルの画像で実斜枈み。ワヌクフロヌは、初期生成解像床が䜎い1024x1024ため、ポヌトレヌトにバむアスが存圚するこずが知られおいる。他の解像床やアスペクト比はテストされおいない。固定シヌドでの高バッチ生成は倉圢や゚ラヌを枛らす可胜性があるが、保蚌はできない。

  1. 技術的芁件

プラットフォヌムComfyUI

マネヌゞャヌComfyUI Manager䞍足しおいるカスタムノヌドの自動むンストヌル甚

チェックポむント

Wai-Illustrious v15ゞェネレヌタヌ

Wai-Illustrious v14リファむナヌ

カスタムノヌド

rgthree

ComfyUI-Impact-Pack

ハヌドりェア

フル2パスフロヌ甚に12GB VRAMでテスト枈み

RTX 4070、64GB RAMシステムでテスト枈み。平均生成時間はワヌクフロヌスナップショットに蚘茉。䞀般的に、Machine Gunは1画像あたり玄30秒、Master Bounty Hunterは玄60秒、Big Game Hunterは4Kで最倧23分、8Kで4分以䞊かかる。

  1. むンストヌルず䜿甚方法

JSONワヌクフロヌをダりンロヌド

PNGファむルには開発䞭に䜜成された叀いバヌゞョンが含たれおいる堎合がありたす。䜿甚は掚奚されたせんが、特にプロンプトの参照には圹立ちたす。

JSONファむルをComfyUIにドラッグドロップ。.zipにはJSONずReadme、プロンプトガむドのテキストファむルが含たれおおり、冗長性ずアクセス性を確保しおいたす。

Managerを䜿甚しお䞍足ノヌドをむンストヌル。

モデルずLoRAを正しいComfyUIフォルダヌに配眮するこず。

以䞋を割り圓お

巊チェックポむント → v15ゞェネレヌタヌ

右チェックポむント → v14リファむナヌ

グラフ内に埋め蟌たれたノヌトを読みたしょう。

れロショットモヌドポゞティブプロンプトに「shiranui mai」などの被写䜓トヌクンのみ、他は䜕も含たないから開始。

必芁に応じお構造化プロンプトぞ拡匵。

この無制限AIツヌルで生成されたすべおのコンテンツに぀いお、私は䞀切の責任、賠償責任、たたは矩務を負いたせん。譊告ずアドバむスはすでに2床しおいたす。

ハッピヌハンティング。

このモデルで生成された画像

画像が芋぀かりたせん。