Patreon にご参加いただき、私の作品をすべての方に無料で提供し続けられるようにしていただけますと幸いです。ここでは個別に購入するよりも安い月額料金で、早期アクセスモデルをリリースし、独占モデルやその他のコンテンツも提供します。

ビジネスのお問い合わせ、商用ライセンス、カスタムモデル、コンサルティングについては、[email protected] または [email protected] までご連絡ください。CivitAIのダイレクトメッセージでもお問い合わせいただけますし、私のDiscordにもご参加ください。

はじめに

ここで提供されている多くのアニメ・コミックスタイルのモデルは、細い輪郭と過度に精細なスタイルが特徴で、すべてのユーザーの好みに合っているわけではありません。そのため、このモデルでは、より本物らしいアニメ・コミックスタイルを実現するために、以下の3点に特に焦点を当てました：ソフトでフラットな画像、太めの輪郭、そしてエッジの自然な表現。このスタイルでは、基本的な画像編集ツールの知識があれば、気に入らない部分の編集が比較的容易です。そのため、img2imgを活用して、ご希望のビジョンに沿って画像を調整しやすくなります。

ぜひ、ご自身の作品をこちらと私の Discord サーバーの両方で共有してください。作品を見られるのを心より楽しみにしています。

利点と欠点

利点

手指・足趾の解剖学的正確性に優れている。
「masterpiece」や「best quality」などのプロンプト語句に頼らず、優れた結果を生成できる。これにより、プロンプトのトークンスペースを効率的に使用でき、より明確で効果的な指示を可能にし、あなたのビジョンに沿った画像生成を促進する。
アーティファクトやランダムなにじみが極めて少ない。出力は清潔で、望ましくない視覚的歪みが少ない。
生成される画像は明確にソフトな外観を持つ。出力は優しく滑らかな質感を有し、視覚体験をより穏やかで美的にしてくれる。
フラットな画像スタイルは、グラデーションの色の複雑さが少ないため、編集が容易。グラデーションの減少により、編集プロセスがシンプルになり、目的の結果をより簡単に実現できる。
太い輪郭の強調は、伝統的なアニメやコミックイラストでよく見られる、独特で識別しやすいビジュアルスタイルを実現する。
このモデルは、さまざまなディテールレベルに非常に柔軟に対応し、LORAなどを活用して画像の複雑さを好みに合わせて調整できる。
グレースケールのマンガスタイル画像生成において特に優れた結果を出す。

欠点

特定のLORAによって、画像スタイルが著しく影響を受け、このモデルが意図するソフトな質感から逸脱してしまうことがある。このような場合には、ブロックウェイティングやimg2imgの活用により、意図したソフトさを回復し、モデルのオリジナルの目的に近づけることができる。
時折、瞳に不自然な角が生じることがあるため、より正確で美的な外観を得るために手動編集が必要になる場合がある。

ロードマップ

インペイントモデルのリリース。完了。
モデルを更新し、一部の欠点を軽減し、最新のモデルのブレンドを取り入れる。完了。
アニメ・コミックスタイルを反映したモデルの開発。完了。
SDXLモデルの開発。
未踏のLORAテーマの開拓（先行対策を避けるため、詳細は控えます）。

ヒント

モデルの好みをより深く理解するには、提供されたプロンプトを基礎として、自身の目的に応じてカスタマイズ、修正、または拡張することを推奨します。
フェイスリストア機能の使用は避けてください。不要な場合が多く、元のモデルの結果よりも劣化する傾向があります。
CFG制御にDynamic Thresholdingを活用することを検討してください。この手法により、より良い結果を得られます。
生成物のディテールが不足していると感じた場合は、プロンプトだけでは修正できない場合、adetailer（または同様のLORA）の使用を検討してください。adetailerなどのツールはディテールを強化・豊かにしますが、その分、このモデルが意図するソフトさを失う可能性があります。
より優れたLORAの結果を得るには、LORAブロックウェイティングを活用してください。これにより、LORA処理の成果をさらに向上させ、優れた結果を実現できます。
プロンプト内では、LORAのトリガーワード以外ではアンダースコア（_）の使用を避けてください。
最適な結果を得て、被写体の重複を避けるため、生成画像のサイズは最大で768x768ピクセルまたは768x1024ピクセル（またはその逆）に制限することをお勧めします。より高解像度が必要な場合は、Hires fixを使用し、その後img2imgのアップスケール技術を活用してください。特にControlNetのTile Upscale手法を重点的に使用することで、高解像度出力の質を大幅に向上させることができます。

プロンプトとTI

このモデルには特別に推奨されるポジティブまたはネガティブプロンプトはありません。特定のプロンプトに依存せず、ベースとして十分に機能します。ご希望に応じて、プロンプトを自由に組み合わせ、その影響力を増減させ、生成物を自分のクリエイティブビジョンに沿ってカスタマイズできます。

ネガティブプロンプトには、Textual Inversion（TI）の利用を推奨します。以下のTIが推奨されます：easynegative、bad_prompt、badhandv4。ただし、他にもさらに優れた結果をもたらすTIが存在する可能性があります。さまざまなTIを試し、ご自身の発見を共有してください！

推奨設定

Vae-ft-mse-840000-ema-pruned.vae（他にもanmie方向のバージョンとしてblessed2.vaeなどもよく機能します）。
Euler A。
ステップ数：30〜40（DPM++ 2M Karrasでは低くしても可能ですが、Euler Aのほうがより美しい画像を生成すると感じています）。
Hires upscaler：画像に応じて4x_foolhardy_Remacriまたは4x-UltraSharp。
Hires upscale：GPUの限界値まで可能ですが、1.5x〜2xが推奨です。
CFGスケール：4〜8（Dynamic Thresholdingを使用する場合を除く）。
Clip skip：2。

モデルのレシピ

このモデルのレシピは非常に複雑で、ミックスに使用する各モデルの個々の入力・出力層に異なるウェイティングを適用しています。そのため、以下の手順がこのモデルと完全に一致する結果を保証するものではありません。しかし、基本的なレシピは以下の通りです：

Model A:
duchaitenLofi
Model B:
realcartoon3d
Model C:
kidsmix_v10

Model A:
ZavyComics_a1
Model B:
childrenStories_v13D
Model C:
flat2DAnimerge_v30

このミックスに使用されているモデルおよびそれ以前のモデルの作成者たちに、心より感謝を申し上げます。

ソーシャルメディア

最近立ち上げたDiscordサーバーへぜひご参加ください（まだアクティブさは低いですが、SDXLのリリースを機に活発化させます）。AIに関する議論や体験共有、AIで作成した作品の発表の場としてご活用ください。私のモデルやAI全般に関する質問やヒントをお気軽にどうぞ。参加を心よりお待ちしています。また、Discordでは、私のモデルの早期テスト版をリリース予定です。ぜひ最初に試したい方は、Discordサーバーにご参加ください。

https://discord.gg/jZZA4Dzmta

モデルタイプ	チェックポイント
ベースモデル	SD 1.5
公開日	7/15/2023

ZavyComics

詳細

ファイルをダウンロード

モデル説明