RealCartoon3D

詳細

ファイルをダウンロード

モデル説明

Mage.Space 限定モデルをチェックしてください: RealCartoon - Mage

このモデルはsinkin.ai およびmage.spaceで実行できます:

  1. www.Mage.space はとても役立ちます:

    1. V11 - https://www.mage.space/play/d6ec9d76c61c51e88c8d7ebedfed4870

    2. V14 - https://www.mage.space/play/0d8c0275c138d22f316d6fe75ee17040

    3. V15 - https://www.mage.space/play/e4b5b5108f3d42d501c6a25b95fdb784

    4. V17 - https://www.mage.space/play/3179aa44ab27ae1b37345ebdd6f8b8de

  2. https://www.shakker.ai/userpage/76e974968502489794d7d7938e6dda54/publish

  3. https://sinkin.ai/m/gLv9zeq

支援を送りたいですか? (Ko-fi で支援を送る)

プロンプトのおすすめは以下をご覧ください

被写体に年齢を加えたい場合、Age Slider を試しましたが、うまく機能しました: Age Slider

また、ネガティブプロンプトにeasynegativebadhandv4 を推奨します**

歴史:

RealCartoon3D は私が最初にアップロードしたモデルです。当時はまだこの分野の学習中でしたが、自分が気に入ったスタイルでプロンプトを入力したときに望む結果を出すチェックポイントを作りたかったのです。そのチェックポイントの目標(時間とともに更新されました)は以下の通りです:

  • 1. 人間の多様性(たとえば、アフリカ系、ヨーロッパ系、アジア系など)。どこでも見られる同じようなスタイルだけを生成したくありませんでした。
  • 2. 実写風のタッチを加えたマンガ・カートゥーン風の描写を生成する
  • 3. LoRA と良く連携する(カスタマイズが実際に起こるのはこの部分だからです)

ミッションは、このチェックポイントを、プロンプトで最初、または2回目の試行で良好な結果を出すレベルにまで高めることでした。(私のコンピューターは単なるゲーミングノートPCで、このような処理をすると非常に熱くなります。笑 すでに一度バッテリーを壊してしまいました。)

このプロセスで多くのことを学び、他のチェックポイント(RealCartoon-Anime、Realistic、Pixar、2.5D)も作成し、より焦点を絞ったバリエーションを提供できるようになりました。このチェックポイントはそれらすべての基盤であり、時折それらに統合されています。しかし、このモデルは私が常にメインとして使うモデルであり続けます… たとえPIXAR版がとても美しい見た目を持っているとしても :P

皆さんが楽しんでくれることを願っています!ぜひレビューとご自身の画像を共有してください。ダウンロードやフィードバックへのご支援に心より感謝します**(ありがとうございます!**)。これほど注目されるとは思ってもいませんでした。

作成プロセス:

マージのための初期チェックポイントは、2023年5月頃のトップモデル数個でした(これらのチェックポイントはマージに制限を設けていませんでした)。また、VAEを組み込みました。(vae-ft-mse-840000-ema-pruned)。ClearVAEも試しました(良い結果が出ることもありますが、たまに乱れが生じました。おそらく私のコンピューターの問題でした)。この問題をこのモデルをダウンロードする方々に押し付けるのは避けたいため、ClearVAEは使用しませんでした。残念ながら、スクラッチからトレーニングするリソースがなく、多くの人がこれらのトップチェックポイントを元に学習していることを知りました。その後、より良い外観やクールな背景(時には奇妙な結果も)を持つチェックポイントを探し、全体の見た目に寄与するようマージを繰り返しました。(再び、マージに制限のあるチェックポイントは避けました。他の人の作業を壊したり、ライセンス問題に巻き込まれたくなかったからです)。常に問題になったのが手の描写が不自然になることでした(SD 1.5の多くのチェックポイントで同様の問題が見られました)。しかし、マージを繰り返すうちに、手の描写は改善されていきました。次に、スタイルや見た目を調整するためのLoRAを探しました。これらのLoRAはチェックポイントを「支配」するのではなく、それを「形作る」ためのものでした。ユーザーがコントロールできるようにするためです。それがLoRAの本来の目的だからです。

全体的に、このチェックポイントは迅速にバージョンアップしていきました。やがてバージョン3.0、3.1で私の望む方向に大きく進み、その後バージョン4で更新ペースはやや緩やかになりました。私は古いバージョンも好きで、これらの古いバージョンが他のRealCartoonチェックポイントの基盤となりました。このメインモデルの外観が確定するにつれて、他のモデルも発展していきました。

プロンプト設定:

(これらの設定はA1111用です):

以下は私が推奨する上位設定です。通常、VAEは使用しません。

(vae-ft-mse-840000-ema-pruned**_)_**はすでに組み込まれています。

以下は、私がほとんどの画像を生成する際に使用する通常の設定です。

もちろん、目的によって(たとえば風景など)設定は変更します。また、ポートレート画像は512×904のサイズも好んで使用します。チェックポイントの確認や完璧な画像を探す場合にのみバッチ処理を実行します。通常は1に設定しています。

主に使用するサンプリング手法はEuler aですが、DPM++ SDE KarrasやDPM++ 2M Karrasも良好な結果を出します。

新しいバージョンのEulerサンプラー(licykによるAdvanced Euler)- https://github.com/licyk/advanced_euler_sampler_extension

  • 手の描写がより良くなる
  • 通常、画像生成がより速い

アップスケーラーは、私の画像のほとんどにR-ESRGAN 4x+または4k-UltraSharpを使用しています。

アップスケール設定は、お使いのコンピューターによって異なります

被写体が遠くにいる場合、ADetailerhttps://github.com/Bing-su/adetailer)を実行することをお勧めします。SD1.5は遠くの人物の顔を正しく処理できないことがあります。ただし、背景にぼかされた被写体がある場合、ADetailerがそれらを「強化」して全体の見た目を損なう可能性があるため、注意してください。

A1111の実行で問題がある場合、「webui-user.bat」の設定を変更できます(右クリックしてノートパッドで開く):

  • set COMMANDLINE_ARGS= --xformers

xformersがインストールできない場合、以下の代わりの設定を使用してください:

  • set COMMANDLINE_ARGS= --disable-model-loading-ram-optimization --opt-sdp-no-mem-attention

xformersのインストール方法: xformersのインストール方法

プロンプトのおすすめ:

プロンプトはご自身の好み次第です。以下にアドバイスをいくつか:

  1. LoRAの強度を加える際は注意してください。チェックポイントの全体的な見た目に影響します。強くするほど良いとは限りません。通常、LoRAに応じて0.4~1の強度を使用しています。

  2. プロンプトの最初に書かれた内容が優先度が高くなります。

  3. 括弧()で囲むと優先度が上がり、すべてを括弧で囲んでも、括弧なしで書くのとほぼ同じ効果があります。

  4. プロンプトの微妙な変更(句読点を含む)で画像が大きく変わります。

  5. シードは、同じソフトウェアと設定で類似の画像を生成するのに役立ちます。しかし、ソフトウェア(たとえばComfyUI)やハードウェアの違いにより、同じ画像が得られるとは限りません。

  6. よりカートゥーン風の見た目(少なくともこのチェックポイントでは)を望む場合、プロンプトの最初に「Anime」「Cartoon」「painted」「comic」を追加してください。バージョンによって必ずしもその見た目になるとは限りませんが、傾向としてはそうなります。リアルな見た目(Realistic、realなど)にも同様に有効です。

  7. SFW(セーフ・フォー・ワーク)またはヌードを含まないようにする場合、ネガティブプロンプトに次の語句を必ず含めてください:nude、nudity、naked、NSFW、nipples。もちろん、これらの語句をプロンプトに直接含めた場合は、それらが生成される可能性が高くなります。

  8. 私が通常ネガティブプロンプトに使用している内容は以下の通りです(easynegativeまたはbadhandv4をクリックするとファイルを入手できます):

    easynegative,(badhandv4),(bad quality:1.3),(worst quality:1.3),watermark,(blurry),5-funny-looking-fingers

    注意:Badhandv4は埋め込みモデルです。A1111のembeddingフォルダに配置してください。

なぜ多くのバージョンがあるのか:

私が望む成果に達したと感じたすべての結果を共有したかったからです。楽しみながら作業でき、多くの人がそれらを楽しんでくれたことが、私が継続するモチベーションとなりました。改めて、ありがとうございます。


ライセンスと使用

このモデルはオープンアクセスで、すべてのユーザーに提供されており、CreativeML OpenRAIL-Mライセンスにより権利と使用方法が明確に定められています。

  • 1. このモデルを意図的に違法または有害な出力やコンテンツの生成・共有に使用することはできません。
  • 2. 作者はあなたが生成した出力に対して一切の権利を主張せず、あなたはそれらを自由に使用できますが、その使用はライセンスで定められた制限に反してはなりません。
  • 3. 重み(weights)の再配布が可能です。ただし、再配布する場合は、ライセンスに記載されている使用制限をすべて含め、変更版のCreativeML OpenRAIL-Mライセンスをすべてのユーザーに提供する必要があります(ライセンス全文をよく読んでください)。

ライセンス全文はこちらをご覧ください:Stable Diffusion

使用制限:

あなたは、このモデルまたはその派生モデルを以下の目的で使用しないことに同意します:

- 適用される国家、連邦、州、地方、または国際的な法律・規制に違反するいかなる方法でも

- 未成年人を搾取・害する、またはそのような行為を試みる目的で

- 他者を害する目的で、検証可能な偽情報・コンテンツを生成または広めるために

- 個人を害するために利用可能な個人特定情報を生成または広めるために

- 他人を中傷・誹謗・いじめるため

- 個人の法的権利に悪影響を及ぼす、または法的拘束力のある義務を生成・変更する完全自動意思決定のために

- オンラインまたはオフラインの社会的行動、または既知または予測された個人的・性格的特性に基づいて、個人またはグループを差別したり害したりする目的で

- 年齢、社会的・身体的・精神的特性に基づいて特定のグループの脆弱性を悪用し、そのグループの個人の行動を歪め、その個人または他者に身体的・心理的被害を引き起こすまたは引き起こす可能性があること

- 法的に保護されている特性またはカテゴリーに基づいて個人またはグループを差別する目的で

- 医療アドバイスや医療結果の解釈を提供するため

- 正義の実現、法執行、移民、難民申請プロセスに使用される情報を生成または広めるために(例:個人が詐欺や犯罪を犯すと予測するためのテキストプロファイリング、文書内の主張間の因果関係の導出、無差別かつ恣意的な利用)

利用条件:

- このモデルを不倫理的に使用した結果生じるすべての法的責任は、あなた自身の責任です。

- これらのモデルをマージして使用する場合、どのような手順を取ったかを明示し、変更箇所を明確に示してください。

注意:

何か矛盾点や修正が必要な点を見つけた場合は、お知らせください。

このモデルで生成された画像

画像が見つかりません。