Vegeta | Dragon Ball Z

詳細

ファイルをダウンロード

モデル説明

使用リソース: /model/22530

Googleフォーム経由でリクエストされました

重み: 0.8 - 1.0

トリガー + 通常の外見: vegeta, 黒いスタイリッシュな髪, 黒い目

デフォルトの衣装: アーマー, 白い手袋

スーパーサイヤ人: super saiyan, ブロンドのスタイリッシュな髪, 青い目

次のセクションでは、私の考えを述べ、フォームから受け取ったフィードバックの一つに応じています(また、ファイルサイズが通常より大きい理由も説明しますが、長々と読むことになります)

まず、リクエストを送ってくれた方々、ポジティブなレビューを書いてくれた方々、コメントを残してくれた方々に感謝します。わずか1週間ほどの間に、多くのキャラクターLoRA(いくつかのスタイルを含む)をリリースできました。これはすべて、HollowstrawberryのColab に感謝しなければならないところです。それは、各モデルの説明文のトップに常にリンクされています。また、私はColab Plusを自費で購入することで、このような迅速なリリースが可能になりました。これは、明らかに依存症であると言えるでしょう(笑)。どこまで画像(ましてやbooruサイトでは通常見られないwebpファイル)を丹念に調べ、加工するか、ご想像ください。

次に、夜間に受けたフィードバックについて触れましょう。LoRAモデルのトレーニングパラメータに関するリソースをいくつか受け取りました。私は常にベースのNAIモデルを使用しています。これはHollowstrawberryのColabの標準設定であり、クリック数回で確認できます。他の混合モデルへの対応が可能な点で、最も妥当だと考えています(あるいは、ただの妄言かもしれませんが、写真を生成するのが好きだからです)。以下が、Vegetaモデルで使用したパラメータです:

  • 133枚のVegetaの画像を使用。すべてGelbooruからHollowstrawberryのデータセット作成ツール を使って取得。

  • 解像度: 768(私の95%以上のモデルで同様)

  • リピート数: 14(20にしてもよかったかも)

  • エポック数: 3

  • unet_lr: 1.5e4

  • text_encoder_lr: 1.5e5

  • lr_scheduler: cosine_with_restarts

  • lr_scheduler_number: 3

  • lr_warmup_ratio: 0.05

  • min_snr_gamma: チェック済み

  • network dim/network alpha: 128/64(Colabの推奨に従ってalphaはdimの半分に設定したので、少しだけガイドから逸脱)

以前のモデルでは、オリジナルのColab設定をほぼそのまま使用していました。その結果、CitrineDreamMix で良い結果を得ました。正直、もっと早いPCと時間があれば、MeinaMixAniReality-MixAmbientMix にさらに多数のサンプル画像を追加したかったでしょう。また、私のクレメンタインモデル に戻り、レビューを確認しました。一部のプレイヤーはアーマーを完全に再現できていない可能性があります(おそらくアーマーの構成がタグの順序に依存していたのかも?Overlordをずっと見ていないので記憶はあいまいです)。また、髪色・目の色などの特徴を失っているケースもいくつかありました(ただ、今後必要に応じて thisthat を追加するようにすべきかもしれません)。あるレビューでは、サブウェポンを削除して胸の部分を露出するように調整されていました。私はキャラクター用LoRAの柔軟性とカスタマイズ性を最大限に高めるよう努力していますが、ファンタジー的なキャラクターに現代のストリートウエアを適用する際には、必ずしも期待通りにいかないことも理解しています。

さて、ここでいう「過剰に焼きすぎたLoRA」がどう見えるのか、私はまったく分かりません。このアカウント作成から3か月で、100枚以上のモデルをダウンロードしてきましたが、そのほとんどはほぼ問題なく動作し、後はただ忘れられてしまうものです。Googleで「過剰に炙られたLoRA」と検索して見た限り、画像に極めて強いシャープネスが効いている様子(過度なトレーニングの結果か?)が唯一のヒントでした。機械学習の授業でもっと真剣に授業を聞いていればよかったと後悔しました。

今得たフィードバックのリソースは、保管しておきます。実は、自分のラップトップでLoRAを焼きつけることも検討していたのですが(VRAMは十分あるものの、焼き上げにかかる時間は想像以上にかかります)、ここで使用したパラメータも性能は文句なしです。ならば、自分のラップトップでも同じように動作するはずですよね?

ここまで全部読んでくださった読者の方(あるいはスキップした方も、まったく問題ありません。LoRAのトレーニングについて何も知らなくても、それほど損なのはありません。私自身もまだよく分からないのですから!)がいれば、下のコメント欄で感想をお聞かせください!私のデフォルトパラメータでのモデルは問題ないでしょうか?それとも、ここで使ったパラメータの方がはるかに優れているでしょうか?これは私が気にする必要はありません。ハードディスクに1TBの空き容量があり、別に3TBもあるため(ただし、別の用途に使うため)、ネットワークのdimとalphaは少し下げようと思っています。保存領域を節約できるからです。もしそのままにしておいてほしい場合は、それとお知らせください。

P.S. ここで書き連ねていることで、ちょっとだけ発表しておきます。ちょっとした休憩を取ることにします。いえ、正確には「ちょっと」の休憩です。しばらくの間、リリースは見られなくなるかもしれませんが、引き続きリクエストのデータセットを収集しています(Gelbooruに掲載されたアートの量次第では、通常はすぐに対応可能です)。フォームもまだ更新の途中です。改めて、ご支援に感謝いたします!

P.P.S. ある方から、青峰大輝のリクエストをもらいました。彼と同じ声優を務めるキャラクターを一度焼き上げてみようと考えており、……ちょっと注目してみてください。👀

このモデルで生成された画像

画像が見つかりません。