Shinomiya Natsuha
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
Shinomiya Natsuha [発音: 'shi-no-mi-ya na-tsu-ha']
このLoRAの報酬を見かけて、ふと思い立って作ってみました。なぜなら、データセット画像を探しているときに、このキャラクターを以前に見たことがあったからです(もちろん使ったことはありませんが、強い印象を受けました)。それ以外のことは、全く誰なのか分かりません。
私が見つけたNatsuhaの画像は、内容も形式も(低品質なGIFで、多くのビジュアルアーティファクトがあり、ラベルも誤っている)――とにかく激しく、軽く言っても過言ではありません。Monetはバニラを何より好みますので、私はできるだけバニラなデータセットを作ろうとしました。データセットの画像はほとんどが低品質なGIFだったため、それぞれの画像を手動で修正し、インペインティングで補完するしかありませんでした。とはいえ、このデータセットは合計20枚の画像しかありません。そのうち14枚が実際のNatsuhaの画像です。もし私がどんな人間かご存知なら、1つだけでは満足できないことは分かっているでしょう。そのため、似てはいるが異なるキャラクターたちがさまざまな…行動をしている画像を6枚追加しました。Natsuha自身の画像については、画像にNatsuhaだけが残るように手動で編集しました。他の人物が写っている場合には、完全に塗りつぶして消しました。見つけられる画像が少なかったため、raw画像を含める余裕がありませんでした。おそらくネット上に動画があるかもしれませんが、GIFを高品質なPNGに変換するというチャレンジが好きなのです。笑
また、タグ付けにも実験しました。ほぼすべての他のデータセットに常に含まれている「1girl」タグを完全に削除しました。ただし、「solo」タグは残しました。
Natsuhaのトリガー語は、フルネームの「Shinomiya Natsuha」です。
他のトリガーは単に「ekiben」です。これは、「suspended congress」を上書きできるかの実験です。私個人的に、「paizuri」という日本語を英語の対応語より好んで使うように、対面座位「taimenzai」、正常位「seijoui」、駅弁「ekiben」なども英語より日本語の発音を好んで使っていますXD。ちなみに、データセットにはtaimenzaiの画像がちょうど1枚ありますが、ハグタグと組み合わされているため、どれほど効果的かは分かりません。
もしこの最初の版が良くなければ、このモデルを使ってデータセットを洗練し、さらに追加してバージョン2を作成します。現在この文章を書いている時点では、最初のサンプル画像(ローカルでトレーニング済み)が完成しており、髪型が間違っている以外は、Natsuhaに似ています――少なくともデータセットが示す彼女の姿としては。
このLoRAはローカルでトレーニングしたため、Prefect Ponyのチェックポイントを選択しました。しかし振り返ってみれば、LimestoneYenでトレーニングすれば大幅に時間を節約できたでしょう(LimestoneYenは8ステップで5分、Prefectは30ステップで15〜40分かかります。LimestoneYenは私が「Hyper Pモデル」と呼ぶものです)。とはいえ、私はスタイルが好きだったためPrefectを選択しましたが、それがLoRA自体にどのような影響を与えるのかは全く分かりません。






