Hentai_Concept_test_z_image turbo

詳細

ファイルをダウンロード

モデル説明

Hentaiに関連する概念を取り入れ、AIツールキットを用いてトレーニングを行い、10,000ステップのトレーニング、固定学習率1e-4、およびさまざまなアスペクト比で1024と1536解像度の1308枚の画像を混合してZ-image turboモデルを強化する。

これはあくまでテスト目的であり、中国語と英語の異なるプロンプトを混合している。トレーニング損失は1e-1~5e-1の間で激しく振動する。ベースモデルはやや不足している可能性があるが、その基本的な理解は決して劣っていない。

多様性に欠けるかもしれないが、気に入ってもらえると嬉しい。


トレーニングはLLMによる拡張を用いず、より詳細なプロンプトを生成せずに実施されたため、使用されたプロンプトは比較的短く、強いランダム性を生じた。さらに、50%以上もの概念がほぼトレーニングに失敗しており、これは知識の不足やモデルのディスティレーションに関連する問題によるものと考えられる。数ヶ月、あるいはそれ以上にわたり、プロンプトの長さがトレーニングに大きな影響を与えることが観察されてきた。構造的に整理され、一貫性が高く、正確なプロンプトは成功したトレーニングの鍵である。しかし、これはVLM(視覚言語モデル)を用いても多大な手作業を必要とする。Rankを32からより高い値に増やすことは可能だが、これは過剰な記憶化/過剰再構成を引き起こし、望ましい効果ではない。

このモデルで生成された画像

画像が見つかりません。