Influx

詳細

ファイルをダウンロード

モデル説明

私のカスタムトレーニング済みSD15モデルへようこそ。

このモデルは、約6,000枚の生成されたFlux画像を使用して、さまざまなスタイルを試しながら(たくさんの試行錯誤を経て)トレーニングされました。

データセット元:

/model/631007?modelVersionId=705402

自動キャプション生成に pharmapsychotic -> clip_interrogator を使用していたため、厳密なタグや説明は一切なく、あくまで遊び心と探求心に基づいたアプローチです。

私は機械学習の経験がなく、純粋に趣味として取り組んでいます。

手を入れる作業や、onetrainer に費やした数多くの時間、そして無駄にしたエネルギー——すべてがとても刺激的な冒険でした。しかし、学ぶべきことはまだまだたくさんあり、このモデルをさらに進化させることを楽しみにしています。

現在、このモデルの顔はあまり良くないか、正直わかりません。優れたプロンプターの方々が教えてくれると嬉しいです。もっとたくさん学ぶ必要があります。ComfyUI内の1つのノブが「より良いプロンプト」生成に大きく貢献しました。

画像の品質を向上させるには、512x512から768x768へのHiResスケーリングを使用するのが最適です。

トレーニング設定:

さて、

トレーニング構成

  • エポック数: 100

  • バッチサイズ: 最初のトレーニング時 10 -> 32

  • 勾配累積ステップ: 1

  • 学習率: 1e-05

  • 重みデータ型: FLOAT_16

  • 出力データ型: FLOAT_16

  • スケジューラ: CONSTANT

  • トレーニングデバイス: cuda

  • トレーニングデータ型: BFLOAT_16(フォールバックは FLOAT_32

  • 注意メカニズム: SDP

  • 解像度: 512

検証とサンプリング

  • 検証有効化: true

  • 検証間隔: 1 (エポック)

  • サンプリング間隔: 200 (ステップ)

  • サンプル画像形式: PNG

最適化器

  • 最適化器: ADAMW_8BIT

  • 重み減衰: 0.01

  • Beta1: 0.9

  • Beta2: 0.999

  • 8ビットブロックごと: true

  • 確率的丸め: true

最初は1e-5でトレーニングし、その後5e-5に減らし、さらにその他の値へと調整しました。

このモデルで生成された画像

画像が見つかりません。