Influx
詳細
ファイルをダウンロード
モデル説明
私のカスタムトレーニング済みSD15モデルへようこそ。
このモデルは、約6,000枚の生成されたFlux画像を使用して、さまざまなスタイルを試しながら(たくさんの試行錯誤を経て)トレーニングされました。
データセット元:
/model/631007?modelVersionId=705402
自動キャプション生成に pharmapsychotic -> clip_interrogator を使用していたため、厳密なタグや説明は一切なく、あくまで遊び心と探求心に基づいたアプローチです。
私は機械学習の経験がなく、純粋に趣味として取り組んでいます。
手を入れる作業や、onetrainer に費やした数多くの時間、そして無駄にしたエネルギー——すべてがとても刺激的な冒険でした。しかし、学ぶべきことはまだまだたくさんあり、このモデルをさらに進化させることを楽しみにしています。
現在、このモデルの顔はあまり良くないか、正直わかりません。優れたプロンプターの方々が教えてくれると嬉しいです。もっとたくさん学ぶ必要があります。ComfyUI内の1つのノブが「より良いプロンプト」生成に大きく貢献しました。
画像の品質を向上させるには、512x512から768x768へのHiResスケーリングを使用するのが最適です。
トレーニング設定:
さて、
トレーニング構成
エポック数:
100バッチサイズ: 最初のトレーニング時
10 -> 32勾配累積ステップ:
1学習率:
1e-05重みデータ型:
FLOAT_16出力データ型:
FLOAT_16スケジューラ:
CONSTANTトレーニングデバイス:
cudaトレーニングデータ型:
BFLOAT_16(フォールバックはFLOAT_32)注意メカニズム:
SDP解像度:
512
検証とサンプリング
検証有効化:
true検証間隔:
1(エポック)サンプリング間隔:
200(ステップ)サンプル画像形式:
PNG
最適化器
最適化器:
ADAMW_8BIT重み減衰:
0.01Beta1:
0.9Beta2:
0.9998ビットブロックごと:
true確率的丸め:
true
最初は1e-5でトレーニングし、その後5e-5に減らし、さらにその他の値へと調整しました。












