Vision Realistic DiT

詳細

ファイルをダウンロード

モデル説明

ビジョンリアリスティックモデル概要

私は、HunyuanDiT-v1.2を基にした最新のチェックポイントモデルを紹介できることを心から楽しみにしています。このモデルは、高品質でフォトリアリスティックな画像を生成するために80,000ステップ以上トレーニングされています。

モデル詳細:

  • タイプ: フォトリアリスティックモデル
  • トリガー語: 必要なし
  • 中国語対応: なし
  • 出力: 実写写真に近い、高詳細・高解像度の画像

トレーニングに使用した設定:

  • GPU: A6000
  • データセット: 5,000枚のストックフォトと独自カスタムデータセットの組み合わせ
  • バッチサイズ: 2
  • 最適化アルゴリズム: AdamW
  • スケジューラ: Cosine
  • 学習率: 1e-5
  • エポック数: 100エポックを目標
  • キャプション作成: WD14とBLIPの混合
  • トレーニング時間: 27時間以上(経験:不良;今後のトレーニングは未定)

クイックガイドとパラメータ:

  • VAE: SDXL
  • サンプラー: dpmpp_2m
  • スケジューラ: sgm_uniform(最適な結果を得るには推奨)
  • サンプリングステップ: 25以上
  • CFGスケール: 7

より良い結果を得るには、ComfyUIの使用をお勧めします。

tensor.artで無料GPUアクセラレーション利用可能

重要: プロンプトにNSFW/大人向けコンテンツを使用しないでください。信頼できない結果を招く可能性があります。また、SD3およびDiTモデルでは、短めのプロンプトの方がより効果的です。

注意:

このモデルはマージまたは修正されたものではなく、元のRealistic Visionのファインチューニングモデルです。一部のユーザーがこのモデルのコメント欄で誤った情報を広めています。ご質問や詳細情報が必要な場合は、私のDiscordサーバーに参加するか、コメント欄にご意見をお寄せください。ご協力ありがとうございます。

このモデルで生成された画像

画像が見つかりません。