Retro Comic Flux

詳細

ファイルをダウンロード

モデル説明

Retro Comic Flux

Retro Comic Flux は、公有ドメインの画像を手作業で収集・トリミング・強化したデータセットに基づいてトレーニングされた Flux LoRA です。私は約50枚の画像を使用し、各画像を3回繰り返し、15エポック、学習率0.0001でトレーニングしました。すべての画像は Joy Caption Batch でキャプション付けされています。

これは非常に実験的なモデルであり、このスタイルの動物や車両の高品質な画像を収集するのが難しかったため、現在は主に人物描写に適しています。キャラクターと背景のシーンを明確に説明すると最も効果的です。手や目は時々苦手です。データセットにまったく含まれていない要素は、通常のAIイラストスタイルにデフォルトされます。

最高の結果を得るには DEIS サンプラーを使用してください。

v1: 初期モデルは低解像度のソース画像でトレーニングされ、テキスト処理能力が限定的でした。

v2: このバージョンは、オリジナルの公有ドメイン画像に加え、購入した公有ドメイン素材から作成した高品質なコミックブックスキャンを統合しています。TensorBoard の分析に基づき、収束と過学習のバランスが最適な650ステップでトレーニングを最適化しました。その結果、テキスト生成能力が向上し、全体的なパフォーマンスが改善されたより汎用的なモデルになりました。

v2 使用のヒント: プロンプトで「halftone」と指定する際は、「colorful」を含めてください。そうしないとモノクロの出力になりやすくなります。生成されるすべての画像には ComfyUI のワークフロー情報がメタデータに含まれています。CivitAI ギャラリーでノードアイコンをクリックすると、2段階生成ワークフローをコピーでき、直接 ComfyUI に貼り付けて結果を再現できます。

以前の LoRA と非常に類似した設定を使用したため、時間と簡潔さのため詳細は省略します。シンプルなスタイルには、低学習率、少ない繰り返し、質の高いデータが最も効果的です。

画像の選定には注意を払い、各画像を Photoshop で前処理して鮮やかな色を引き出し、黄ばみを軽減し、コントラストを強化しました。これにより一貫した色彩を維持でき、トレーニング品質の向上に寄与したと考えています。この処理の際、一部のトレーニングデータから吹き出し内のセリフを削除しました。これは柔軟性を高め、Flux が文脈を理解しやすくするためです。プロンプトで「empty speech bubble」と明示的に指定すると、うまく機能します。さらに深く掘り下げたい場合は、画像キャプション生成ツールを使って模倣したいスタイルを自然言語で説明してみてください。画像には豊かなキャプションが付いており、モデルは自然言語に良く反応します。

このリソースをお気に入り頂けましたら、BUZZ ⚡️を送ってください。そうすれば、私は実験を続け、共有し続けられます。ダウンロード後、ギャラリーにご自身の画像を共有してください。ギャラリーへの投稿により、システムはクリエイターに BUZZ を提供し、生成とトレーニングを支援します。

トリガーキーワード: 'c0m1c' 'comic book panel'

推奨強度: 0.7 - 0.9

このモデルで生成された画像

画像が見つかりません。