Potg 🎨 Lumina-Image 2.0

これは成功とは呼びにくいです。うまくいくこともあれば、いかないこともあります。たまに、特徴的なアーティストのデジタルノイズテクスチャーが欠落し、非描画スタイルにフォールバックすることがあります。夢のような絵本插画スタイルはよく捉えられていますが、多くの解剖学的エラーが見られます。そのため、使用可能ではありますが、まだやや実験的な段階です。すべての失敗はデータセットの選択が悪かったせいだと考えているため、後で再学習するつもりです。

説明

Potg は、繊細で魅力的なアートワークで知られる日本のフリーランスイラストレーターで、主に複雑で雰囲気のある背景に描かれた若い女性を題材としています。彼女のスタイルは、伝統的な日本の美意識と現代的なデジタル技術を滑らかに融合させ、温かみと魅力に満ちたノスタルジックなシーンを生み出しています。

2024年5月、彼女は『Hikage Potg Works (ILLUSTRATION MAKING & VISUAL BOOK)』というアートブックをリリースしました。この本には過去の作品に加え、新作のイラストが収録されています。

potg は、感情を喚起する画像を通じて、現代日本のアートシーンに大きく貢献し続けており、伝統と現代性の独自の融合で鑑賞者を魅了しています。

使用方法

LoRA のトリガーワードは「Potg style」です。このワードなしでも動作することがありますが、含めることを推奨します。

画像は ComfyUI で、主にデフォルト設定（以下を含む）で生成しました：

shift: 6.0
steps: 40
cfg: 4.0
sampler: gradient_estimation
scheduler: sgm_uniform

学習

111枚の画像を使い、Molmo-7B-O（cyan2k による 4-bit クウォンツを使用）でキャプションを生成しました。キャプションのプロンプトは以下の通りです：

Describe this image as detailed as possible without describing style details.

すべてのキャプションには次のフレーズを前置しました：
"You are an assistant designed to generate high-quality images based on user prompts. Potg style."

学習は ai-toolkit を用いて行いました（RTX 3090、Windows 11）。ほとんどのハイパーパラメータはデフォルトのままでしたが、特に以下のような設定を使用しました：

network.linear: 32
network.linear_alpha: 32
optimizer: adamw8bit
optimizer_params.betas: [0.95, 0.98]
optimizer_params.weight_decay: 0.01
lr: 5e-5
noise_offset: 0.1
lr_scheduler: constant

50,000 ステップまで学習を行い、いくつかのテストを経た後、42,000 ステップの LoRA チェックポイントを公開用に選択しました。

モデルタイプ	LORA
ベースモデル	Lumina
公開日	2/26/2025
トレーニングワード	Potg style

Potg 🎨 Lumina-Image 2.0

詳細

ファイルをダウンロード

モデル説明

説明

使用方法

学習

このモデルで生成された画像