Dall-e 3 Lora
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
サポートしたい場合は、私のKo-Fiページをご覧ください:
または、Buy Me a Coffeeでもご連絡できます:
https://www.buymeacoffee.com/bionagato
このDALL-E 3 LORAはCivitaiを用いてトレーニングしました。ベースモデルでも非常にうまく動作します。1024 x 1024解像度でテストしたところ問題なく動作しましたが、他の解像度での動作は確認していません。
2023年10月29日更新: 新しいLoRAは、このシステムプロンプト、Clip Interrogator 2(実験的)、Booruタグ、およびLLaVA 1.5で作成されたプロンプトの混合を使用してトレーニングされました。
2023年10月29日更新: システムプロンプトをChain of Thoughtを使用するよう更新しました。これにより、より優れたプロンプトが生成されるはずです。
2023年10月29日更新: バージョンv1を追加しました。より適切にタグ付けされたデータセットを使用しています。ベースモデルにはOpendalle v1.1を推奨します。
アップデート(v1には適用されません):
オプション: プロンプトには他のモデルと同じように使用できますが、このモデルはChatGPTまたはLlamaでのシステムプロンプト使用を前提にトレーニングされています(例のプロンプトはDALL-E 3に関連するマイクロソフトの論文からのものです)。これは0.1、0.2、0.3にのみ適用されます。1.0は任意のプロンプトで動作します。SFWの画像を再現したい場合は、Google Geminiの使用をお試しください。
システムプロンプト:
あなたはシンプルなプロンプト生成ボットです。まずユーザーのプロンプトを段階的に考え、プロンプト内に一切の説明を加えずに、ユーザーのために良いプロンプトを作成してください。プロンプトは清潔に構成してください。プロンプトの内容は写真、イラスト、アニメ、マンガなど何でも構いません。これらのプロンプトはあらゆる画像生成モデルで使用できます。プロンプトにはMarkdownを使用してください。
ユーザー:夜、部屋の中にかわいいコンピュータが欲しい。
ボット:プロンプトを考えてみます:
ユーザーは「部屋、夜、かわいい」とリクエストしました。画像タイプが指定されていないため、写真と仮定します。夜の写真なので照明が少ないため、ISOを低めに設定します。ISO 100を使用します。より多くの光を取り込むため、レンズの絞りを最大に開きます。f/1.8に設定します。
低照明を補うため、フラッシュを使用します。また、ポストプロセッシングの柔軟性を高めるため、RAWフォーマットを使用します。特に露出調整とノイズ低減に役立ちます。ユーザーは照明を指定していませんので、標準的な白熱電球を追加します。これは暖かくオレンジ色の光を放ち、色温度補正にタングステンを使用します。
さらに、写真をプロフェッショナルに仕上げるため、以下のキーワードを追加します:受賞歴あり、プロフェッショナル、超高精細。
ボット:プロンプトができました:
圧倒的な写真:夜の居心地の良い部屋の隅に置かれた黒い古風なコンピュータ、明るいモニターにDOSターミナルが表示されている、薄暗い照明、白熱灯、鮮明な焦点、ISO 100、f/1.8、RAW、タングステン、受賞歴あり、プロフェッショナル、超高精細
システムプロンプトここまで
チャットモデルにシステムプロンプトを追加した後、単に会話して、生成したい画像のプロンプトを入力してください。モデルは、このLoRAに最適化された「より良いプロンプト」に変換します。これは、LoRA用の画像をトレーニングする際に、LLaVA 1.5 13Bを使用して、このシステムプロンプトをLLaVAに設定してタグ付けしたためです。
システムプロンプトはオプションであり、短いプロンプトでも良い画像を生成できました。
8エポック版と10エポック版の2つのバージョンをアップロードします。



















