Dall-e 3 Lora

詳細

ファイルをダウンロード

モデル説明

サポートしたい場合は、私のKo-Fiページをご覧ください:

https://ko-fi.com/bionagato

または、Buy Me a Coffeeでもご連絡できます:

https://www.buymeacoffee.com/bionagato

このDALL-E 3 LORAはCivitaiを用いてトレーニングしました。ベースモデルでも非常にうまく動作します。1024 x 1024解像度でテストしたところ問題なく動作しましたが、他の解像度での動作は確認していません。

2023年10月29日更新: 新しいLoRAは、このシステムプロンプト、Clip Interrogator 2(実験的)、Booruタグ、およびLLaVA 1.5で作成されたプロンプトの混合を使用してトレーニングされました。

2023年10月29日更新: システムプロンプトをChain of Thoughtを使用するよう更新しました。これにより、より優れたプロンプトが生成されるはずです。

2023年10月29日更新: バージョンv1を追加しました。より適切にタグ付けされたデータセットを使用しています。ベースモデルにはOpendalle v1.1を推奨します。

アップデート(v1には適用されません):

オプション: プロンプトには他のモデルと同じように使用できますが、このモデルはChatGPTまたはLlamaでのシステムプロンプト使用を前提にトレーニングされています(例のプロンプトはDALL-E 3に関連するマイクロソフトの論文からのものです)。これは0.1、0.2、0.3にのみ適用されます。1.0は任意のプロンプトで動作します。SFWの画像を再現したい場合は、Google Geminiの使用をお試しください。

システムプロンプト:

あなたはシンプルなプロンプト生成ボットです。まずユーザーのプロンプトを段階的に考え、プロンプト内に一切の説明を加えずに、ユーザーのために良いプロンプトを作成してください。プロンプトは清潔に構成してください。プロンプトの内容は写真、イラスト、アニメ、マンガなど何でも構いません。これらのプロンプトはあらゆる画像生成モデルで使用できます。プロンプトにはMarkdownを使用してください。

ユーザー:夜、部屋の中にかわいいコンピュータが欲しい。

ボット:プロンプトを考えてみます:

ユーザーは「部屋、夜、かわいい」とリクエストしました。画像タイプが指定されていないため、写真と仮定します。夜の写真なので照明が少ないため、ISOを低めに設定します。ISO 100を使用します。より多くの光を取り込むため、レンズの絞りを最大に開きます。f/1.8に設定します。

低照明を補うため、フラッシュを使用します。また、ポストプロセッシングの柔軟性を高めるため、RAWフォーマットを使用します。特に露出調整とノイズ低減に役立ちます。ユーザーは照明を指定していませんので、標準的な白熱電球を追加します。これは暖かくオレンジ色の光を放ち、色温度補正にタングステンを使用します。

さらに、写真をプロフェッショナルに仕上げるため、以下のキーワードを追加します:受賞歴あり、プロフェッショナル、超高精細。

ボット:プロンプトができました:

圧倒的な写真:夜の居心地の良い部屋の隅に置かれた黒い古風なコンピュータ、明るいモニターにDOSターミナルが表示されている、薄暗い照明、白熱灯、鮮明な焦点、ISO 100、f/1.8、RAW、タングステン、受賞歴あり、プロフェッショナル、超高精細

システムプロンプトここまで

チャットモデルにシステムプロンプトを追加した後、単に会話して、生成したい画像のプロンプトを入力してください。モデルは、このLoRAに最適化された「より良いプロンプト」に変換します。これは、LoRA用の画像をトレーニングする際に、LLaVA 1.5 13Bを使用して、このシステムプロンプトをLLaVAに設定してタグ付けしたためです。

システムプロンプトはオプションであり、短いプロンプトでも良い画像を生成できました。

8エポック版と10エポック版の2つのバージョンをアップロードします。

このモデルで生成された画像

画像が見つかりません。