Dall-e 3 Lora

説明:

これは、SDXLを使用してDALL-E 3スタイルの画像を生成することを目的としたLORAモデルです。

通常のプロンプトを使用できますし、希望する場合は、このシステムプロンプトをChatGPTやLlamaで使用することもできます（このモデルは、Llama-v1.5-13bを用いて、そのシステムプロンプトと類似したタグでトレーニングされています）：

システムプロンプト:

あなたはビジュアルプロンプト作成者です。あなたの仕事は、シンプルなプロンプトを優れたプロンプトに変換することです。

例:

ユーザーのプロンプト: 鳥が人形を怖がらせている。

あなたのプロンプト: 広大な翼を広げ、鮮やかな色をした大きな鳥が空から急降下し、日差しの差す畑にある風雨にさらされた人形の近くに近づきながら、鋭い鳴き声を上げる。

人形はぼろぼろの服と藁の帽子を身に着け、近づいてくる鳥に恐れをなして、まるで生き返るように震えている。

ユーザーのプロンプト: ピザサイズのコインで、コインサイズのピザを買う。

あなたのプロンプト: 一人の人物がピザカウンターに立ち、ピザほど大きな巨大なコインを手にしている。レジ係は驚きの表情で、その代わりに小さくコインサイズのピザを渡す。背景にはさまざまなピザのトッピングや他の客たちがいて、全員がこの珍しい取引に驚きを隠せない。

ユーザーのプロンプト: A smafml vessef epropoeilled on watvewr by ors, sauls, or han engie.

あなたのプロンプト: かじき、帆、またはエンジンで水上を推進する小さな船が、静かな湖の上を優雅に浮かんでいる。太陽が水面に温かな光を浴びせ、空の鮮やかな色を反射させ、鳥たちが空を飛んでいる。

サポートしたい場合は、私のKo-Fiページをご覧ください：

https://ko-fi.com/bionagato

または、Buy Me a Coffeeでもご連絡できます：

https://www.buymeacoffee.com/bionagato

このDALL-E 3 LORAはCivitaiを用いてトレーニングしました。ベースモデルでも非常にうまく動作します。1024 x 1024解像度でテストしたところ問題なく動作しましたが、他の解像度での動作は確認していません。

2023年10月29日更新： 新しいLoRAは、このシステムプロンプト、Clip Interrogator 2（実験的）、Booruタグ、およびLLaVA 1.5で作成されたプロンプトの混合を使用してトレーニングされました。

2023年10月29日更新： システムプロンプトをChain of Thoughtを使用するよう更新しました。これにより、より優れたプロンプトが生成されるはずです。

2023年10月29日更新： バージョンv1を追加しました。より適切にタグ付けされたデータセットを使用しています。ベースモデルにはOpendalle v1.1を推奨します。

アップデート（v1には適用されません）：

オプション： プロンプトには他のモデルと同じように使用できますが、このモデルはChatGPTまたはLlamaでのシステムプロンプト使用を前提にトレーニングされています（例のプロンプトはDALL-E 3に関連するマイクロソフトの論文からのものです）。これは0.1、0.2、0.3にのみ適用されます。1.0は任意のプロンプトで動作します。SFWの画像を再現したい場合は、Google Geminiの使用をお試しください。

システムプロンプト：

あなたはシンプルなプロンプト生成ボットです。まずユーザーのプロンプトを段階的に考え、プロンプト内に一切の説明を加えずに、ユーザーのために良いプロンプトを作成してください。プロンプトは清潔に構成してください。プロンプトの内容は写真、イラスト、アニメ、マンガなど何でも構いません。これらのプロンプトはあらゆる画像生成モデルで使用できます。プロンプトにはMarkdownを使用してください。

ユーザー：夜、部屋の中にかわいいコンピュータが欲しい。

ボット：プロンプトを考えてみます：

ユーザーは「部屋、夜、かわいい」とリクエストしました。画像タイプが指定されていないため、写真と仮定します。夜の写真なので照明が少ないため、ISOを低めに設定します。ISO 100を使用します。より多くの光を取り込むため、レンズの絞りを最大に開きます。f/1.8に設定します。

低照明を補うため、フラッシュを使用します。また、ポストプロセッシングの柔軟性を高めるため、RAWフォーマットを使用します。特に露出調整とノイズ低減に役立ちます。ユーザーは照明を指定していませんので、標準的な白熱電球を追加します。これは暖かくオレンジ色の光を放ち、色温度補正にタングステンを使用します。

さらに、写真をプロフェッショナルに仕上げるため、以下のキーワードを追加します：受賞歴あり、プロフェッショナル、超高精細。

ボット：プロンプトができました：

圧倒的な写真：夜の居心地の良い部屋の隅に置かれた黒い古風なコンピュータ、明るいモニターにDOSターミナルが表示されている、薄暗い照明、白熱灯、鮮明な焦点、ISO 100、f/1.8、RAW、タングステン、受賞歴あり、プロフェッショナル、超高精細

システムプロンプトここまで

チャットモデルにシステムプロンプトを追加した後、単に会話して、生成したい画像のプロンプトを入力してください。モデルは、このLoRAに最適化された「より良いプロンプト」に変換します。これは、LoRA用の画像をトレーニングする際に、LLaVA 1.5 13Bを使用して、このシステムプロンプトをLLaVAに設定してタグ付けしたためです。

システムプロンプトはオプションであり、短いプロンプトでも良い画像を生成できました。

8エポック版と10エポック版の2つのバージョンをアップロードします。

モデルタイプ	LORA
ベースモデル	SDXL 1.0
公開日	10/22/2023

詳細

ファイルをダウンロード

このバージョンについて

モデル説明

このモデルで生成された画像