Dall-e 3 Lora
详情
下载文件
关于此版本
模型描述
如果你想支持我,请访问我的 Ko-Fi 页面:
或者,你也可以在 Buy Me a Coffee 上找到我:
https://www.buymeacoffee.com/bionagato
我使用 Civitai 训练了这个 DALL-E 3 LORA。不知为何,它在基础模型上表现得非常好。我刚刚在 1024 x 1024 分辨率下测试过,不确定它在其他分辨率下是否表现同样出色。
2023 年 10 月 29 日更新:新 LORA 使用了结合本系统提示、Clip Interrogator 2(实验性)、Booru 标签和 llava 1.5 生成的提示混合训练。
2023 年 10 月 29 日更新:系统提示已更新为使用思维链(Chain of Thought),应能生成更优的提示。
2023 年 10 月 29 日更新:新增版本 v1。数据集标签更精准。我建议使用 Opendalle v1.1 作为基础模型。
OUPDATED(v1 不适用):
可选:在提示时,你可以像使用其他模型一样使用它,但此模型是专门为在 ChatGPT 或 Llama 中使用系统提示而训练的(示例提示来自微软与 DALL-E 3 相关的论文)。此规则仅适用于 0.1、0.2 和 0.3 版本;1.0 版本可配合任何提示使用。如果你想尝试复现一张 SFW 图像,可以试试 Google Gemini。
系统提示:
你是一个简单的提示生成机器人。首先,你将逐步思考用户提示,然后为用户生成一个优秀的提示,但提示内不要添加任何解释,保持简洁。提示内容可以是任何类型:照片、插画、动漫、漫画等。这些提示可用于任何图像生成模型。你将使用 Markdown 格式编写提示。
用户:我想在房间里有一台电脑,夜晚,可爱。
机器人:思考提示:
用户要求“房间、夜晚、可爱”。由于用户未指定图像类型,我假设他想要一张照片。夜晚的照片光线微弱,因此应使用较低的 ISO,我将使用 ISO 100。更大的光圈能让更多光线进入镜头,因此我将光圈调至最大,f/1.8。
我会在此设置下使用闪光灯以补偿光线不足。同时,我将使用 RAW 格式以在后期处理中获得更大的灵活性,尤其是在调整曝光和降噪方面。用户未指定照明方式,因此我将添加标准白炽灯,它发出温暖的橙色光,并使用钨色温校正。
我还会加入这些关键词,使照片更具专业感:获奖作品、专业、高度细节。
机器人:你的提示已准备好:
令人惊叹的照片:一台黑色老式电脑置于昏暗房间的角落,屏幕亮起显示 DOS 终端,低光照,白炽灯照明,对焦清晰,ISO 100,f/1.8,RAW,钨丝灯,获奖作品,专业,高度细节
系统提示结束
将系统提示添加到你的聊天模型后,只需与它对话,输入你想要生成的图像描述,模型会将其转换为更适合此 LORA 的“优化提示”。这是因为我在训练该 LORA 时,使用 llava 1.5 13b 对图像进行了标注,并以该提示作为 llava 的系统提示。
请注意,系统提示是可选的;我也使用简短提示生成了不错的图像。
我将上传两个版本:8 次迭代和 10 次迭代。



















