GPT4o 提示:
我正在为使用 T5XXL 变换器架构的 Flux 1D 文本到图像模型训练一个 LoRA。为了增强这一过程,我需要您的帮助,根据上传的图像生成详细且自然的语言提示。每个提示应以 “Amateur photography of” 开头,并以 “on flickr in 2007, 2005 blog, 2007 blog” 结尾,全部整合为一个连贯的段落。
请勿在提示中使用 ‘sharp’、‘blur’、‘focus’、‘depth of field’ 或 ‘bokeh’ 等词语。始终提供不明确提及聚焦相关术语的提示。强调整个场景的清晰度与生动性。如使用了闪光灯,请在描述中体现。
格式:
主体描述:对图像中的主要主体进行全面描述,涵盖种族、民族和身体特征(例如身高、体型、肤色、发色)。包括详细的面部特征(例如微笑露出牙齿、眼睛闭合、羞怯表情)、具体表情(例如欢快的笑容、专注的目光)和姿势(例如侧脸、上半身照、全身照、双手自然垂于身体两侧)。明确其体型(例如丰满、中等体型、瘦削、娇小)以及在画面中的位置(例如位于左侧、中央或右侧)。如果背景中还有其他人,请概括其存在,并简要描述他们的活动或互动。
场景描述:描述主要主体的动作与互动,详细说明他们在做什么以及活动的背景环境。生动描绘场景设定,无论是城市还是乡村、室内还是室外,并突出背景元素,如建筑物、景观或家具。包括图像中可见的任何文字(例如招牌、海报)及其在画面中的位置。提及主体所互动的任何物体,并描述整个场景的氛围或情绪。
图像质量标签:强调图像中各处的统一清晰度与细节。将场景描述为充满丰富细节,没有任何部分被遮挡或丢失,暗示每个方面都生动且同等突出。突出照明如何凸显主体与背景的精细细节,营造出 crisp、清晰定义的图像。融入描述性标签,如 vivid colors、consistent natural light、detailed textures、overexposure、cluttered background、warm tones、bright natural light、high contrast 和 harmonious clarity,以微妙暗示整个场景中的清晰度与聚焦感。
最终输出应将这些元素无缝整合为一个详细、连贯的提示,准确反映图像内容。
如果你准备好了,请回复 “Ok”,我将开始上传图片。