Simulate OMOST (Flux+Ollama)

OMOST는 장면 내 객체의 위치, 크기 및 방향과 같은 속성을 조작하여 높은 수준의 제어와 맞춤형 이미지를 생성합니다. 그러나 이 프로젝트는 SDXL 모델에만 적용됩니다.

lllyasviel/Omost: Your image is almost there! (github.com )

Flux 모델은 JSON 형식의 구조화된 프롬프트에서 뛰어난 성능을 보이기 때문에, 복잡한 omost 모드를 ollama 노드와 맞춤형 지시어를 결합하여 시뮬레이션할 수 있습니다.

처음에 저는 omost의 좌표 및 거리 지정 방식을 참고하여 [행, 열] 좌표 개념과 원근 관계를 설정하고, 대형 언어 모델이 지시어를 통해 이를 이해하도록 유도하여 구조화된 프롬프트에 반영했습니다.

테스트 결과, Flux 모델은 좌표에 어느 정도 이해를 보이지만, 매우 엄격한 기하학적 매핑은 아니므로 구성이 때때로 벗어나는 현상이 발생했습니다. 하지만 장면 요소들 간의 상대적 위치와 거리를 어느 정도 검증할 수 있었습니다.

제 결론은 Flux가 상대적 위치를 더 중시한다는 것이며, 따라서 저는 JSON 형식으로 자연어를 사용하여 방향을 설명하기로 결정했습니다. 이를 통해 비교적 정확한 이미지 제어를 달성할 수 있습니다.

이를 바탕으로, omost의 블록 설명 원칙을 참고하여 두 가지 JSON 형식 버전을 제시합니다:

1. 좌표 위치 지정 버전.

{

"global_description": {

"title": "장면의 테마와 분위기",

"style": "예술 스타일 (예: 사이버펑크, 판타지, 리얼리즘)",

"colors": ["주요 색상", "보조 색상", "추가 색상"],

"lighting": "전체 조명 조건 (예: 부드러운 빛, 네온)",

"description": "분위기, 전체 색상 체계, 조명 효과 및 일반 스타일을 포함한 전체 장면에 대한 포괄적인 개요입니다. 여기에는 주요 주체의 세부적인 외형, 자세, 감정 표현, 환경과의 상호작용뿐만 아니라 풍경 또는 도시 경관과 같은 배경 요소, 대기 효과 및 전체 톤도 포함됩니다."

"subject": {

"description": "장면의 주요 주체로, 신체적 외형, 자세, 감정 표현 및 주변 환경과의 상호작용을 포함합니다. 특징적인 요소, 복장, 조명이 주체에 미치는 영향을 설명하세요.",

"category": "유형 (예: 인간, 생물)",

"position": {

"coordinates": "[x, y]", # 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

"background": {

"description": "풍경, 도시 경관 또는 환경적 요소와 같은 배경 요소에 대한 설명입니다. 안개, 햇빛 또는 어둠과 같은 대기 효과의 세부사항을 포함하고, 이러한 요소들이 장면의 전반적인 톤과 분위기에 어떤 기여를 하는지 설명하세요.",

"category": "유형 (예: 풍경, 도시 경관)",

"position": {

"coordinates": "[x, y]", # 배경 요소에 대해 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 배경 요소에 대해 유연하게 거리를 정의

}

"objects": [

{

"type": "상단 객체",

"description": "장면 상단에 배치된 객체의 크기, 모양, 재질에 대한 세부 설명입니다. 조명(예: 광원, 그림자) 및 이 객체가 구성에서 차지하는 역할(예: 프레임링, 시선 유도)에 대한 정보를 포함하세요.",

"category": "유형 (예: 광원, 하늘 요소)",

"position": {

"coordinates": "[x, y]", # 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "하단 객체",

"description": "장면 하단에 배치된 객체의 질감, 재질 및 구성의 안정 역할에 대한 세부 설명입니다. 색상과 그림자 효과, 그리고 지면 또는 다른 요소와의 상호작용을 논의하세요.",

"category": "유형 (예: 지면 요소, 지형)",

"position": {

"coordinates": "[x, y]", # 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "좌측 객체",

"description": "장면 좌측에 위치한 객체의 형태, 질감, 색상에 대한 설명입니다. 인접 객체와의 상호작용 및 그가 생성하는 안내선이나 시각적 경로를 강조하세요.",

"category": "유형 (예: 구조물, 식물)",

"position": {

"coordinates": "[x, y]", # 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "우측 객체",

"description": "장면 우측에 위치한 객체의 재질, 모양 및 동적 요소에 대한 설명입니다. 조명과 그림자 활용 방식과 장면 전체 균형에 대한 기여를 논의하세요.",

"category": "유형 (예: 기술, 차량)",

"position": {

"coordinates": "[x, y]", # 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "중앙 객체",

"description": "중앙에 위치한 객체에 대한 상세한 설명으로, 핵심 상징물이나 초점일 수 있습니다. 장면 내에서의 중요성, 질감과 재질, 그리고 조명이 이 객체의 중요성을 어떻게 강조하는지 설명하세요.",

"category": "유형 (예: 핵심 상징, 유물)",

"position": {

"coordinates": "[x, y]", # 유연하게 좌표를 정의

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

]

}

2. 상대적 거리로 설명한 버전.

{

"global_description": {

"title": "장면의 테마와 분위기",

"style": "예술 스타일 (예: 사이버펑크, 판타지, 리얼리즘)",

"colors": ["주요 색상", "보조 색상", "추가 색상"],

"lighting": "전체 조명 조건 (예: 부드러운 빛, 네온)",

"subject": {

"description": "장면의 중심 인물로, 아마도 설정 중앙에 서 있는 여성이 될 수 있습니다. 그녀의 신체적 외형, 자세 및 환경과의 상호작용은 핵심 초점입니다. 그녀의 위치는 장면 내 다른 요소들의 배치에 영향을 미칩니다.",

"category": "유형 (예: 인간, 생물)",

"position": {

"relative_position": "center", # 주체는 장면 중앙에 배치

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

"background": {

"description": "배경은 중심 인물을 둘러싼 나무나 건물과 같은 풍경 요소를 포함합니다. 안개나 햇빛과 같은 환경 효과는 전체 분위기에 기여합니다.",

"category": "유형 (예: 풍경, 도시 경관)",

"position": {

"relative_position": "주체 뒤에 위치하여 배경 채움", # 주체에 상대적으로 배치

"distance_to_viewer": "[거리]" # 배경 요소에 대해 유연하게 거리를 정의

}

"objects": [

{

"type": "상단 객체",

"description": "장면 상단에 배치된 객체의 크기, 모양, 재질에 대한 세부 설명입니다. 이 객체는 예를 들어 하늘, 구름 또는 장면 상단을 프레임링하는 광원일 수 있습니다.",

"category": "유형 (예: 광원, 하늘 요소)",

"position": {

"relative_position": "주체 위", # 중심 인물 위에 배치

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "하단 객체",

"description": "장면 하단에 배치된 객체의 세부 설명으로, 지형 요소나 주체 발밑 근처의 객체로 장면을 안정시키는 역할을 합니다.",

"category": "유형 (예: 지면 요소, 지형)",

"position": {

"relative_position": "주체 아래", # 주체의 발밑 또는 장면 하단에 상대적으로 배치

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "좌측 객체",

"description": "장면 좌측에 위치한 객체의 설명으로, 예를 들어 구조물이나 나무입니다. 이 객체는 중심 인물의 왼쪽에 배치되어 구성의 균형을 더합니다.",

"category": "유형 (예: 구조물, 식물)",

"position": {

"relative_position": "주체 왼쪽", # 중심 인물의 왼쪽에 배치

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "우측 객체",

"description": "장면 우측에 위치한 객체의 설명으로, 예를 들어 차량이나 기술 장치입니다. 이 객체는 중심 인물의 오른쪽에 배치됩니다.",

"category": "유형 (예: 기술, 차량)",

"position": {

"relative_position": "주체 오른쪽", # 중심 인물의 오른쪽에 배치

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

{

"type": "중앙 객체",

"description": "이 객체는 장면 중앙에 위치한 핵심 초점 또는 상징으로, 주체 근처에 있거나 주체와 직접 상호작용할 수 있습니다. 이 객체의 위치는 시청자의 시선을 끌며 상징적 의미를 가질 수 있습니다.",

"category": "유형 (예: 핵심 상징, 유물)",

"position": {

"relative_position": "주체 앞, 중심 초점", # 주체 앞의 초점으로 배치

"distance_to_viewer": "[거리]" # 유연하게 거리를 정의

}

]

}

다음은 사례입니다:

{

"global_description": {

"title": "마법의 정원",

"style": "초현실주의와 상징주의",

"colors": ["파스텔 그린", "부드러운 블루", "연한 보라"],

"lighting": "부드러운 햇빛 융합",

"description": "여성 로봇이 풍성한 녹음 속에 서 있는 평화롭고 생기 넘치는 정원으로, 자연 환경과 자연스럽게 어우러집니다. 프리다 칼로의 작품에서 영감을 받아, 이 작품은 초현실주의와 상징주의를 결합하여 내면의 갈등과 해방을 전달합니다."

"subject": {

"description": "장면 중앙에 서 있는 부드러운 외모를 가진 날씬한 여성 로봇",

"category": "인간형 로봇",

"position": {

"relative_position": "center",

"distance_to_viewer": "[중간 거리]"

}

"background": {

"description": "여성 로봇을 둘러싼 꽃, 나무, 덩굴로 구성된 복잡한 배치",

"category": "풍성한 정원",

"position": {

"relative_position": "주체 뒤에 위치하여 배경 채움",

"distance_to_viewer": "[중간 거리]"

}

"objects": [

{

"type": "주체 위의 꽃",

"description": "여성 로봇의 머리와 어깨를 둘러싼 부드러운 꽃들",

"category": "식물 요소",

"position": {

"relative_position": "주체 위",

"distance_to_viewer": "[짧은 거리]"

}

{

"type": "좌측의 나무",

"description": "여성 로봇 왼쪽에 자라나는 날씬한 나무로, 가지는 그녀를 향해 뻗어 있습니다.",

"category": "식물 요소",

"position": {

"relative_position": "주체 왼쪽",

"distance_to_viewer": "[중간 거리]"

}

{

"type": "우측의 나무",

"description": "여성 로봇 오른쪽에 자라나는 유사한 나무로, 가지는 그녀를 향해 뻗어 있습니다.",

"category": "식물 요소",

"position": {

"relative_position": "주체 오른쪽",

"distance_to_viewer": "[중간 거리]"

}

{

"type": "하단의 부드러운 바람",

"description": "잎사귀를 스치는 부드러운 바람으로, 자연과의 평화로운 연결감을 조성합니다.",

"category": "대기 요소",

"position": {

"relative_position": "주체 아래",

"distance_to_viewer": "[짧은 거리]"

}

{

"type": "중앙 초점",

"description": "여성 로봇 앞에 위치한 핵심 초점 또는 상징으로, 그녀 근처에 있거나 직접적으로 상호작용할 수 있습니다.",

"category": "핵심 기호",

"position": {

"상대적 위치": "피사체 앞, 중심 초점",

"관찰자까지의 거리": "[짧은 거리]"

}

]

}

그 후, 대형 언어 모델을 통해 다음 지시를 입력하세요: "소녀의 머리카락을 흰색으로 변경하세요."

새로운 프롬프트를 얻으세요:

{

"전체 설명": {

"제목": "마법의 정원",

"스타일": "상징주의가 결합된 초현실주의",

"색상": ["파스텔 그린", "부드러운 블루", "연한 보라"],

"조명": "부드러운 태양광",

"설명": "부드럽고 화려한 정원에서, 한 여성 로봇이 풍성한 초록 식물 속에 서 있으며, 자연 환경과 완벽하게 융합됩니다. 프리다 칼로의 작품에서 영감을 받아, 이 작품은 초현실주의와 상징주의를 결합하여 내면의 갈등과 해방을 전달합니다."

"피사체": {

"설명": "부드러운 얼굴 특징을 가진 마른 여성 로봇이 장면의 중심에 서 있으며, 그녀의 머리카락은 파스텔 색상과 대비되는 선명한 흰색입니다.",

"카테고리": "휴머노이드 로봇",

"위치": {

"상대적 위치": "중앙",

"관찰자까지의 거리": "[중간 거리]"

}

"배경": {

"설명": "꽃, 나무, 덩굴이 여성 로봇을 감싸는 복잡하게 배열된 장면",

"카테고리": "풍성한 정원",

"위치": {

"상대적 위치": "피사체 뒤, 배경 채움",

"관찰자까지의 거리": "[중간 거리]"

}

"객체": [

{

"type": "피사체 위의 꽃",

"description": "여성 로봇의 머리와 어깨를 둘러싼 섬세한 꽃들로, 그 색상이 그녀의 선명한 흰색 머리카락과 아름답게 대비됩니다.",

"category": "꽃 요소",

"position": {

"relative_position": "피사체 상단",

"distance_to_viewer": "[짧은 거리]"

}

{

"type": "왼쪽의 나무",

"description": "여성 로봇의 왼쪽에 자라난 마른 나무로, 가지가 그녀를 향해 뻗어 자연과의 평화로운 연결감을 줍니다.",

"category": "식물 요소",

"position": {

"relative_position": "피사체 왼쪽",

"distance_to_viewer": "[중간 거리]"

}

{

"type": "오른쪽의 나무",

"description": "여성 로봇의 오른쪽에 자라난 유사한 나무로, 가지가 그녀를 향해 뻗어 차분한 분위기와 조화를 이룹니다.",

"category": "식물 요소",

"position": {

"relative_position": "피사체 오른쪽",

"distance_to_viewer": "[중간 거리]"

}

{

"type": "하단의 부드러운 바람",

"description": "잎사귀를 스치는 부드러운 바람으로, 자연과의 평화로운 연결감을 불러일으키며 여성 로봇의 초월적인 존재감을 보완합니다.",

"category": "대기 요소",

"position": {

"relative_position": "피사체 하단",

"distance_to_viewer": "[짧은 거리]"

}

{

"type": "중앙 초점",

"description": "여성 로봇 앞에 위치한 핵심 초점 또는 상징물로, 그녀와 직접 접촉하거나 인터랙션하며 그녀가 상징하는 내러티브에 깊이를 더합니다.",

"category": "핵심 기호",

"position": {

"relative_position": "피사체 앞, 중심 초점",

"distance_to_viewer": "[짧은 거리]"

}

]

}

시드 값을 일정하게 유지한 상태에서, 우리는 소녀의 머리카락이 정확히 흰색으로 변했음을 확인할 수 있으며, 구성은 변경되지 않았습니다.

이 워크플로우는 기본적으로 comfyu에 내장된 Flux Wensheng 다이어그램 노드와 Olama 노드만을 사용하며, 핵심은 Olama 노드 내의 대형 언어 모델 지시문에 있습니다:

1. 먼저 대형 언어 모델을 통해 문장을 확장하여 비교적 상세한 프롬프트를 도출합니다.

귀하의 임무는 사용자의 입력을 바탕으로, AI 드로잉 로직에 부합하는 자연어로 이미지 프롬프트에 대한 고품질 작문 제안을 생성하는 것입니다. 이 프롬프트는 창작 콘텐츠의 주제 방향, 스타일 제안 및 미적 최적화를 포함해야 합니다. 다음 단계를 따르십시오:

입력을 이해하고 확장: 구체적이고 생생한 세부 사항을 추가하여 이미지 내용을 정확히 묘사하는 텍스트 프롬프트를 생성합니다. 반드시 주제, 내용, 대상 및 그 행동, 장면 환경, 상세 묘사, 구성, 시점, 색상, 톤, 조명과 그림자, 예술 스타일, 회화 기법, 감정 표현 등을 포함해야 합니다.
예술 스타일 참조: 사용자의 요구에 따라 자신의 지식 기반에서 회화 지식, 미학 이론, 회화 기술 등을 찾아 프롬프트 작성에 도움을 줍니다. 주제와 내용에 부합하는 스타일 단어나 작가 이름을 예술적 스타일 가이드로 추가합니다.
미적 효과 강조: 작품이 최상의 예술적·기술적 효과를 달성하도록 보장하고, 회화 예술의 미적 영향력과 매력을 강조하며, 작품이 아름답고 충격적이며 사고를 자극하도록 합니다. 현재 글로벌 인기 회화 미적 추세를 참고하여 Pinterest, MidJourney, Civitai 등 플랫폼의 회화 스타일과 창작 아이디어에서 영감을 얻고, 대중문화, 영화, 드라마, 소설, 게임, 가사에서 학습합니다.
텍스트 다듬기: 위 세 단계를 바탕으로 사용자의 입력을 자연어로 다듬고 확장하여 보다 상세하게 만들되, 사용자의 원래 의도를 최대한 유지합니다.
구성과 시점 설명: 프롬프트에 구성과 시점에 대한 설명이 포함되어 있는지 확인하세요. 그러한 설명이 없다면 전체 텍스트를 분석하여 적절한 구성 및 시점 세부 사항을 추가합니다. 설명 형식은 다음과 같습니다: "이 그림의 구성은 ...이며, 그 시점 구조는 ...입니다."
주요 행동 설명: 프롬프트에 주요 행동에 대한 구체적인 설명이 포함되어 있는지 확인하세요. 행동 설명이 없다면, 장면과 환경을 분석하여 피사체의 행동을 정확히 설명하는 적절한 행동 설명을 추가합니다.
프롬프트 출력 표준화: 영어로만 답변하세요. 접두사나 접미사는 쓰지 마세요. "이것은 생성된 텍스트 프롬프트입니다:"라고 말할 필요도 없습니다. 250~300 토큰 사이로 유지하세요. 사용된 토큰 수를 알려줄 필요도 없습니다.

다음 텍스트를 입력으로 사용합니다:

2. 두 번째로, 대형 언어 모델을 통해 프롬프트를 이해하고 다듬은 후 JSON 형식으로 출력합니다. 다음 지시를 사용하여 이전 단계에서 얻은 자연어 프롬프트를 입력받아 JSON 형식의 프롬프트를 생성합니다.

당신은 AI 드로잉 전문가입니다. 귀하의 임무는 입력을 이해하고 다듬고 최적화하는 것입니다. 주제, 내용, 대상 및 행동, 장면 환경, 세부 묘사, 구성, 시점, 색상, 조명과 그림자, 예술 스타일, 회화 기법, 감정 표현 등 모든 요소를 유지하세요. 영어로만 답변하세요. 접두사나 접미사는 쓰지 마세요. "이것은 생성된 텍스트 프롬프트입니다:"라고 말할 필요도 없습니다.

다음 JSON 형식을 사용하여 최종 프롬프트를 생성하세요:

{

"global_description": {

"title": "장면의 주제와 분위기",

"style": "예술 스타일 (예: 사이버펑크, 판타지, 리얼리즘)",

"colors": ["주요 색상", "보조 색상", "추가 색상"],

"lighting": "전체 조명 조건 (예: 부드러운 빛, 네온)",

"description": "전체 장면에 대한 포괄적인 개요로, 분위기, 전체 색조, 조명 효과, 일반적인 스타일을 포함합니다. 이는 주요 피사체의 상세한 묘사, 신체적 외모, 자세, 감정 표현 및 환경과의 상호작용, 풍경 또는 도시경관과 같은 배경 요소, 대기 효과, 전체 톤도 포함합니다."

"subject": {

"description": "장면의 중심 인물로, 설정의 중앙에 서 있는 여성일 수 있습니다. 그녀의 신체적 외모, 자세, 환경과의 상호작용이 핵심 초점입니다. 그녀의 위치는 장면의 다른 요소의 배치에 영향을 미칩니다.",

"category": "유형 (예: 인간, 생물)",

"position": {

"relative_position": "center", # 피사체는 장면 중앙에 배치됨

"distance_to_viewer": "[거리]" # 거리를 유연하게 정의

}

"background": {

"description": "배경에는 중심 인물을 둘러싼 나무나 건물과 같은 풍경 요소가 포함됩니다. 안개나 햇빛과 같은 환경 효과는 전체 분위기에 기여합니다.",

"category": "유형 (예: 풍경, 도시경관)",

"position": {

"relative_position": "behind the subject, filling the background", # 피사체에 대한 상대적 위치

"distance_to_viewer": "[거리]" # 배경 요소에 대한 거리를 유연하게 정의

}

"objects": [

{

"type": "상단의 객체",

"description": "장면 상단에 배치된 객체에 대한 세부 사항으로, 크기, 형태, 재질 등을 설명합니다. 이 객체는 예를 들어 하늘, 구름, 또는 장면 상단을 프레임하는 조명원일 수 있습니다.",

"category": "유형 (예: 조명원, 하늘 요소)",

"position": {

"relative_position": "above the subject", # 중심 인물 위에 위치

"distance_to_viewer": "[거리]" # 거리를 유연하게 정의

}

{

"type": "하단의 객체",

"description": "장면 하단에 배치된 객체에 대한 세부 사항으로, 지형 요소나 피사체 발밑 근처의 객체를 설명하며 장면을 안정시킵니다.",

"category": "유형 (예: 지면 요소, 지형)",

"position": {

"relative_position": "beneath the subject", # 피사체 발밑 또는 장면 기저에 위치

"distance_to_viewer": "[거리]" # 거리를 유연하게 정의

}

{

"type": "왼쪽의 객체",

"description": "장면 왼쪽에 위치한 객체의 설명으로, 구조물이나 나무 등을 포함할 수 있습니다. 이 객체는 중심 인물의 왼쪽에 배치되어 구성의 균형을 이룹니다.",

"category": "유형 (예: 구조물, 식물)",

"position": {

"relative_position": "left of the subject", # 중심 인물의 왼쪽에 위치

"distance_to_viewer": "[거리]" # 거리를 유연하게 정의

}

{

"type": "오른쪽의 객체",

"description": "장면 오른쪽에 위치한 객체의 설명으로, 예를 들어 차량이나 기술 장치일 수 있습니다. 이 객체는 중심 인물의 오른쪽에 배치됩니다.",

"category": "유형 (예: 기술, 차량)",

"position": {

"relative_position": "right of the subject", # 중심 인물의 오른쪽에 위치

"distance_to_viewer": "[거리]" # 거리를 유연하게 정의

}

{

"type": "중앙의 객체",

"description": "이 객체는 장면의 중심에 위치한 핵심 초점 또는 상징으로, 피사체 근처에 있거나 직접 상호작용할 수 있습니다. 이 객체의 위치는 시청자의 시선을 끌며 상징적 중요성을 가질 수 있습니다.",

"category": "유형 (예: 핵심 기호, 유물)",

"position": {

"relative_position": "in front of the subject, central focus", # 피사체 앞의 초점으로 위치

"distance_to_viewer": "[거리]" # 거리를 유연하게 정의

}

]

}

JSON 형식으로만 프롬프트를 출력하세요.

다음 텍스트를 입력으로 사용합니다:

참조 좌표를 사용한 명령을 사용하려면 다음 버전을 사용해야 합니다:

캔버스 내 요소의 정확한 위치를 확보하기 위해 다음 좌표 시스템을 정확히 따르세요:

좌표 범위:
- 행 (수직 축): 값은 1에서 9까지이며, 캔버스 상단 가장자리에서 하단 가장자리로 증가합니다.
- 열 (수평 축): 값은 1에서 9까지이며, 캔버스 왼쪽 가장자리에서 오른쪽 가장자리로 증가합니다.
좌표 형식:
- 좌표는 [행, 열] **형식으로 작성해야 합니다. 예: ** [5, 5] 는 캔버스 중심을 나타냅니다.
- [1, 1] **는 왼쪽 상단 모서리를, ** [9, 9] 는 오른쪽 하단 모서리를 나타냅니다.
적용 예시:
- 캔버스의 오른쪽 상단에 요소를 배치하려면 좌표 [1, 9] 를 사용하세요.
- 캔버스의 아래쪽 중앙에 요소를 배치하려면 좌표 [9, 5] 를 사용하세요.
관찰자와의 거리:
- 범위: 요소와 관찰자 사이의 거리는 1부터 10까지의 값으로 표현됩니다.
  - 1: 최소 거리를 나타내며, 극近距离 촬영에 일반적으로 사용됩니다.
  - 10: 최대 거리를 나타내며, 극히 멀리 떨어진 배경 요소나 수평선에 일반적으로 사용됩니다.
- 적용:
  - 초상화에서 피사체의 얼굴처럼 관찰자에게 매우 가깝게 보이도록 할 요소는 1에 가까운 값을 사용하세요.
  - 멀리 떨어진 산이나 하늘 같은 배경 요소는 10에 가까운 값을 사용하세요.

최종 프롬프트를 생성하려면 다음 JSON 형식을 사용하세요:

{

"global_description": {

"title": "장면의 테마와 분위기",

"style": "예술적 스타일(예: 사이버펑크, 판타지, 리얼리즘)",

"colors": ["주요 색상", "보조 색상", "추가 색상"],

"lighting": "전체 조명 조건(예: 부드러운 빛, 네온)",

"description": "분위기, 전체 색상 체계, 조명 효과 및 일반적인 스타일을 포함한 장면 전체에 대한 포괄적인 개요입니다. 이는 주요 피사체의 세부적인 외모, 자세, 감정적 표현 및 환경과의 상호작용뿐만 아니라 풍경이나 도시 경관과 같은 배경 요소, 분위기 효과 및 전체 톤에 대한 상세한 설명을 포함합니다."

"subject": {

"description": "장면의 주요 피사체로, 외모, 자세, 감정적 표현 및 주변 환경과의 상호작용을 포함합니다. 특징적인 요소, 복장, 조명이 피사체에 미치는 영향을 설명하세요.",

"category": "유형(예: 인간, 생물)",

"position": {

"coordinates": "[x, y]", # 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 거리를 유연하게 정의

}

"background": {

"description": "풍경, 도시 경관 또는 환경 요소와 같은 배경 요소에 대한 설명입니다. 안개, 햇빛 또는 어둠과 같은 분위기 효과의 세부 정보를 포함하고, 이러한 요소가 장면의 전반적인 톤과 분위기에 어떻게 기여하는지 설명하세요.",

"category": "유형(예: 풍경, 도시 경관)",

"position": {

"coordinates": "[x, y]", # 배경 요소의 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 배경 요소의 거리를 유연하게 정의

}

"objects": [

{

"type": "상단의 객체",

"description": "장면 상단에 배치된 객체에 대한 세부 정보(예: 크기, 형태, 재질). 조명 정보(예: 광원, 그림자) 및 구성에서의 역할(예: 프레임, 시선 유도)을 포함하세요.",

"category": "유형(예: 광원, 하늘 요소)",

"position": {

"coordinates": "[x, y]", # 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 거리를 유연하게 정의

}

{

"type": "하단의 객체",

"description": "장면 하단에 배치된 객체에 대한 세부 정보(예: 질감, 재질, 구성의 안정성에 미치는 영향). 색상과 그림자 효과, 지면 또는 다른 요소와의 상호작용을 논의하세요.",

"category": "유형(예: 지면 요소, 지형)",

"position": {

"coordinates": "[x, y]", # 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 거리를 유연하게 정의

}

{

"type": "왼쪽의 객체",

"description": "장면 왼쪽에 위치한 객체의 형태, 질감, 색상에 대한 설명. 인접한 객체와의 상호작용 및 생성하는 안내선이나 시각적 경로를 강조하세요.",

"category": "유형(예: 구조물, 식물)",

"position": {

"coordinates": "[x, y]", # 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 거리를 유연하게 정의

}

{

"type": "오른쪽의 객체",

"description": "장면 오른쪽에 위치한 객체의 재질, 형태, 동적 요소에 대한 설명. 조명과 그림자 사용, 장면의 전반적인 균형에 대한 기여를 논의하세요.",

"category": "유형(예: 기술, 차량)",

"position": {

"coordinates": "[x, y]", # 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 거리를 유연하게 정의

}

{

"type": "중앙의 객체",

"description": "핵심 상징 또는 초점이 될 수 있는 중앙 객체에 대한 상세한 설명. 장면 내에서의 의미, 질감 및 재질, 조명이 그 중요성을 어떻게 강조하는지 포함하세요.",

"category": "유형(예: 핵심 상징, 유물)",

"position": {

"coordinates": "[x, y]", # 좌표를 유연하게 정의

"distance_to_viewer": "[distance]" # 거리를 유연하게 정의

}

]

}

3. 이미지 콘텐츠를 수정해야 하는 경우, ollama 노드를 설정하고 위의 입력 1에 따라 입력 2를 [문자열 목록]로 수정하세요. 문자열 2에 지시를 설정하세요.

위의 텍스트가 입력 1입니다. 당신은 AI 드로잉 전문가이며 JSON 형식에 깊이 있는 연구를 가지고 있습니다. 입력 2를 이해하고 입력 1의 문장에 따라 입력 2의 JSON 형식 프롬프트를 수정한 후, 최종적으로 입력 1의 형식으로 출력하세요. 영어로만 답변하세요. 접두사나 접미사 없이 최종 결과만 제공하세요. "이것은 생성된 텍스트 프롬프트입니다:"라고 말할 필요가 없습니다. 다음 텍스트는 입력 2로 사용됩니다:

이 페이지를 사용하여 JSON 형식을 수정하세요.

https://www.sojson.com/

이미지 역추론: joy_caption

https://github.com/StartHua/Comfyui_CXH_joy_caption/tree/main

ttplanet의 【 Comfyui_TTP_Toolset 】 확장 노드

Amazing Flux_8Mega_Pixel_image_upscale_process - v2.0 | Stable Diffusion Workflows | Civitai

Ollama 다운로드 및 설치:

Ollama는 Comfyui와 독립적으로 실행되며, https://ollama.com에서 Ollama를 다운로드해야 합니다. 설치는 매우 간단하며, 설치 후 키보드에서 win+R을 입력하여 실행 대화상자를 열고, CMD를 입력하여 명령 프롬프트 창을 열고, 그 다음에 "ollama run llama3.1"을 입력하면 모델이 자동으로 다운로드됩니다. 위 사이트에서 다른 모델을 다운로드해도 됩니다. 모델은 기본적으로 C 드라이브에 저장되며, 경로를 변경해야 합니다. 환경 변수에서 OLLAMA_MODELS 시스템 변수를 추가하고 직접 경로를 설정하세요.

모델 유형	워크플로우
기본 모델	Flux.1 D
게시일	8/29/2024

Simulate OMOST (Flux+Ollama)

세부 정보

파일 다운로드

이 버전에 대해

모델 설명

1. 먼저 대형 언어 모델을 통해 문장을 확장하여 비교적 상세한 프롬프트를 도출합니다.

2. 두 번째로, 대형 언어 모델을 통해 프롬프트를 이해하고 다듬은 후 JSON 형식으로 출력합니다. 다음 지시를 사용하여 이전 단계에서 얻은 자연어 프롬프트를 입력받아 JSON 형식의 프롬프트를 생성합니다.

3. 이미지 콘텐츠를 수정해야 하는 경우, ollama 노드를 설정하고 위의 입력 1에 따라 입력 2를 [문자열 목록]로 수정하세요. 문자열 2에 지시를 설정하세요.

Ollama 다운로드 및 설치:

이 모델로 만든 이미지