SECourses 3D Render for FLUX - Full Dataset and Workflow Shared
세부 정보
파일 다운로드
모델 설명
FLUX 스타일을 위한 전체 트레이닝 튜토리얼, 가이드 및 연구
모든 전체 워크플로우, 연구 세부사항, 프로세스, 결론, 체크포인트, 비교, 프롬프트 및 기타 세부 정보가 포함된 Hugging Face 저장소 > https://huggingface.co/MonsterMMORPG/3D-Cartoon-Style-FLUX
트리거 단어: ohwx 3d render
마지막 이미지는 트레이닝 데이터셋을 그리드 형태로 보여줍니다
이것은 공개 LoRA 스타일(4x A6000 GPU 각각에서 별도로 트레이닝)의 트레이닝입니다.
캡션 사용 여부를 실험하고 있으며, FLUX 스타일 트레이닝에 어떤 방식이 더 나은 결과를 낳는지 확인합니다.
멀티-GPU 배치 Joycaption 앱으로 생성된 캡션 사용.
멀티-GPU Joycaption 앱을 사용했습니다(초고속 캡션 생성에 8x A6000 GPU 사용)
https://www.patreon.com/posts/110613301

일부 단어를 수정하고 활성화 토큰으로 "ohwx 3d render"를 추가하기 위해 Gradio 배치 캡션 편집기를 사용했습니다
https://www.patreon.com/posts/108992085

캡션이 없는 데이터셋은 캡션으로 "ohwx 3d render"만 사용합니다
4x A6000 GPU에서 가장 최신의 4x_GPU_Rank_1_SLOW_Better_Quality.json 설정을 사용하여 500 에포크, 114장의 이미지로 트레이닝 중입니다
https://www.patreon.com/posts/110879657

모든 트레이닝은 Float 형식으로 저장되며 LoRA 네트워크 랭크는 128로, 각 체크포인트가 2GB 이상입니다
일관성 없는 데이터셋 트레이닝
아래 데이터셋을 사용해 제가 처음으로 수행한 트레이닝입니다
Inconsistent-Training-Dataset-Images-Grid.jpg
위에 공유된 그리드 이미지를 자세히 보면 데이터셋이 일관되지 않다는 것을 알 수 있습니다.
캡션 사용 트레이닝(오직 "캡션あり" 트레이닝용)에 사용된 트레이닝 데이터셋은 아래 디렉토리에서 확인할 수 있습니다
총 114장의 이미지가 포함되어 있습니다
이 트레이닝의 총 스텝 수는 500 * 114 / 4 (4x GPU - 배치 크기 1) = 14250 스텝입니다
천천한 설정으로 4x RTX A6000 GPU에서 약 37시간이 걸렸으며, 빠른 설정이라면 절반 정도 소요되었을 것입니다
이 데이터셋으로 2개의 트레이닝을 수행했습니다. 에포크 500 체크포인트는 다음과 같이 명명되었습니다
SECourses_Style_Inconsistent_DATASET_NO_Captions.safetensors SECourses_Style_Inconsistent_DATASET_With_Captions.safetensors
이 체크포인트는 아래 폴더에 저장되어 있습니다
Training-Checkpoints-NO-Captions Training-Checkpoints-With-Captions
그리드 결과는 아래에 공유되어 있습니다
Inconsistent-Training-Dataset-Results-Grid-26100x23700px.jpg
위 이미지를 자세히 보면 결과가 일관되지 않음을 알 수 있습니다
일관성 있는 데이터셋 트레이닝
초기 트레이닝 데이터셋이 일관되지 않다는 것을 인지한 후, 데이터셋을 정제하여 훨씬 더 일관되게 만들었습니다
Fixed-Consistent-Training-Dataset-Images-Grid.jpg
위에 공유된 그리드 이미지를 보면 훨씬 더 일관된 것을 알 수 있지만, 여전히 완벽하지는 않습니다
이제 총 66장의 이미지가 포함되어 있습니다
이 트레이닝에 사용된 캡션 포함 데이터셋(오직 "캡션あり" 트레이닝용)은 아래 디렉토리에서 확인할 수 있습니다
Fixed-Consistent-Training-Dataset
이 트레이닝의 총 스텝 수는 500 * 66 / 4 (4x GPU - 배치 크기 1) = 8250 스텝입니다
천천한 설정으로 4x RTX A6000 GPU에서 약 24시간이 걸렸으며, 빠른 설정이라면 절반 정도 소요되었을 것입니다
이 데이터셋으로 2개의 트레이닝을 수행했습니다. 에포크 500 체크포인트는 다음과 같이 명명되었습니다
SECourses_3D_Render_Style_Fixed_Dataset_NO_Captions.safetensors SECourses_3D_Render_Style_Fixed_Dataset_With_Captions.safetensors
이 체크포인트는 아래 폴더에 저장되어 있습니다
Training-Checkpoints-Fixed-DATASET-NO-Captions Training-Checkpoints-Fixed-DATASET-With-Captions
그리드 결과는 아래에 공유되어 있습니다 - 이 결과에는 일관성 없는 데이터셋의 결과도 포함되어 있습니다
Fixed-Consistent-Training-Dataset-Results-Grid-50700x15500px.jpg
위 이미지를 보면 이제 결과가 훨씬 더 일관된 것을 알 수 있습니다
최고의 체크포인트 및 결론
일관성 없는 데이터셋을 사용할 때, 캡션을 포함한 트레이닝이 훨씬 더 나은 결과를 냈습니다.
그러나 일관성 있는 데이터셋을 사용한 트레이닝에서는, 캡션이 없는 경우가 초기 에포크에서 더 나은, 일관된 결과를 냈습니다.
따라서 저는 캡션 없는 데이터셋의 75 에포치 체크포인트가 최고라고 판단했습니다.
아래는 일관성 있는 데이터셋에 대한 비교 이미지입니다
Fixed-Consistent-Training-Dataset-No-Captions-Only-Grid.jpg
Fixed-Consistent-Training-Dataset-With-Captions-Only-Grid.jpg
최고 체크포인트 다운로드 링크: Training-Checkpoints-Fixed-DATASET-NO-Captions/SECourses_3D_Render_Style_Fixed_Dataset_NO_Captions-000075.safetensors
75 에포크는 75 * 66 / 4 = 1238 스텝에 해당합니다
스타일 트레이닝을 위한 튜토리얼
1 : https://youtu.be/bupRePUOA18
FLUX: 미드저니 및 다른 모델을 실제로 능가하는 최초의 오픈소스 txt2img 모델 - FLUX는 SD3를 기다리며
2 : https://youtu.be/nySGu12Y05k
FLUX LoRA 트레이닝 간소화: Kohya SS GUI로 제로에서 헤로까지 (8GB GPU, Windows) 튜토리얼 가이드
3 : https://youtu.be/-uhL2nW7Ddw
Massed Compute 및 RunPod를 사용한 빠르고 초저가 FLUX LoRA 트레이닝 튜토리얼 - GPU 불필요!
이 데이터셋은 상업적 사용이 불가능합니다

그리드 테스트 프롬프트 - 그리드에서 선택된 예시 이미지 (선별되지 않음)
a ohwx 3d rendering of a car
a car rendered in ohwx 3d style
a ohwx style car image
a ohwx render of a car
a ohwx car
a ohwx 3d rendering of a chest, depicted in a cartoon style. The background is a plain white, making the chest and its contents stand out clearly. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give the chest a realistic, three-dimensional appearance. The metal bands and rivets add a sense of realism and durability to the chest. The image is vibrant and eye-catching, inviting the viewer to imagine the treasure within. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold, with a focus on oranges, browns, and golds to create a sense of warmth and excitement. The overall mood is one of excitement and discovery.
a ohwx 3d rendering of an airplane, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
a ohwx 3d rendering of a battleship, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
a ohwx 3d rendering of a robot, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
a ohwx 3d rendering of a dog, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
a ohwx 3d rendering of a cat, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
a ohwx 3d rendering of an axe, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
a ohwx 3d rendering of a house, depicted in a cartoon style. The background is a plain white. The overall style is playful and whimsical, with clean lines and bright colors, suggesting a fantasy or adventure theme. The illustration is highly detailed, with a focus on textures and shading to give a realistic, three-dimensional appearance. The image is vibrant and eye-catching. The illustration is likely used in a digital context, such as a game or a children's book. The colors are bright and bold to create a sense of warmth and excitement.
ohwx 3D 렌더링된 드래곤, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 꽃, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 장미, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 탱크, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 컴퓨터, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 그래픽 처리 장치(GPU), 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 포크, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 자물쇠, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
ohwx 3D 렌더링된 우산, 만화 스타일로 묘사됨. 배경은 단순한 흰색. 전체적인 스타일은 장난스럽고 환상적이며, 선명한 선과 밝은 색상으로 판타지 또는 모험 테마를 암시함. 일러스트는 텍스처와 음영에 초점을 맞춰 사실적인 3차원 외관을 구현하기 위해 매우 상세함. 이미지는 화려하고 눈에 띄며, 게임이나 아동 도서와 같은 디지털 맥락에서 사용될 가능성이 높음. 색상은 밝고 강렬하여 따뜻함과 흥분을 조성함.
지난 달 다운로드
**\-**
이 [모델의](http://model.How) 다운로드는 추적되지 않습니다. [다운로드 통계를 추적하는 방법](https://huggingface.co/docs/hub/models-download-stats)
**추론 API**
이 모델의 라이브러리를 판단할 수 없습니다. 확인하세요


















