GAME DEV TOOLS 03 / TOPO

세부 정보

파일 다운로드

모델 설명


우리의 기사가 도움이 된다면, 팔로우해 주세요. 업데이트를 받을 수 있습니다. ko-fi도 함께 팔로우해 주신다면 더 좋습니다. 여기에는 더 많은 기사와 튜토리얼이 있으며, 제가 여러분께 매우 유용할 것이라 믿습니다!

如果你觉得我们的文章有料,请关注我获得更新通知,
如果能同时关注我们的 ko-fi 就更好了,
那里有多得多的文章和教程! 相信能使您获益良多.


협업 및 기사 재게재 문의는 [email protected]로 이메일을 보내주세요.
合作和文章转载 请发送邮件至 [email protected]


작성자: Ash0080

English


V4에 대해

실제로 이 모델을 학습할 당시, 저는 이를 V3Fix라고 이름지었습니다. 왜냐하면 학습 데이터셋이 V3와 정확히 동일했고, 단지 몇 가지 오류를 수정했기 때문입니다. 그러나 이 모델은 완전히 다른 전략으로 학습되었으며, 지금은 베이스 모델의 스타일에 거의 영향을 미치지 않는 스타일 무관 LoRa 모델입니다.

따라서, 이제 이 모델은 2D, 2.5D, 3D, Photo 등 거의 모든 유형의 베이스 모델에 적용할 수 있습니다. txt2Img나 img2img 모두, 더 이상 두 개의 모델이 필요 없습니다. 하나의 모델로 충분합니다. 사용 방식이 이토록 변화했기 때문에, 혼동을 방지하기 위해 저는 이 모델의 이름을 V4로 변경했습니다.

V4의 경우, 가중치를 1로 설정하면 충분합니다. 이 가중치를 낮추면 선의 강도를 어느 정도 줄일 수 있으나(그러나 선이 사라질 수도 있습니다), 저는 1에서 0.7 사이를 추천합니다.

HiRes, 얼굴 교정 및 팁 사용 등 기타 기능에 대해서는 현재로서는 V3의 지침을 참고해 주세요. 참고로, Hires Denoising Strength는 더 이상 0.33으로 제한되지 않으므로, 더 큰 값도 일반적으로 사용할 수 있습니다.

img2img는 크게 향상되었습니다. V3보다 이미지 스타일에 훨씬 더 관대해졌기 때문입니다. 이제 이미지에 토폴로지를 적용하는 능력이 훨씬 향상되었습니다.

무엇인가요?

이것은 모델에 토폴로지 선을 추가하는 도구로서의 실험 모델입니다. 최종 목표는 모든 것을 3D 세계로 끌어들이는 것입니다. (비록 그 목표는 여전히 멀었습니다.)

앞으로 NERF와 결합해 놀라운 무언가를 만들 수 있을지도 모르지만, 저는 확신할 수 없습니다!

왜인가요?

오랜 세월 게임 산업에서 일해 왔지만, 이제는 예술 관련 분야의 실무자로 활동하지는 않습니다. 그래도 여전히 AI가 게임 개발에 더 큰 가능성을 제공할 수 있다고 믿습니다. 물론, 이는 AI가 훌륭한 아티스트를 대체할 수 있다는 뜻은 아닙니다. 그러나 AI가 그들이 일상 업무에서 반복적인 작업을 줄이는 데 도움을 줄 수 있다고 저는 확신합니다. 이 시리즈의 GAME DEV TOOLS는 바로 이 아이디어에서 비롯되었습니다.

토폴로지는 3D 모델러가 습득해야 하는 핵심 기술입니다. 전문가들은 토폴로지의 품질을 통해 모델러가 초보자인지 전문가인지 판단하기도 합니다. 이는 업계에서 비밀이 아닙니다. 그러나 매우 숙련된 모델러조차도 토폴로지 다이어그램을 참고 자료로 남겨놓곤 합니다. 이는 효율성을 높이고 오류를 줄이는 데 정말 도움이 됩니다. 그래서 저는 AI가 토폴로지를 배우도록 이 도구를 만들어보려 했습니다.

행복하게도, 저는 어느 정도 성공했습니다.

TXT2IMG & IMG2IMG

이 도구는 텍스트에서 이미지로 생성하는 모델과 이미지에서 이미지로 생성하는 모델로 나뉩니다.

사용 방법

TXT2IMG는 비교적 간단합니다. 캔버스 크기는 한 변이 약 1024 픽셀이 적절합니다. 예를 들어 1024x1024, 768x1024, 1024x768 등입니다.

근경일 경우 약 768 픽셀로 줄일 수 있습니다. 왜냐하면 와이어프레임은 선을 명확히 그리기 위해 충분한 픽셀이 필요하기 때문입니다.

프롬프트의 끝에 wireframe, lora:topo_v3_t2i:0.6를 추가하세요.

다른 모델을 시도할 경우, LoRa 가중치는 0.6에서 0.9 사이를 권장하지만, 0.9를 넘지 않는 것이 좋습니다.

IMG2IMG는 약간 더 복잡합니다. 현재 저는 Google에서 검색한 일부 이미지만 공유하고 있습니다. 이 모델은 ControlNet과 함께 사용해야 하며, 나중에 별도의 튜토리얼을 작성하여 링크를 업데이트하겠습니다.

(업데이트된 튜토리얼)

TXT2IMG에 대한 더 자세한 튜토리얼:

https://civitai.com/articles/1065/can-lora-learn-topology

IMG2IMG 사용 가이드:

https://civitai.com/articles/1110/user-guide-for-topology-img2img

기능

고해상도 사용 가능! 0.33~0.44

ADetailer로 얼굴을 보정 가능! (전신 이미지를 그리는 경우 사용할 필요가 있습니다.)

positive 프롬프트에 "monochrome"를 추가하면 회색 모델을 그릴 수 있습니다.

negative 프롬프트에 "monochrome"를 추가하면 컬러 모델을 그릴 수 있습니다.

"green_skin", "red_skin"과 같은 프롬프트를 사용하면 와이어프레임 색상을 어느 정도 변경할 수 있습니다(완벽하지는 않습니다).

모델 선택

이 모델은 스타일 기반 모델이므로, 모든 모델에 적용 가능합니다. 2D 모델도 마찬가지입니다. 하지만 노이즈 오프셋이 없는 2.5D 모델이 가장 효과적입니다. (여기서 한마디 하자면, 현재 노이즈 오프셋이 과도하게 사용되는 것에 대해 저는 반대 입장입니다. 모두가 이 기능의 사용을 줄이길 바랍니다. 특히 LoRa 학습 시에는 절대 사용하지 마세요. 왜냐하면 노이즈 오프셋이 모델과 겹쳐 그림을 더럽히기 때문입니다. 90%의 LoRa 학습에는 노이즈 오프셋을 사용할 이유가 없습니다! 이는 원래 매우 훌륭한 발명이었지만, 그 의미를 제대로 이해하지 못한 많은 사람들이 남용해 왔고, 매우 유감스럽습니다.)

원하는 것을 그릴 수 없나요?

이 모델은 LoRa이므로 매우 큰 한계가 있습니다. 현재 TXT2IMG는 girl, boy, dog, pig, frog, rabbit, Mandalorian 등 그릴 수 있습니다. 그러나 메카 콘텐츠는 거의 불가능합니다(완전히 다른 스타일로 변합니다).

하지만 IMG2IMG는 적용 범위가 더 넓습니다. 다만, 그려내는 품질은 상대적으로 낮습니다(IMG2IMG이기 때문입니다).

더 유용하게 만들어 주실 수 있나요?

저는 더 많은 전문적인 협업을 기대합니다. IMG2IMG 모델은 일부 작업 요구를 충족시켜 도구처럼 사용할 수 있지만, 제가 스타일 영향을 최소화하려 노력하더라도 완전히 제거할 수 없습니다. 이는 LoRa 자체의 한계입니다. 그래서 저는 전문 게임 개발팀과 협업하여 실제 요구에 더 부합하는 모델을 만들고, 그 품질과 기능을 더욱 향상시키고자 합니다(예: 더 많은 아이디어들...).

中文


关于V4

这个其实在我训练的时候我给它起名叫V3Fix, 因为它的训练集数据和V3完全相同,我只是修复了一点错误。不过,它是用完全不同的方法训练,它现在是一个去风格化的LoRa模型,对底模的style影响微乎其微。

因此它现在可以被套用在几乎所有类型的底模上,包括2D, 2.5D, 3D, Photo, 并且,你不再需要两个模型,无论是txt2Img还是img2img, 一个模型就可以了, 因为它的使用方式发生了如此大的改变,我还是将它重命名为V4比较好吧,避免造成大家的混淆。

V4的权重给1就好了, 减小该权重可以一定程度上减弱线条的强度(但也可能会造成线条丢失),推荐1~0.7之间,其它包括 HiRes,修脸,使用tip,暂时请参照V3说明,我之后有空会再补充个教程。

Img2Img得到了非常大的改善,因为它对图片风格的宽容度比V3强太多了, 现在它变得更擅长给图片套上topology

是什么?

这是一个实验模型, 用来给模型添加拓扑线的工具。将一切都拉入3D世界(虽然这个目标还很遥远)

也许未来可以与nerf结合做点什么? 我不知道

为什么?

我曾经在游戏行业工作了许多年,虽然我现在早已不再是一个美术相关的从业者,但我仍然觉得AI在游戏开发中,应该存在着更多的可能性,当然这并不意味着AI可以取代那些优秀的艺术家,但我认为AI可以帮助他们减少一些日常工作中的重复性劳动,这个GAME DEV TOOLS系列都是基于这一想法而产生的一系列工具。

TOPOLOGY是3D模型师需要掌握的一个非常重要的技能,专业从业者甚至通过拓扑的好坏来判断一个模型师是新手还是老手,这并不是什么行业秘密。不过即使对于非常成熟的模型师来说,往往也会将一些拓扑图放在手边作为参考,这确实能提升工作效率和减少出错。因此,我尝试做了这个工具,希望让AI能学会拓扑。

幸运的是,我成功了(在某种程度上)。

TXT2IMG & IMG2IMG

这个工具分成两个模型, 分别用于文生图和图生图,

使用

TXT2IMG比较简单,画幅单边在1024左右,比如1024x1024, 768x1024, 1024x768等等,

如果是close_up可以降低到768左右。因为wirefame需要足够的像素才能画得清楚

在你的prompts末尾添加: wireframe, lora:topo_v3_t2i:0.6

如果你尝试其它模型,那么lora权重会建议在0.6~0.9, 但是最好不要超过0.9

IMG2IMG稍微复杂一些,我暂时只放一些图,这些原图都是从google中搜索的。

需要搭配ControlNet, 我会单独写一篇教程,晚点回来更新链接

能力

可以Hires! 0.33~0.44

可以ADetailer修脸!(如果你画的是full_body, 你很可能会需要用到它)

可以画灰色模型,在positive中加入 monochrome

可以画彩色模型,在negative中加入monochrome

可以一定程度改变wireframe颜色, 使用green_skin, red_skin之类的(不是很完美)

模型选择

因为是style模型,所有模型都适用,甚至2D模型也可以,

不过2.5D模型, 不带noise offset的模型效果最佳(插一句,我对目前泛滥的Noise Offset颇有意见,我希望大家能减少它的使用,尤其是训练lora不要使用,因为我发现它会与模型叠加,让画面变脏,可以说90%的LoRa训练都没理由用到它! 这本来是一个非常好的发明,但被很多不明所以的人滥用了,非常可惜。)

我想画的东西画不出?

因为它是LoRa,它有非常大的局限性,

TXT2IMG目前可以画的东西包括但不限于,

girl, boy, dog, pig, frog, rabbit, mandalorian

目前几乎不能画任何mecha内容(它会变成别的完全不同的风格)

但IMG2IMG可以有更宽泛的应用,但它的绘制质量要差一些(因为是IMG2IMG)

你可以帮助我将它做得更好

我期待更专业的合作,尽管IMG2IMG模型能够满足一些工作需求,让它更像个工具。但即使我尽可能的减弱风格的影响,但我没法完全消除它,这是LoRa本身局限。所以我期待着与专业游戏开发团队的合作,这样我可以做出更符合实际需要的风格的模型,也可以更进一步提升它的品质和功能(比如... 更多)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.