GAME DEV TOOLS 03 / TOPO
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
記事が役に立った場合は、フォローして更新をお受け取りください。さらに、ko-fiもフォローしていただけると幸いです。ここには、皆様に非常に役立つと信じる、より多くの記事やチュートリアルが掲載されています!
如果你觉得我们的文章有料,请关注我获得更新通知,
如果能同时关注我们的 ko-fi 就更好了,
那里有多得多的文章和教程! 相信能使您获益良多.
協業や記事の転載に関するお問い合わせは、[email protected]までメールをお送りください。
合作和文章转载 请发送邮件至 [email protected]
作者:Ash0080
英語
V4について
実は、このモデルをトレーニングしていたとき、私は「V3Fix」と名付けました。なぜなら、トレーニングデータセットはV3とまったく同じで、わずかなエラーを修正しただけだったからです。しかし、このモデルはまったく異なる戦略でトレーニングされ、現在ではスタイル非依存のLoRaモデルとなり、ベースモデルのスタイルへの影響は極めて小さくなりました。
したがって、このモデルは2D、2.5D、3D、写真風など、ほぼすべてのベースモデルに適用可能です。また、txt2imgやimg2imgのどちらの場合でも、2つのモデルを必要としなくなりました。1つのモデルで十分です。使用方法が大きく変化したため、混乱を避けるために、私はこれをV4と名称を変更しました。
V4では、重みを1に設定すれば十分です。重みを下げると線の強さをある程度弱められますが(ただし、線が消える可能性もあります)、推奨される範囲は1~0.7です。
HiRes、顔補正、ヒントの使用など、その他の機能については、現時点ではV3の説明を参照してください。ちなみに、HiResのノイズ除去強度はもはや0.33に制限されず、より大きな値を通常通り使用できます。
img2imgは大幅に改善されました。V3よりも画像スタイルに対する許容範囲がはるかに広く、画像にトポロジーを適用する能力が格段に向上しました。
これは何ですか?
これは、モデルにトポロジー線を追加するための実験モデルです。最終的な目標は、すべてを3Dの世界に統合することです(ただし、その目標はまだ遠いです)。
将来的には、NERFと組み合わせて何か素晴らしいものを生み出せるかもしれません。しかし、私は確実にはわかりません!
なぜ作ったのですか?
長年ゲーム業界で働いてきました。今はアート関連の現場からは離れていますが、AIがゲーム開発においてさらに多くの可能性を秘めていると信じています。もちろん、AIが優れたアーティストを置き換えるという意味ではありません。しかし、日常的な作業の繰り返し作業を軽減する手助けになると確信しています。この「GAME DEV TOOLS」シリーズは、この考えに基づいて生まれたものです。
トポロジーは、3Dモデラーが習得すべき非常に重要なスキルです。プロの業界では、トポロジーの質でモデラーが新人かベテランかを判断することさえあります。これは業界では秘密ではありません。しかし、非常に経験豊富なモデラーでも、しばしばトポロジー図を手元に置いて参照し、効率を高めミスを減らしています。そこで私は、AIがトポロジーを学習できるようなツールを作ろうと考えました。
幸い、ある程度成功しました。
TXT2IMG と IMG2IMG
このツールは、テキストから画像への生成(TXT2IMG)と、画像から画像への生成(IMG2IMG)の2つのモデルに分けられています。
使用方法
TXT2IMGは比較的シンプルです。キャンバスサイズは1辺約1024ピクセルが適切です。例:1024x1024、768x1024、1024x768など。
クローズアップの場合は、768ピクセル程度まで縮小できます。ワイヤーフレームは十分なピクセルがないと明確に描画できないためです。
プロンプトの最後に、wireframe, <lora:topo_v3_t2i:0.6>を追加してください。
他のモデルで試す場合、LoRAの重みは0.6~0.9が推奨されますが、0.9を超えないようにしてください。
IMG2IMGはやや複雑です。現在、私が共有しているのはすべてGoogleで検索した画像です。ControlNetと組み合わせて使用する必要があります。別途チュートリアルを作成し、後でリンクを更新します。
(更新済みチュートリアル)
TXT2IMGの詳細チュートリアル:
https://civitai.com/articles/1065/can-lora-learn-topology
IMG2IMGの使用ガイド:
https://civitai.com/articles/1110/user-guide-for-topology-img2img
機能
ハイレゾ対応!0.33~0.44
ADetailerで顔を修正可能です!(全身を描く場合は使用を推奨します)
ポジティブプロンプトに「monochrome」を追加すると、グレーモデルを描画できます。
ネガティブプロンプトに「monochrome」を追加すると、カラー模型を描画できます。
「green_skin」「red_skin」などのプロンプトを用いると、ワイヤーフレームの色をある程度変更可能です(完璧ではありません)。
モデルの選択
スタイルモデルであるため、すべてのモデルに対応可能です。2Dモデルでも使用できます。
ただし、ノイズオフセットが含まれていない2.5Dモデルが最も効果的です(ここで一言:現在、ノイズオフセットの濫用には反対です。特にLoRAをトレーニングする際は、使用を控えていただきたいと思います。なぜなら、ノイズオフセットはモデルと重複し、画像を汚してしまうからです。90%のLoRAトレーニングには、ノイズオフセットの使用は全く不要です!これは本来素晴らしい発明でしたが、その本質を理解しない多くの人に濫用されてしまったのは非常に残念です)。
想像したものが描けませんか?
これはLoRAであるため、非常に大きな制限があります。
現在、TXT2IMGでは以下のものを描画可能です:女の子、男の子、犬、ブタ、カエル、ウサギ、マンダロリアンなど。
しかし、メカ(機械)系の内容はほぼ描画不可能です(まったく異なるスタイルになってしまいます)。
一方、IMG2IMGは適用範囲が広いですが、描画品質はやや劣ります(IMG2IMGであるため)。
あなたがこのモデルをより役立つように手伝ってくれますか?
私はより専門的な協業を強く望んでいます。IMG2IMGモデルは、ある程度の作業要件を満たし、ツールとしての役割を果たせるようになりました。しかし、私はスタイルへの影響を最小限に抑える努力をしても、完全に排除することはできません。これはLoRAの本質的な限界です。そのため、私は専門のゲーム開発チームと協力し、実際のニーズに合ったモデルをより正確に作成し、品質と機能をさらに向上させたいと考えています(例えば… 他にも多くのアイデアがあります)。
中文
关于V4
其实我在训练时给它起名叫V3Fix,因为它的训练数据集和V3完全一样,我只是修正了一些错误。但它是用完全不同的策略训练的,现在它已成为一个去风格化的LoRa模型,对基础模型风格的影响微乎其微。
因此,现在它可以应用于几乎所有类型的底模,包括2D、2.5D、3D和写实风格。而且,无论是txt2Img还是img2img,你都不再需要两个模型——一个就够了!因为它的使用方式发生了如此巨大的变化,为了避免混淆,我还是将它重新命名为V4。
V4的权重设为1即可。降低权重可在一定程度上减弱线条强度(但也可能导致线条丢失),建议使用1~0.7之间的数值。至于其他功能,如HiRes、面部修正、使用提示词等,请暂时参考V3的说明。我之后会抽空补充一份教程。
img2img已获得极大改进,因为它对图像风格的包容性远超V3,现在它能更出色地为图像套用拓扑结构。
这是什么?
这是一个实验性模型,用于为模型添加拓扑线条。最终目标是将一切带入3D世界(虽然这个目标还很遥远)。
也许未来可以与NERF结合,做出惊人的成果?我还不确定!
为什么?
我在游戏行业工作多年,虽然如今已不再从事美术相关工作,但我仍坚信AI在游戏开发中拥有更大的潜力。这当然不是说AI能取代优秀艺术家,但我相信它可以帮他们减少日常工作中重复性劳动。本系列“游戏开发工具”正是基于这一理念诞生的。
拓扑结构是3D建模师必须掌握的关键技能,专业从业者甚至会通过拓扑质量来判断一位建模师是新手还是老手,这在业内并非秘密。但即使是经验丰富的建模师,也常会把拓扑图放在手边作为参考,这确实能提升效率、减少错误。因此,我尝试制作这个工具,希望AI能学会拓扑。
幸运的是,我成功了(在某种程度上)。
TXT2IMG 与 IMG2IMG
这个工具分为两个模型:一个用于文生图(TXT2IMG),另一个用于图生图(IMG2IMG)。
如何使用
TXT2IMG相对简单,画布单边尺寸建议为1024像素左右,例如1024x1024、768x1024、1024x768等。
如果是特写镜头,可缩减至约768像素。因为线框需要足够像素才能清晰绘制。
在你的提示词末尾添加:wireframe, <lora:topo_v3_t2i:0.6>
如果你尝试其他模型,建议LoRA权重在0.6~0.9之间,但最好不要超过0.9。
IMG2IMG稍复杂一些。我目前仅分享了一些从Google搜索到的图片。它需要配合ControlNet使用,我会另写一篇详细教程,稍后回来更新链接。
(已更新教程)
TXT2IMG详细教程:
https://civitai.com/articles/1065/can-lora-learn-topology
IMG2IMG使用指南:
https://civitai.com/articles/1110/user-guide-for-topology-img2img
功能
支持高清重绘!0.33~0.44
可使用ADetailer修脸!(若绘制全身图,你很可能需要使用它)
在正面提示中加入“monochrome”可生成灰模
在负面提示中加入“monochrome”可生成彩模
可一定程度改变线框颜色,使用“green_skin”“red_skin”等提示(效果不完美)
模型选择
由于这是风格无关模型,所有模型均适用,包括2D模型。
但无噪声偏移的2.5D模型效果最佳(顺便说一句,我对当前噪声偏移的滥用深表异议,希望各位在训练LoRA时尽量避免使用它。我发现它会与模型叠加,使画面变脏,90%的LoRA训练根本无需使用它!这本是一个极好的发明,却被许多不了解其本质的人滥用,实在令人惋惜。)
我画不出想要的内容?
因为它是LoRA,存在显著局限性。
目前TXT2IMG可生成的内容包括但不限于:女孩、男孩、狗、猪、青蛙、兔子、曼达洛人。
几乎无法生成任何机械(mecha)内容(会变成完全不同的风格)。
但IMG2IMG的应用范围更广,不过其生成质量相对较低(因为是图生图)。
你可以帮助我让它更有用
我期待更专业的合作。尽管IMG2IMG模型已能满足部分工作需求,使其更像一个实用工具,但即使我尽力减弱风格影响,也无法完全消除——这是LoRA本身的局限。因此,我期待与专业游戏开发团队合作,以创建更贴合实际需求的模型,进一步提升其品质与功能(比如……还有很多想法)。





















