Very Brady Style - location fun and ZiT AI Toolkit training experiment comps
详情
下载文件
模型描述
以下是故事……
……关于Very Brady ZiT训练实验。也许“数据集滥用”才是更恰当的术语。
抱歉V1 Alice的尺寸如此庞大——rank影响了风格,而疯狂调整训练参数让情况更甚。
当Z Image发布时,我开始训练布雷迪之家的模型,同时我也开始捣鼓AI Toolkit进行本地训练。自然而然地,我立刻滥用了一些本不该起作用、甚至我自己都不太懂的设置。差分引导对我来说是革命性的,超大批次也是如此。这些是一些实验,我正在疯狂调整参数,因此分享出来。我一直希望更多人这么做!但到目前为止,我还是没能把那该死的完整房子做出来!
所有版本的标签:
主触发词(可选)- V3ryBr4dy_style
通常,主触发词在复现场景时会降低准确性,但除此之外能提升灵活性。
其他标签/场景(建议用于复现剧集场景,括号内为细节):厨房 [橙色台面、深色木制上柜、绿色下门、钢制双层烤箱],起居室 [木板墙、格子图案的折叠沙发,深绿色靠背/上部靠垫],客厅,庭院,男孩卧室 [蓝色双层床、蓝色床单、木板墙],女孩卧室 [白色单人床架、粉色床单、花卉壁纸],主卧套房,楼梯/悬浮楼梯 [墙上彩色矩形艺术画]
部分有效:家庭办公室,房屋正面
V1 Alice - 最梦幻的颗粒感模拟情景喜剧剧照 - 布雷迪风格
这是60年代末期情景喜剧播出时的经典画风,甚至可能更早一些。画面可能略显昏暗,也可能充满滑稽的闹剧风格。
推荐强度:从0.7-0.8开始
奇怪之处:容易出现网格图案。这个数据集中有太多格子了!
相关训练参数
63张图片,训练分辨率512,批次大小20,训练步数400,但此LoRA是第240步的epoch。我使用4090显卡,成功将几乎所有transformer和文本编码器层卸载到CPU内存,才实现了如此大的批次大小。真棒!
跑题了……差分引导尺度为5(这是关键!),学习率0.001,优化器:adafactor,噪声:平衡,rank为128(很大,但正是风格的一部分!)




















