Flow 🎨 Flux.1-D
详情
下载文件
模型描述
概述
“Flow” 是一部由拉脱维亚电影人金茨·齐尔巴洛迪斯执导的2024年动画冒险电影。故事讲述一只深灰色的猫在被水淹没的后末日世界中跋涉,途中伴随各种动物,共同寻求生存与陪伴。值得注意的是,该片完全无声,仅依靠视觉叙事和真实的动物声音来传达情节。
《Flow》的制作历时五年半,使用了开源动画软件Blender。影片于2024年5月22日在戛纳电影节“一种关注”单元首映,成为自1998年以来首部入选该单元的拉脱维亚电影,具有里程碑意义。影片获得广泛好评,并打破多项拉脱维亚票房纪录,成为拉脱维亚影院历史上观看人数最多的电影,超越了所有本土及外国影片。2025年1月,《Flow》荣获金球奖最佳动画长片奖,进一步巩固了其在全球电影业的地位;2025年3月2日,在第97届奥斯卡金像奖上,它又斩获最佳动画长片奖,这是拉脱维亚历史上首座奥斯卡奖。
使用方法
本模型为LyCORIS,可直接在ComfyUI中使用。训练时使用的触发词为“In style of Flow”,但可能不使用触发词也能生效(我尚未测试,我发布的所有图像均包含该触发词)。
我在推理时使用了以下参数:
Model: flux1-dev (fp8_e4m3fn)
Text Encoder: t5pxxl_fp16/clip_l
Sampler: euler
Scheduler: normal
Steps: 24
Flux Guidance: 4
LoRA Strength: 1
未测试与其他检查点或模型的兼容性。
由于电影视觉风格的特殊性(无人物,仅有动物)以及数据集相对有限,该模型的渲染能力具有一定局限性,无法始终可靠地生成复杂场景,尤其是画面中无动物时。
有时(较少见)它会将人类转化为猫,或(更常见)给人类加上猫耳朵。我不确定造成这一现象的原因——是标注错误、训练参数不佳(这是我制作的第一个LyCORIS模型),还是其他问题。起初我对此感到尴尬,甚至考虑重新训练模型。但很快我意识到,每当发生这种情况,反而显得可爱甚至具有网络迷因特质,尤其是人类模样变得滑稽时。因此,我决定将这个“bug”当作一个特色,作为送给毛茸茸爱好者的一份小礼物 😆
尽管我对该模型并不完全满意(因上述问题,且背景有时过于写实),但我认为它整体表现尚佳,较好地捕捉并有效泛化了原作的角色设计与风格。此外,即使使用相同种子,该模型也能在有无LyCORIS时彻底改变图像构图,我通常认为这是良好表现的标志。毕竟,一个训练得当的风格模型不应只是一个调色板滤镜。
我怀疑模型可能存在轻微过拟合,因此未来或许会使用更多样化的数据集重新训练,但目前尚不确定。
训练
本模型使用 ai-toolkit 在 RTX 3090 上训练而成,共使用67张图像。图像标注采用 CogVLM2,并应用以下标注提示:“用自然叙述性语言描述场景,仅描述可见的物理元素和位置,包括关键物体、结构和环境细节,不提及艺术风格、情绪或氛围。避免主观描述、气氛或质量判断,使用自然的语言结构与流畅性。”
训练使用默认配置,并做以下调整:
network.type: lokr
network.lokr_full_rank: true
network.lokr_factor: 8
network.linear: 16
network.linear_alpha: 16
datasets.caption_dropout_rate: 0.1
train.optimizer: lion
train.lr: 2e-4




















