Cockpit 360 Diffusion LoRA for FLUX.1-dev

详情

模型描述

概述

此 LoRA 在包含约 300 张图像的多样化数据集上训练了 27,250 次迭代,秩为 64,旨在生成驾驶舱和车辆内部的 360 度全景图像。

接缝和极坐标畸变伪影应尽量最小化,但可能仍需进行一些精细编辑或图像修复,以使图像看起来无缝。

使用方法

无需触发词,但与所有 360° Flux LoRA 一样,您应在提示中包含类似“360 度等距矩形视图”的表述,以提升输出质量。

  • 通常,“cockpit”和“pilot's seat”可用于表示飞机,包括固定翼飞机和直升机。

  • “driver's seat”等术语可用于生成车内、卡车、公交车和火车内部的视角。

在渲染图像时,建议选择 2:1 的宽高比,例如 1024x512、1536x768 或 2048x1024。之后,您可以使用任意您选择的放大器将分辨率提升至适合用于天空盒、VR 或 2D/3D 环境的水平。

此模型还可用于 3D 世界工作流中的“文本到图像”环节:文本到图像 -> 图像到视频 -> 视频到 3D 世界。

附加工具

HTML 360 查看器

为便于查看和分享 360 度图像和视频,我开发了一个基于网页浏览器的本地 HTML 360 查看器。

推荐的 ComfyUI 节点

如果您使用 ComfyUI,以下节点集将有助于处理 360 度图像与视频。

对于 Diffusers 和其他库,您在处理 360 媒体时可使用 pytorch360convert 库。

局限性

数据集主要侧重于飞机驾驶舱和汽车前排座椅。

HuggingFace

该模型也可在 HuggingFace 下载(附带引用信息):https://huggingface.co/ProGamerGov/cockpit-360-lora-flux-dev

此模型生成的图像

未找到图像。