Cockpit 360 Diffusion LoRA for FLUX.1-dev
详情
下载文件
模型描述
概述
此 LoRA 在包含约 300 张图像的多样化数据集上训练了 27,250 次迭代,秩为 64,旨在生成驾驶舱和车辆内部的 360 度全景图像。
接缝和极坐标畸变伪影应尽量最小化,但可能仍需进行一些精细编辑或图像修复,以使图像看起来无缝。
使用方法
无需触发词,但与所有 360° Flux LoRA 一样,您应在提示中包含类似“360 度等距矩形视图”的表述,以提升输出质量。
通常,“cockpit”和“pilot's seat”可用于表示飞机,包括固定翼飞机和直升机。
“driver's seat”等术语可用于生成车内、卡车、公交车和火车内部的视角。
在渲染图像时,建议选择 2:1 的宽高比,例如 1024x512、1536x768 或 2048x1024。之后,您可以使用任意您选择的放大器将分辨率提升至适合用于天空盒、VR 或 2D/3D 环境的水平。
此模型还可用于 3D 世界工作流中的“文本到图像”环节:文本到图像 -> 图像到视频 -> 视频到 3D 世界。
附加工具
HTML 360 查看器
为便于查看和分享 360 度图像和视频,我开发了一个基于网页浏览器的本地 HTML 360 查看器。
您可在此 GitHub Pages 页面试用:https://progamergov.github.io/html-360-viewer/
您可在 URL 后附加
?url=及图像链接,即可自动加载至 360 查看器,极大简化了您的 360 创作分享流程。
推荐的 ComfyUI 节点
如果您使用 ComfyUI,以下节点集将有助于处理 360 度图像与视频。
ComfyUI_preview360panorama
用于在 ComfyUI 内预览 360 度图像和视频(可能比我的网页查看器慢)。
链接:https://github.com/ProGamerGov/ComfyUI_preview360panorama
ComfyUI_pytorch360convert
用于编辑 360 度图像,以及为模型应用圆形填充以提升输出质量。
对于 Diffusers 和其他库,您在处理 360 媒体时可使用 pytorch360convert 库。
局限性
数据集主要侧重于飞机驾驶舱和汽车前排座椅。
HuggingFace
该模型也可在 HuggingFace 下载(附带引用信息):https://huggingface.co/ProGamerGov/cockpit-360-lora-flux-dev






