FFUSION AI - SD 2.1
详情
下载文件
关于此版本
模型描述
📣 FFUSION AI SD2.1- 768 BaSE 公开版 1.0.0 已发布!
可在 https://huggingface.co/FFusion 获取 Diffusers 模型

STABLE DIFFUSION 2.1 768+ 模型
如果尚未使用 2.1 版本,请勿抱怨使用体验,建议仍使用 1.5 模型

在 Hugging Face Spaces 推出 FFusion.AI-beta-Playground!
https://huggingface.co/spaces/FFusion/FFusion.AI-beta-Playground
https://ffusion.ai/
──────────────────────────────────────
我们很高兴宣布,全新应用 FFusion.AI-beta-Playground 已在 Hugging Face Spaces 正式上线!这款尖端工具利用人工智能技术,根据您的提示词生成惊艳图像。

──────────────────────────────────────
使用 FFusion.AI-beta-Playground,您可享受以下功能:
从多种预训练模型生成图像,包括 FFUSION.ai-768-BaSE、FFUSION.ai-v2.1-768-BaSE-alpha-preview 和 FFusion.ai.Beta-512。
尝试不同的调度器,精细调节图像生成过程。
直接在浏览器中预览生成图像,并保存以备后续使用。
──────────────────────────────────────
本应用基于 diffusers 库构建,使用 StableDiffusionPipeline 进行图像生成,通过 Gradio 提供用户友好界面。更令人振奋的是:不久之后,得益于我们合作伙伴 RUNPOD 的支持,该应用将在配备 CUDA 的环境中运行,实现最佳性能!

敬请期待这一即将推出的升级,将显著提升您的图像生成体验。我们非常荣幸能与 RUNPOD.io 合作,为您提供这项前沿技术。
──────────────────────────────────────
只需输入您的提示词,选择所需模型,选定调度器,其余由我们的应用为您完成。
──────────────────────────────────────
立即访问 FFusion.AI-beta-Playground,探索 FFusion/FFusion.AI-beta-Playground,开启专属图像创作之旅吧!

──────────────────────────────────────
我们期待看到您使用 FFusion.AI-beta-Playground 创造出的精彩作品。您的反馈对我们极为宝贵,请随时分享您的想法与建议。尽情探索人工智能图像生成的无限可能吧!

🔭 我们很高兴推出 FFUSION AI 的公共测试版,但需说明:当前版本的功能尚有局限。模型仅在我们完整图像库的 20% 数据上训练,因此能力尚未完全展现。此早期版本主要用于测试不同提示词组合及初步验证。
💡 尽管我们致力于追求卓越表现,但仍需指出:模型的 Unet 组件在处理某些物体和人脸时仍处于优化阶段。请放心,我们正积极调整以迈向最终发布。
🙏 衷心感谢 Reddit 社区在内测阶段的鼎力支持,以及帮助文本编码器实现诸多精彩融合思路的宝贵建议。没有你们的支持,我们无法走到今天。
💡 您在本次测试阶段的参与至关重要。我们诚邀您深入探索模型,大胆尝试,并随时报告任何未能达标的提示词。您的反馈正是我们优化 FFUSION AI 性能与整体质量的指引之光。
⚠️ 注意:本模型基于 Stable Diffusion 2.1 - 512,最佳性能在约 600-700 像素分辨率内。对于更大图像,请推荐独立进行放大处理,或耐心等待即将发布的最终版本。下一版本将显著提升性能并支持更高分辨率。
👥 感谢您成为 FFUSION AI 测试社区的一员。您的支持、反馈与热情激励我们持续开发一款革命性的创意与可视化工具。让我们共同塑造故事与创造力的未来。
🔮 何不为您的最爱提示词添加特效,或将其融合,创造超现实的视觉奇观?(请注意:本测试版不支持 Pen Pineapple Apple Pan 风格及各类 Fusion 效果)
🔒 经过超过 730.9449 小时的专注训练,我们的 Fusion AI 模型具备丰富的数据子集与强大的数据集,这些均与两家企业级客户合作开发,用于 Mid Journey 项目。我们亦自豪于高效利用 GPU 资源,这得益于与 Idle Stoev、Source Code Bulgaria、Praesidium CX 与 BlackSwan Technologies 的深度合作。🚀
我们关于 70 万张图像数据集、训练方法、分类与成功实验的全面透明公开信息,将在最终版本发布后不久推出。此举将进一步确立 FFUSION AI 在人工智能创意领域中的可靠地位。让我们继续一同想象、创造与探索!

**
模型概览:释放想象力的无限力量!**
FFUSION AI 是基于顶尖潜变量扩散模型开发的先进图像生成与转换工具。依托 Stable Diffusion 2.1,FFUSION AI 将您的提示词转化为令人着迷的艺术作品。在这一充满想象力的领域中,创意以生动、超现实的视觉形式跃然呈现。
开发方:Idle Stoev,Source Code Bulgaria,Praesidium CX 与 BlackSwan Technologies
分享方:FFusion AI
模型类型:基于扩散的文本到图像生成模型
语言(NLP):英语
许可协议:CreativeML Open RAIL++-M 许可证
模型用途:赋能创造力,探索人工智能前沿
旨在科研与艺术探索,FFUSION AI 在各类场景中均表现出高度灵活性:
研究生成模型中的偏见与限制
激发艺术创作中的无限创意
将人工智能驱动的创新融入教育或创意工具
推动生成模型这一前沿领域的研究进展
演示平台:https://huggingface.co/spaces/FFusion/FFusion.AI-beta-Playground
范围外使用与禁止滥用:
生成人物或事件的不实描述
造成伤害或传播恶意内容,如贬低性、非人性化或冒犯性图像
制造有害刻板印象或传播歧视内容
在未经同意的情况下冒充他人
传播非自愿的色情内容或虚假信息
违反版权或授权材料的使用条款
模型局限与偏见
尽管我们的模型正逐步接近人工智能创意的未来,但仍存在若干局限:
完美实现写实或超现实风格仍是持续挑战。
无额外 ~30 分钟针对品牌的训练,文本渲染可能难以识别。
人类面部生成,尤其是远距离面部,尚不能保证准确(尚未实现)。
模型发布版本
我们很高兴宣布:
版本 512 测试版:包含 LiTE 与 MiD BFG 模型变体
版本 768 预览版:BaSE、FUSION 与 FFUSION 模型,具备增强训练能力,支持 LoRa、LyCORIS、Dylora 以及 Kohya-ss/sd-scripts
版本 768 BaSE:已为 BaSE 状态优化,可轻松应用超过 200 个在训练过程中构建的 LoRA 模型
环境影响
秉持可持续发展理念,FFUSION AI 在设计时即考虑碳效率:
硬件类型:A100 PCIe 40GB
使用小时数:1190 小时
云服务商:CoreWeave 与 Runpod(官方合作伙伴)
计算区域:美国 Cyxtera 芝加哥数据中心 - ORD1 / 欧洲 - CZ 与 EU - RO
碳排放量:124.95 公斤 CO2(通过机器学习影响计算器计算)
注:所有 LoRA 及后续模型均基于初始训练结果。
模型卡作者
本模型卡由 Idle Stoev 撰写,基于 Stability AI - Stable Diffusion 2.1 模型卡。
模型卡联系人
点击下载 FFUSION AI diffusers - 768 BaSE 发布版.
🔬 预期用途:从科研到艺术创作 🎨






















