FFUSION AI - SD 2.1

详情

模型描述

📣 FFUSION AI SD2.1- 768 BaSE 公开版 1.0.0 已发布!
可在 https://huggingface.co/FFusion 获取 Diffusers 模型

ffusion-basesm32.jpg

STABLE DIFFUSION 2.1 768+ 模型

如果尚未使用 2.1 版本,请勿抱怨使用体验,建议仍使用 1.5 模型

🚀 在 Hugging Face Spaces 推出 FFusion.AI-beta-Playground!

https://huggingface.co/spaces/FFusion/FFusion.AI-beta-Playground
https://ffusion.ai/

──────────────────────────────────────

我们很高兴宣布,全新应用 FFusion.AI-beta-Playground 已在 Hugging Face Spaces 正式上线!这款尖端工具利用人工智能技术,根据您的提示词生成惊艳图像。🎨🖼️

──────────────────────────────────────

使用 FFusion.AI-beta-Playground,您可享受以下功能:

1️⃣ 从多种预训练模型生成图像,包括 FFUSION.ai-768-BaSE、FFUSION.ai-v2.1-768-BaSE-alpha-preview 和 FFusion.ai.Beta-512。

2️⃣ 尝试不同的调度器,精细调节图像生成过程。

3️⃣ 直接在浏览器中预览生成图像,并保存以备后续使用。

──────────────────────────────────────

本应用基于 diffusers 库构建,使用 StableDiffusionPipeline 进行图像生成,通过 Gradio 提供用户友好界面。更令人振奋的是:不久之后,得益于我们合作伙伴 RUNPOD 的支持,该应用将在配备 CUDA 的环境中运行,实现最佳性能!💻🚀

敬请期待这一即将推出的升级,将显著提升您的图像生成体验。我们非常荣幸能与 RUNPOD.io 合作,为您提供这项前沿技术。

──────────────────────────────────────

只需输入您的提示词,选择所需模型,选定调度器,其余由我们的应用为您完成。

──────────────────────────────────────

立即访问 FFusion.AI-beta-Playground,探索 FFusion/FFusion.AI-beta-Playground,开启专属图像创作之旅吧!🎉🎉

──────────────────────────────────────

我们期待看到您使用 FFusion.AI-beta-Playground 创造出的精彩作品。您的反馈对我们极为宝贵,请随时分享您的想法与建议。尽情探索人工智能图像生成的无限可能吧!💡🌟

🔭 我们很高兴推出 FFUSION AI 的公共测试版,但需说明:当前版本的功能尚有局限。模型仅在我们完整图像库的 20% 数据上训练,因此能力尚未完全展现。此早期版本主要用于测试不同提示词组合及初步验证。

💡 尽管我们致力于追求卓越表现,但仍需指出:模型的 Unet 组件在处理某些物体和人脸时仍处于优化阶段。请放心,我们正积极调整以迈向最终发布。

🙏 衷心感谢 Reddit 社区在内测阶段的鼎力支持,以及帮助文本编码器实现诸多精彩融合思路的宝贵建议。没有你们的支持,我们无法走到今天。

💡 您在本次测试阶段的参与至关重要。我们诚邀您深入探索模型,大胆尝试,并随时报告任何未能达标的提示词。您的反馈正是我们优化 FFUSION AI 性能与整体质量的指引之光。

⚠️ 注意:本模型基于 Stable Diffusion 2.1 - 512,最佳性能在约 600-700 像素分辨率内。对于更大图像,请推荐独立进行放大处理,或耐心等待即将发布的最终版本。下一版本将显著提升性能并支持更高分辨率。

👥 感谢您成为 FFUSION AI 测试社区的一员。您的支持、反馈与热情激励我们持续开发一款革命性的创意与可视化工具。让我们共同塑造故事与创造力的未来。

🔮 何不为您的最爱提示词添加特效,或将其融合,创造超现实的视觉奇观?(请注意:本测试版不支持 Pen Pineapple Apple Pan 风格及各类 Fusion 效果)

🔒 经过超过 730.9449 小时的专注训练,我们的 Fusion AI 模型具备丰富的数据子集与强大的数据集,这些均与两家企业级客户合作开发,用于 Mid Journey 项目。我们亦自豪于高效利用 GPU 资源,这得益于与 Idle Stoev、Source Code Bulgaria、Praesidium CX 与 BlackSwan Technologies 的深度合作。🚀

我们关于 70 万张图像数据集、训练方法、分类与成功实验的全面透明公开信息,将在最终版本发布后不久推出。此举将进一步确立 FFUSION AI 在人工智能创意领域中的可靠地位。让我们继续一同想象、创造与探索!

**
模型概览:释放想象力的无限力量!**

FFUSION AI 是基于顶尖潜变量扩散模型开发的先进图像生成与转换工具。依托 Stable Diffusion 2.1,FFUSION AI 将您的提示词转化为令人着迷的艺术作品。在这一充满想象力的领域中,创意以生动、超现实的视觉形式跃然呈现。

  • 开发方:Idle Stoev,Source Code Bulgaria,Praesidium CX 与 BlackSwan Technologies

  • 分享方:FFusion AI

  • 模型类型:基于扩散的文本到图像生成模型

  • 语言(NLP):英语

  • 许可协议:CreativeML Open RAIL++-M 许可证

模型用途:赋能创造力,探索人工智能前沿

旨在科研与艺术探索,FFUSION AI 在各类场景中均表现出高度灵活性:

范围外使用与禁止滥用

  • 生成人物或事件的不实描述

  • 造成伤害或传播恶意内容,如贬低性、非人性化或冒犯性图像

  • 制造有害刻板印象或传播歧视内容

  • 在未经同意的情况下冒充他人

  • 传播非自愿的色情内容或虚假信息

  • 违反版权或授权材料的使用条款

模型局限与偏见

尽管我们的模型正逐步接近人工智能创意的未来,但仍存在若干局限:

  • 完美实现写实或超现实风格仍是持续挑战。

  • 无额外 ~30 分钟针对品牌的训练,文本渲染可能难以识别。

  • 人类面部生成,尤其是远距离面部,尚不能保证准确(尚未实现)。

模型发布版本

我们很高兴宣布:

  • 版本 512 测试版:包含 LiTE 与 MiD BFG 模型变体

  • 版本 768 预览版:BaSE、FUSION 与 FFUSION 模型,具备增强训练能力,支持 LoRa、LyCORIS、Dylora 以及 Kohya-ss/sd-scripts

  • 版本 768 BaSE:已为 BaSE 状态优化,可轻松应用超过 200 个在训练过程中构建的 LoRA 模型

环境影响

秉持可持续发展理念,FFUSION AI 在设计时即考虑碳效率:

  • 硬件类型:A100 PCIe 40GB

  • 使用小时数:1190 小时

  • 云服务商:CoreWeave 与 Runpod(官方合作伙伴)

  • 计算区域:美国 Cyxtera 芝加哥数据中心 - ORD1 / 欧洲 - CZ 与 EU - RO

  • 碳排放量:124.95 公斤 CO2(通过机器学习影响计算器计算)

注:所有 LoRA 及后续模型均基于初始训练结果。

模型卡作者

本模型卡由 Idle Stoev 撰写,基于 Stability AI - Stable Diffusion 2.1 模型卡。

模型卡联系人

[email protected]

点击下载 FFUSION AI diffusers - 768 BaSE 发布版.

🔬 预期用途:从科研到艺术创作 🎨

Screenshot_1002.jpg

此模型生成的图像

未找到图像。