FFUSION AI - SD 2.1

詳細

ファイルをダウンロード

モデル説明

📣 FFUSION AI SD2.1-768 BaSE パブリック 1.0.0 リリース登場!
Diffusersはhttps://huggingface.co/FFusionで利用可能

ffusion-basesm32.jpg

STABLE DIFFUSION 2.1 768+ モデル

2.1を使用したことがないなら、2.1について不満を言う前に1.5モデルに留まってください。

🚀 Hugging Face Spaces で FFusion.AI-beta-Playground をリリース!

https://huggingface.co/spaces/FFusion/FFusion.AI-beta-Playground
https://ffusion.ai/

──────────────────────────────────────

私たちは、新しいアプリケーション FFusion.AI-beta-Playground のリリースを発表し、Hugging Face Spaces上にライブ化したことを非常に嬉しく思います! この最新技術を活用したツールは、あなたのプロンプトに基づいて驚くべき画像を生成するためのAIの力を活かしています。 🎨🖼️

──────────────────────────────────────

FFusion.AI-beta-Playground を使って、以下のことが可能になります:

1️⃣ FFUSION.ai-768-BaSE、FFUSION.ai-v2.1-768-BaSE-alpha-preview、FFusion.ai.Beta-512 など、さまざまな事前学習済みモデルから画像を生成。

2️⃣ サchedulerを変更して画像生成プロセスを最適化。

3️⃣ ブラウザ上で生成された画像を確認し、後に保存。

──────────────────────────────────────

このアプリケーションは、diffusersライブラリを基盤とし、画像生成にはStableDiffusionPipelineを利用しています。 インターフェースはGradioで構築され、非常に使いやすいです。 そして、ここがさらに楽しい点です:今後まもなく、RUNPOD社の協力によりCUDA対応環境で動作し、最適なパフォーマンスを発揮するようになります! 💻🚀

まもなく登場するこの強化機能で、あなたの画像生成体験が次のレベルへと引き上げられます。 私たちは、RUNPOD.io と提携することで、先進的な技術をあなたに届けることができることを非常に嬉しく思います。

──────────────────────────────────────

スタートするには、ただプロンプトを入力し、使用したいモデルを選択し、schedulerを選び、後はあとはアプリケーションにお任せください。

──────────────────────────────────────

今すぐ FFusion.AI-beta-Playground を FFusion/FFusion.AI-beta-Playground でチェックし、今日から独自の画像を創作し始めましょう! 🎉🎉

──────────────────────────────────────

FFusion.AI-beta-Playground で何を作るか、私たちも非常に楽しみです。 ご意見やご提案をぜひお聞かせください。 AI駆動の画像生成の可能性を一緒に探求しましょう! 💡🌟

🔭 私たちは、FFUSION Aiのパブリックベータ版のリリースを発表することを非常に嬉しく思います。 ただし、機能の幅が現在限定されている点にご注意ください。 本モデルは、全体の画像集のわずか20%しか学習していませんので、その能力はまだ完全には実現されていません。 この初期バージョンは、さまざまなプロンプトの組み合わせによる実験や初期テストを目的としています。

💡 優れた実力の提供に努めていますが、特にUnetコンポーネントが、特定の物体や顔の処理にまだ未熟である点を強調しておきたいと思います。 しかし心配はいりません。 本アプローチは、最終リリースに向けて段階的に最適化されています。

🙏 アルファテストにおける、Redditコミュニティの皆様のご支援に心から感謝いたします。 また、テキストエンコーダーに革新的な融合アイデアに対応できるようにしてくださった点にも感謝しています。 ここまで来ることができたのは、皆様のお蔭です!

💡 ベータテスト段階での皆様のご協力は、すべての面で極めて重要です。 ぜひモデルを広く試していただき、ご意見やご感想、特に期待外れのプロンプトがあれば、どうぞご報告ください。 皆様のご意見は、FFUSION Aiの性能および全体的な品質をさらに改善するための指針となります。

⚠️ 注意: このモデルはStable Diffusion 2.1 - 512に基づいており、約600~700ピクセルまでの解像度で最適な性能を発揮するように設計されています。 大きな画像サイズのために、個別に拡大するか、まもなくリリース予定の最終版を待つことをおすすめします。 今回のリリースでは、より高い解像度のサポートとパフォーマンスの向上が実現される予定です。

👥 FFUSION Aiベータテストコミュニティの一員として、本当にありがとうございます。 皆様のご支援、フィードバック、情熱が、創造性と可視化の未来を変える革新的なツールの開発を強く後押ししています。 一緒に、ストーリーテリングと創造性の未来を形作っていきましょう。

🔮 お好きなプロンプトにエフェクトを加えたり、組み合わせてシュールなトーンを加えたりしてみませんか?(ご注意:このベータ版ではペンパイナップルアップルパンエフェクトおよびFUSIONSは除外されます)

🔒 730.9449時間以上の専用トレーニングセッションを経て、当モデルは、Mid Journeyと共同開発された大量のデータサブセットと強固なデータセットを保有しています。また、Idle Stoev、Source Code Bulgaria、Praesidium CXおよびBlackSwan Technologiesとの連携により、GPU使用効率を最大限に活用しています。 🚀

70万枚以上の画像データセット、トレーニング手法、分類、成功事例に関する完全な透明性の情報は、最終版リリース後に公開される予定です。 これにより、FFUSION AiがAIパワード創造の世界で信頼されるツールとして確立されると期待しています。 一緒に、想像を広げ、創造し、探求を続けていきましょう!

**
モデル概要:想像力の力を解放する!**

FFUSION AIは、最先端の画像生成・変換ツールです。 主流のLatent Diffusion Modelを基盤に開発されており、Stable Diffusion 2.1を活用して、あなたのプロンプトを魅力的なアート作品に変換します。 現実と幻想が交差する、これまでにない想像力の世界を体験してください。

  • 開発者: Idle Stoev、Source Code Bulgaria、Praesidium CX、BlackSwan Technologies

  • 共有者: FFusion AI

  • モデルタイプ: ディフュージョンに基づくテキストから画像生成モデル

  • 言語(NLP): 英語

  • ライセンス: CreativeML Open RAIL++-M ライセンス

モデル利用:創造性を促進し、AIの境界を探究

研究およびアート的探求を目的としたFFUSION AIは、さまざまな状況で活用可能です:

使用範囲外および禁止される不正利用:

  • 人物や出来事の事実誤認を引き起こす画像の生成

  • 侮辱的・非人間的・攻撃的な画像を含む悪意のあるコンテンツの拡散

  • 偏見を助長するステレオタイプの生成や差別の拡散

  • 同意なしに個人をなりすます行為

  • 同意なしの露骨なコンテンツや誤情報の拡散

  • コピーライトやライセンスの使用条件に違反する行為

モデルの限界とバイアス

AI駆動の創造性の未来に向けた進歩をもたらす一方で、以下の限界があります:

  • 完璧な写実的表現やシュールな表現を達成するのは、依然として課題。

  • ブランド用にさらに約30分の追加学習を行わないと、視認可能なテキストを正確にレンダリングするのは難しい。

  • 特に遠くの人物の顔を正確に生成することは保証されません(まだ)。

モデルリリース

私たちは以下のリリースを発表します:

  • 512ベータ版:LiTEおよびMiD BFGモデルバリエーションを搭載

  • 768アルファ版:BaSE、FUSION、FFUSIONモデルをバージョンアップ。LoRa、LyCORIS、Dylora、Kohya-ss/sd-scriptsのサポートも含む。

  • 768 BaSE版:200以上のビルドオペレイションLoRAモデルを、容易に適用できるよう調整されたBaSE準備モデル。

環境への影響

持続可能性へのコミットメントのもと、FFUSION AIは炭素効率を意識して設計されています:

  • ハードウェア:A100 PCIe 40GB

  • 使用時間:1190時間

  • クラウドプロバイダ:CoreWeave および Runpod(公式パートナー)

  • コンピューティングリージョン:US Cyxtera Chicago Data Center - ORD1 / EU - CZ & EU - RO

  • 排出炭素量:124.95 kg CO2(Machine Learning Impact Calculatorにより算出)

なお、すべてのLoRAおよび追加モデルは、初期トレーニングに基づいています。

モデルカード作成者

このモデルカードはIdle Stoevが執筆し、Stability AI - Stable Diffusion 2.1 モデルカードを基にしています。

モデルカード連絡先

[email protected]

ダウンロードは FFUSION AI diffusers - 768 BaSE リリース から。

🔬 意図された利用目的:研究から芸術へ 🎨

Screenshot_1002.jpg

このモデルで生成された画像

画像が見つかりません。