Ovis-Image GGUF Text-to-Image Workflow by Sarcastic TOF

詳細

ファイルをダウンロード

モデル説明

これは、比較的低スペックなGPU(NVIDIA/AMDでは8~12GB VRAM、Apple Silicon MacのMシリーズプロセッサ(M3、M4、M5など)では16GBの統合メモリ)上で動作する単一のOvis-Image GGUFモデルと互換性のある、非常にシンプルでComfyUI初心者向けのテキストから画像へのワークフローです。Ovis-Imageは2025年11月下旬にリリースされた、アリババ(アリババ国際デジタルコマースグループ)のAIDC-AIチームが開発したオープンソースの70億パラメータのテキストから画像生成モデルです。このモデルは、英語または中国語のテキストにおいて、多様なフォント、サイズ、レイアウト、アスペクト比で読みやすく、スペルが正しく、意味的に一貫したテキストを生成します。また、Ovis-Imageは生成画像における高品質なテキストレンダリングに特化して最適化されており、ポスター、バナー、ロゴ、UIモックアップ、インフォグラフィック、ソーシャルメディア用グラフィック、マーケティング資料など、テキストが豊富なプロンプトに最適です。このモデルは、より大規模なモデル(例:Qwen-Imageのような20Bクラス以上)と同等のテキストレンダリング品質を達成し、GPT-4oやSeedreamのようなクローズドソースシステムと競合する性能を有しています。私の経験では、時としてZ-Image Turboモデルに似たAI写真を生成することもありますが、テキストが豊富なプロンプトを扱うシンプルな出力ではより優れた結果を出します。この点だけで、試す価値は十分にあります!

使用方法:

#1. まず、ご希望のOvis-Image GGUFモデルを選択してください。

#2. 次に、出力画像のサイズを選択してください。

#3. その後、ポジティブプロンプトとネガティブプロンプトを入力してください。

#4. 生成したい画像の枚数を設定してください(「Run」ボタン横の数字を変更してください)。

#5. サンプリング方法、CFG、ステップなどの設定およびその他のオプション設定を調整してください。

#6. 最後に「Run」ボタンを押して生成を開始してください。これで完了です。

お楽しみください!

## 必要なモデル

======================

### Ovis-Image GGUFチェックポイントのダウンロードリンク -

https://huggingface.co/convertor/ovis-image-gguf/resolve/main/ovis-image-iq4_nl.gguf

### Ovis-Image GGUFエンコーダのダウンロードリンク -

https://huggingface.co/convertor/ovis-image-gguf/resolve/main/qwen3_vl_2b_f32-iq4_nl.gguf

### Ovis-Image GGUF VAEのダウンロードリンク(これはFlux GGUF VAEです) -

https://huggingface.co/convertor/ovis-image-gguf/resolve/main/pig_flux_vae_fp32-f16.gguf

このモデルで生成された画像

画像が見つかりません。