all the way through x-ray (Incomplete)(NetaYume Lumina v3.5)

詳細

モデル説明

vast.ai上でRTX 5090を使用してai-toolkitで学習。合計20,000ステップで約12時間かかりました。

ai-toolkit形式をComfyUIとの互換性のために変換しました。以下の変換スクリプトをご使用ください:https://huggingface.co/duongve/NetaYume-Lumina-Image-2.0/blob/main/Script_Lora_Convert/Convert_lora_format_between_comfyui_diffusers.py

変換に関するご質問があれば、お気軽にお尋ねください。または、ChatGPTなどのAIツールを参照して迅速にご確認ください。

これは当初、SDXLモデルで4ヶ月間取り組んでいたが完了しなかったプロジェクトです。その後、多忙により約3〜4ヶ月間進展がありませんでした。私はいつも考えていました:「完璧になるまで待っていたら、いつまでたっても完成しないのではないか?」

LuminaのLLM用に特別に長いプロンプトを書いたわけではなく、結果はやや劣る可能性があります。

プロンプトの参考:食道、胃、大腸、小腸、直腸、肛門性交、大量の精液、臓器のX線画像

他のプロンプトに切り替えてみてはいかがでしょうか?私は他のプロンプトも混ぜて使用しました。

正直、構造的な安定性について?プロンプトをより長く、構造的で具体的に書けば、SDXLモデルよりも優れている可能性があります。

しかし、プロンプトアシスタントのセクションなしでもトレーニングは十分にうまく機能することがわかりました…?今後、高解像度画像の合成と処理方法を探求します。また、高解像度および大バッチでのトレーニングのためにRTX Pro 6000 Blackwellグラフィックカードをレンタルすることも検討しています。

sd-scriptsはやや使いにくいです…

ベースモデル:NetaYume Lumina v3.5

このモデルで生成された画像

画像が見つかりません。