all the way through x-ray (Incomplete)(NetaYume Lumina v3.5)

ｖａｓｔ．ａｉ上でRTX 5090を使用してai-toolkitで学習。合計20,000ステップで約12時間かかりました。

ai-toolkit形式をComfyUIとの互換性のために変換しました。以下の変換スクリプトをご使用ください：https://huggingface.co/duongve/NetaYume-Lumina-Image-2.0/blob/main/Script_Lora_Convert/Convert_lora_format_between_comfyui_diffusers.py

変換に関するご質問があれば、お気軽にお尋ねください。または、ChatGPTなどのAIツールを参照して迅速にご確認ください。

これは当初、SDXLモデルで4ヶ月間取り組んでいたが完了しなかったプロジェクトです。その後、多忙により約3〜4ヶ月間進展がありませんでした。私はいつも考えていました：「完璧になるまで待っていたら、いつまでたっても完成しないのではないか？」

LuminaのLLM用に特別に長いプロンプトを書いたわけではなく、結果はやや劣る可能性があります。

プロンプトの参考：食道、胃、大腸、小腸、直腸、肛門性交、大量の精液、臓器のX線画像

他のプロンプトに切り替えてみてはいかがでしょうか？私は他のプロンプトも混ぜて使用しました。

正直、構造的な安定性について？プロンプトをより長く、構造的で具体的に書けば、SDXLモデルよりも優れている可能性があります。

しかし、プロンプトアシスタントのセクションなしでもトレーニングは十分にうまく機能することがわかりました…？今後、高解像度画像の合成と処理方法を探求します。また、高解像度および大バッチでのトレーニングのためにRTX Pro 6000 Blackwellグラフィックカードをレンタルすることも検討しています。

sd-scriptsはやや使いにくいです…

ベースモデル：NetaYume Lumina v3.5

モデルタイプ	LORA
ベースモデル	Lumina
公開日	11/24/2025
トレーニングワード	esophagus, stomach,large intestine, small intestine,rectum, anal sex, large cum, organs x-ray

all the way through x-ray (Incomplete)(NetaYume Lumina v3.5)

詳細

ファイルをダウンロード

このバージョンについて

モデル説明

このモデルで生成された画像