X-Ray Vision (see through anything)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
もしこれに興味があれば、もっとしっかりしたものを作ります。このLoRA自体に問題はありませんが、非常に大きな可能性を感じており、他のアイデアも刺激されました。今後はそれらに集中します。このモデルにはより多くの学習データが必要でしたが、これはプロトタイプとして捉えてください。実際、これまでに似たような試みをしても全く効果がなかったため、これがうまくいくかどうか確信がありませんでした。
このLoRAは、特殊な透過装置(「X線」と呼んでいます)を通して撮影された画像を生成することを目的としています。この装置では、服の一部が欠けていて、下着や裸体が見えるようになっています。
学習に使用された一部のテキストタグ(現在のアーキテクチャではおそらく重要ではないかもしれませんが):
X-Ray boobs
X-Ray bra
X-Ray panties
X-Ray pelvis
X-Ray underwear
X-Ray nude
Clothed
Nude
トレーナーで約8,000ステップまで学習させ、数時間にわたり難しいシナリオで一貫した画像を生成しようと試みましたが、プロンプトが十分に魔法的ではなかったのです。その後、約20,000ステップまで再学習させ、いくつかのテストを経て、過剰な強化と有用性のバランスを取るために12,000ステップを採用しました。もっと多くの学習画像を生成していれば、もっと簡単に、そして時間も節約できたとは思いますが、そのプロセスはそれほど簡単ではありませんでした。以下が私が行ったことです:
いくつかの裸体画像を作成しました。その半分はIllustrious、もう半分はZ-Image-Turboで生成しました。
次に、それらをQwen Image Edit 2509に持ち込み、服(外着と下着)を追加するようプロンプトを出しました。
その結果を画像編集ソフト(最近はPhotoshopやAffinityの争いから離れ、GIMPに戻りました)に取り込み、着衣したバージョンを上に重ね、部分的にマスクをかけて、さまざまな部位を露出させ、その編集結果を保存しました。
元々は、目から光線が発射され、服を透過して裸体が見える「X線視力」の人物を生成しようと考えていましたが、そのアイデアを2日間こだわっても進展がなく、脳がそれほど複雑なことを受け入れようとしなかったので、単純なアプローチに切り替えました。
学習データには着衣した画像と裸体の画像を両方残し、すべてに簡単なキャプションを付け、JOY-Cに調整させ、文脈に重みを持たせました。
OneTrainerを使用:おそらく最も重要なパラメータは、デフォルト値、ランク32、アルファ1、2回繰り返し、バッチサイズ1です。











