Flux.1 D / SDXL - Stoned Fox
詳細
ファイルをダウンロード
モデル説明
Flux V.1.0
これは避けられなかった。
AIを使う主な理由を忘れてしまったので、あまり真剣に取らないように少し思い出させてくれる。この問題とそれに伴うさまざまな奇妙な挙動を補正するのは簡単ではないため、いくつかのモデルの性能や柔軟性を判断するのに何度も役立ってくれた。
また、おそらくより重要だが、他の人のLoRAをかなりうまく台無しにできる :)
V4.0
モデルの互換性を少し高め、どれくらいの範囲で許容できるかを試してみた。CFGスケールを下げ、ステップ数を増やした。少し限界を押し広げ、メインの主題とは無関係なプロンプトを使って何ができるかを確認したかった。より高い強度で、foxをトリガーとして使わないと、はるかに柔軟になる。デフォルトのポーズでの表情を簡単に変更できるようになり、一方でメインの主題(足が下向きで奇妙な足の形、不思議な顔つきなど)の全体的なアイデアは保たれる。
プレビュー画像を整理して、メインの主題とプロンプトやキャラクターを変更した場合の違いがわかるようにした。
このモデルは、他のモデルや他のLoRA、奇妙なプロンプトと組み合わせたときの挙動を知るためのテストベースとして位置づけている。V3.0で使ったのと同じプロンプトでいくつかの画像を含め、違いを確認できるようにした。
すべてのテストと設定は、私が使用したモデルに基づいている。
CFGスケールを下げ、ステップ数を増やすと驚異的な効果がある
foxという語を除外すると、はるかに柔軟になる(次バージョンではこれを除外する予定)
メイントリガーワードの位置(または重み)を変更すると大きな違いが生じる
多くの場合、CivitAIは画像にオオカミや犬、猫が含まれていると判定する。おそらくこれはメインの主題が「異形」だからだろう :D… ネガティブにこれらの要素を指定すると、ときには効果的。大きな頭と長い首も問題(あるいは意図的な効果? :D)のようだ
プロンプトに「何をすべきか」が明示されていないと、不要な要素を追加しがち(トレーニング画像に基づいていると思われる)
この説明は、自分が何をしたかを振り返るためのメモであり、これからトレーニングしようとしている他のLoRAにどう役立たせるかを検討するためのものである。
V3.0
通常、私はトレーニングしたものを公開しない。プロンプトや使用するモデルによって取り扱いが非常に難しく、非常に制約が強いからだ。また、1111の多くのプラグインも時として大きな役割を果たす。これらは私の環境ではうまく機能するが、他の人には当てはまらないかもしれない。
より使いやすく、互換性と柔軟性を高めるために何を変更すべきかを試す、簡単なテストである。.txtファイルやソース画像の調整がもう少し必要であることはわかっているが、前述したように、私自身には問題なく動く。
これは友人(もちろん自分自身のためにも)のために作成したもので、彼がこの件について尋ねてきたので作った。CivitAIにはほぼ同じ内容のモデルがあるが、それはSD1.5である。古いMEMEだが、得られるランダムな結果が好きだ。私がトレーニングしたいくつかのLoRAは、まったく意味がなくても、低い値で画像の構成やスタイルを劇的に変える。おそらく、多くのLoRAがそうだろう。
例示画像で使ったいくつかの単語は気にしないでください。ほとんどの場合、それらは特に効果がありませんでしたが、それでも画像の方向性をある程度導いていました。単に自分の楽しみと、何が起きるかを観察するためです。
このモデルは、今後のトレーニングにも使用する予定です。
- BaseXLでトレーニング












