Rite of Wrong
詳細
ファイルをダウンロード
モデル説明
このLoRAは、未来志向で電子的、そして(何か)パンク系の要素に偏った、汎用的な構築エンジンとして設計されています。ただし、ZITがその魅力の一部として生み出すぼやけた画像をきれいに補正し、リアルな画像を容易に生成することにも気づかれるでしょう(他のユーザーが同じ経験をしているかどうかは分かりませんが、私はしばしば別のLoRAを使ってZITの生の出力を滑らかにしています)。
しかし、はっきり言わせてください。私は1週間のほとんどを、「人間を補強すること」を目的とした「メカ」構築キットの作成に費やしました。何十回も1万ステップ以上の学習を繰り返し、複数の微調整段階と追加画像、そして身体恐怖を引き起こす画像(裸体がそれを不安定にさせるようでした)を削除するクリーンアップを施しましたが、それでも望んだ効果は得られませんでした。結局、このLoRAには当初意図した「魔力」が欠けていたと判断しました。しかし、それほど貴重な成果だったため、単に捨て去るわけにはいかず、期待値を調整し、さまざまなスタイルを実験した結果、私は気づきました。これは単なる失敗作ではなく、将来、これらの仕組みをより深く理解したときに、自分自身で作り出したいと思っていたものだったのです。
学習を進める中で、追加のテーマ、修正措置、データセットの精緻化を繰り返すうちに、特定の目標に近づき始めた収束の瞬間が現れました。しかし、それから約500ステップほどで、この収束は崩壊してしまいました。そこで、私はこのLoRAを別の方向に進める必要があると理解しました。あるいは、より正確には、このLoRAが実際に何を実現できるかに基づいて、このモデルに何と名前をつけるべきかを決める必要がありました。それでも、私が最初に作ろうとしていたLoRAの特徴のいくつかを残したいと考えました。私が絶対に必要とした3つの特徴は、人型マシンが「大きな丸い肩のカバー」を持ち、「昆虫のような細部」を備え、そして「対になる部位に対して不均衡な腕のサイズ」を持つことです。
この目標を達成するために、収束が崩壊しなかった15,000ステップの遷移段階を維持し、それをこのLoRAのベースとしました。そして、658枚の画像を使って、以下の16の明確なスタイル・ジャンルの特徴をターゲットにしました:
サイバーパンク
ステampunk
ディーゼルパンク
スペースパンク
サイボーグ
1800年代 - ビクトリア時代
旧西部
未来志向
ヒーロー(汎用)
産業用ロボット(アーマチュア)
昆虫
ロボット(人型)
環境(多様な建築、内装、テーマ)
衣装(服飾、ファッション、スタイル)
人物 - 汎用(さまざまな状況・環境における男性と女性)
電子機器(部品、回路基板、マザーボード、ミニ基板など)
オリジナルのテーマに合わせてデータセットを条件づけた際、私は「構築」を意識し、異なる特徴が互いにアクセス可能になるように設計しました。これは説明しづらいかもしれませんが、モデル内での動物の配置領域と人間の配置領域が異なると考えてください。こうした領域は「クラスター」と見なせ、クラスター間のリンクがあれば、異なるクラスターの特徴を組み合わせて多様な構築が可能になります。これらのクラスターをつなぐために、異なるクラスターに属すると思われるコンテンツの画像に、関連のない要素を追加し、それらを「結婚」させることで、一方の要素からもう一方に何かを移すようにしました。例えば、昆虫の詳細を人間、サイボーグ、マシンに大幅に導入することで、プロンプティングを構築ツールとして用い、複雑に設計された人型メカを生み出すという意図がありました。私はこれを「アンカー」と呼びます。
以前にも「アンカー」について話しましたが、ここにこの実装が最も強く作用していると感じます。上記の各対象の既知の特徴を参照することで、私たちはニューラルネットワーク内に深く入り込み、トレーニング時に導入されたのと同程度の明確さで、モデルがすでに知っている特性を引き出すことができます。このLoRAは既存の知識を上書きするのではなく、さまざまな方法でそれを拡張し、前後比較を行うとその差が明確にわかります。
トレーニングに用いたすべての画像にはエロティックな相互作用や露骨なコンテンツは含まれていません。前述したように、私はすべての裸体画像を削除しました。これは、他のLoRAを使って欠けている要素を追加する際に、アンカーの効果に多少干渉する可能性があります。
私の見解では、生成される身体恐怖や、欠落した対象の非常に低品質な出力は、意図的なパスの損傷の結果です。なぜなら、こうしたコンテンツを追加できないため、それらが収容されるべきクラスターが存在しない、あるいは存在するとされるクラスターが100%「ビーフチャック」で満たされているからです。Z-Image-Omniが表舞台に現れたとしても、私たちがさらに自由になれるとは思いませんが、Lodestoneのおかげで、それについては気にする必要がありません。
もし今後もこのような状況が続くなら、鏡に自分の顔の反射を覆うように赤い警告がオーバーレイされ、「本物の人間が検出されました!セキュリティ対策が発動しました!」という文言で、あなたが「保護されている」ことを安心させてくれるでしょう。そのとき、あなたの髪がきちんとブラシでととのえられているかどうかを確認するには、LLMに見てもらう必要があるかもしれません。




















