Side Doggy
詳細
ファイルをダウンロード
モデル説明
私はどちらかの味方をするタイプではありませんが、側面のビューワー、やったね! あなたにお披露目します…
Side Doggy
このコンセプトは、当初、自分では処理できない量を引き受けてしまったため、独自の課題を抱えていました。最終的に、6つのクリップセットと6つのクローズアップをトレーニングすることになりました。最初の試みでは、セットを半分に分けて、左側を示すものと右側を示すものに分けました。その結果、当然ながら、体の異常、変異、くっついた陰茎、不十分なオナニーなど、多くの問題が生じました。
一貫したレンダリングが得られなかったのですが、失敗には成長をもたらす不思議な方法があるものです。2週間の失敗の末、私はエウレカの瞬間を体験しました。その詳細は下記のドットの後に記しますが、まずは!
バージョン
バージョン1
これはおそらく唯一の… 6e-5、256x256(粗いピクセル平均)で60フレーム。ポーズは非常に一貫しており、すべて同じ側面から撮影されています。これは私がこれまでに作成した最良のLORAの1つです。ショーケース用にわざわざ選別する必要さえありませんでした! (!!) 広角では優れた性能を発揮し、意外にも縦長のアスペクト比でも安定しています。
ワイルドカードプロンプトテンプレート。
美しく{細身|クルビー}な{ロシア人|フランス人|スウェーデン人|スイス人|ラテン系|オーストリア人|ドイツ人|オランダ人|イギリス人|アイルランド人|ポルトガル人}の女性が、ドギースタイルの姿勢で四つん這いになり、側面から見える。その右側には{筋肉質|太り気味|痩せぎす|筋肉質}な{アフリカ系|ドイツ人|アメリカ人|ラテン系|アジア系}の男性が立って左を向いており、彼女の後ろから{巨大|平均サイズ|太い|小さい}な陰茎を彼女の膣に挿入して繰り返し突き刺している。彼の骨盤は、彼女の曲がった腰とお尻と水平に密接に整列している。
彼女の髪は{金髪|茶髪|汚れた金髪|薄い金髪}で、{スタイリング済み|ストレート|カール|まとめ髪|ポニーテール}であり、フレームの左側に垂れ下がっている。
彼は手で彼女の腰を{保持|ぎゅっと握る|つかむ}している。彼女の{{赤|黒|白|ピンク|マルチカラー}な{ブラ|チューブトップ|シャツ}が胸元を覆っている|{大|中|小}サイズの胸が、1回の突き刺しごとにユラユラと揺れている}。
シーンは、明るく整備された現代の{寝室|地下|リビングルーム|公園|スタジオ|屋根裏部屋|医師の診察室|個室}で行われている。
トレーニングノート
ずっと頭を抱えていた末に、この大きな発見が現れました!
HunyuanVideo:
トリガーワードは使用しない。実際にはそれらはただのノイズで、何の価値も追加せず、最悪の場合、学習プロセスを損ねる可能性さえある。なぜだろうか?
HunyuanVideoのテキストエンコーダーは、キャプション/プロンプトをそのまま扱うのではなく、意味に基づいてセマンティックに翻訳し、独自の内部表現を構築する。英語以外の単語には意味がなく、したがって価値を加えない。この点は省略してもよい。まだ納得できないなら、このLORAを試してみてほしい。トリガーワードなしでも結果は素晴らしい。
どれほど優れたLORAでも、不適切に設計されたプロンプトは機能しない。逆に、弱いLORAでも、正しいプロンプトを使えば非常にうまく機能することがある。
最適なキーフレーズを探している際、私たちは確かにトリガーフレーズを必要としている。それは、トレーニングしようとしているLORAのポーズ・コンセプト・詳細を、ベースモデルがどのように表現するかを近似するプロンプトを見つける必要があるということだ。
Side Doggyをうまく動作させたいなら、ベースモデルが大まかな構図を描くために必要な最も簡潔なプロンプトフレーズを抽出する必要がある。結果として動きや正確性が不足しても構わない。しかし、二人の人物用のLORAをトレーニングしているのに、LORAなしではHunyuanVideoが一人だけ、あるいは三人、あるいはひどい変異やまったく不適切なポーズしか描けない場合、そのプロンプトはうまくトレーニングされず、うまくレンダリングされない。
多文のプロンプトを試行錯誤し、最終的にベースモデルが正確な構図を描くようになったとき、私はそのフレーズを以下のように凝縮した:
**
女性がドギースタイルの姿勢で四つん這いになり、側面から見える。その右側に男性が立って左を向いており、彼女の後ろから陰茎を膣に挿入して繰り返し突き刺している。彼の骨盤は、彼女の曲がった腰とお尻と水平に密接に整列している。彼女の髪はフレームの左側に垂れ下がっている。**
このキーフレーズのおかげで、二人の人間とそのポジショニング、時にはその間の陰茎までが描かれるようになった。これは勝利と安堵の瞬間だった。このフレーズ(および場所などの環境的ヒント)を使ってプロンプトを投げると、以前は不安定だった私のLORAでも、非常に良い結果が得られるようになった。そして私はそこで止めず、このフレーズでセット全体のキャプションを再作成し、一晩トレーニングを実施した。今、ショーケース用の動画をレンダリングしているが、すべてのシードがほぼ完璧に意図した結果を生成していることに圧倒されている。変異、余計な人物、後ろ向きの頭などは一切なし。8/8、完璧だ(運を試してる…笑)
私たち全員が、まるで魔法のように機能するSide DoggyスタイルのLORAを得るだけでなく、以下の重要なトレーニングのヒントも得ることができる:まず、あなたのLORAが目指す内容をベースモデルが近似するためのキーフレーズを見つけ、その一貫したフレーズに基づいてキャプションを構築し、必要な形容詞などを追加するが、テンプレートに絶対に従うこと。あなたのLORAの生命にかかわるかのように。
コンセプトが複雑で、ベースモデルを正確に描かせるために何段落もプロンプトを書かなければならない場合、もっと短いものを見つける必要がある。私は、およそ40語を超えると長すぎると思う。キャプションが長ければ長いほど、プロンプトがそのコンセプトをトリガーしにくくなる。キャプションが短いほど、長い詳細なプロンプトでも適切な意味を含みやすくなる。
例えば、キャプションが300語もある場合、300語未満のプロンプトではそのコンセプトを生成できない可能性がある。つまり、キャプションの長さは、LORAのパフォーマンスと強く相関している。
より詳しいトレーニングノートはこちら:こちら (私のトレーニングガイド参照)
免責事項
責任を持って使用してください。
