LighthouseEmbedding
詳細
ファイルをダウンロード
モデル説明
序文
この埋め込みモデルは、赤白の灯台をテーマとして作成したベースモデル、LoRA、ハイパーネットワークに続いて、それぞれの異なるモデルがどのような効果をもたらすかを調査するために作られました。
私の現在の実験によると、このモデルは画像に肯定的な効果をもたらすこともありますが、必ずしもそうなるわけではありません。期待しすぎないでください。
埋め込みモデルの機能
この埋め込みモデルは、灯台を赤白のカラーバンドで円形に変更するように修正できます。
制限
埋め込みモデルは、通常、詳細な環境なしで灯台のみを生成します。これはトレーニングに使用したデータに依存します。
ベースモデルと埋め込みの比較
私が作成したプロンプトはすでに十分に優れているため、このような埋め込みを使って写真からさらに多くの成果を得ることは不可能です。これまでの埋め込みの試みは、埋め込みなしの結果よりもむしろ劣っていました。
トレーニング
私は以前と同じように、自分の写真コレクションから12枚の灯台の写真を使ってモデルをトレーニングしました。各画像は512×512ピクセルの正方形で、主な被写体は灯台です。
テキストの埋め込み(Textual Inversion)テンプレートファイルでは、[name] および [filewords] を使用しました。これにより、各ファイル名はその写真に何が写っているかを説明するテキストとして機能します。
使用した潜在サンプリング方法はランダムでした。埋め込みの学習率は、最初は速く、後に遅くするために 0.05:500、0.005 に設定しました。サンプル画像は、最初の画像セットがトレーニング対象から大きく外れている可能性があることを示しています。
備考
これは私がこれまでに作成した中で、最も機能が悪いモデルです。この埋め込みのアプローチがうまくいくとは思っておらず、どうやら私の予想が当たったようです。埋め込みは、人間や動物に適している可能性が高いです。
次のステップ
現在、コンピュータがテスト目的で新しい埋め込みを生成しています。使用する画像のセットを減らし、トレーニングの他のパラメータもいくつか変更しました。
新しい埋め込みの途中結果は有望です 😀。いくつかの初期結果:
https://civitai.com/posts/6798698
最後に
良い一日を。楽しみながら、インスピレーションを得てください!















