Pirates!
詳細
ファイルをダウンロード
モデル説明
作業中です。現在の海賊用モデルに非常に不満でした。推論結果にはいつも漫画のようなスカル&ボーンズのパターンが帽子に描かれ、三角帽もいつも不自然に見えました。そのため、海賊にふさわしい美観の高いモデルを制作しようとしています。ここでは4つのバージョンとそれらのデータセットを掲載します。カタールの形状、三角帽またはバイコン帽の形状といった細部をより良く描き出す方法について、誰かアドバイスをいただけたら幸いです。
バージョン1
最初に公開します。ご存知かもしれませんが、ちょっとジョンニー・デップすぎました。それでも、信頼できる海賊船長、副船長、女性海賊の画像を一貫して生成しています。誤って次元を9、アルファを1でベイクしてしまいましたが、結果は気に入っています。今後はより低い次元とアルファ値を使って実験するつもりです。トリガーキーワードは「p1r4t3s」ですが、省略しても別の効果が得られます。他のキーワードは「captain」(船長)、「mate」(副船長)、および「female」(女性)です。プロンプトに「pirate」という単語を含めると、ベースモデルに含まれるダサくて安っぽい海賊衣装の画像が大量に生成されます。
バージョン2
ネットワークのアルファと次元を128に上げましたが、キャプションやデータセットの重み付けにはあまり変更を加えませんでした。トリガーとキーワードはバージョン1と同じです。また、clip skipを2に変更し、何が起こるかを試しました。
バージョン3
ネットワークの次元とアルファを16に下げ、clip skipを2に変更しました。データセットの重み付けを大幅に見直し、ジョンニー・デップの画像の重みを大きく下げ、女性の画像、特に『ブラック・セイルズ』に登場するアン・ボニーの画像の重みを高めました。その結果、生成される画像の独創性が向上しました。
バージョン4
次元とアルファを16、clip skipを2のまま維持し、三角帽、カタール、バイコン帽、ドロップ帽などの特定のアイテムについて、データセットに多くの画像を追加しました。これらの特徴についてより詳細なデータを提供することで、推論の品質を向上させようと考えました。しかし、それが効果があったかは不明です。このバージョンでは学習率を以前のバージョンより大幅に下げました。しかし大きな違いは見られません。一つ気づいた点は、追加したアイテムの画像が、推論結果で元の学習画像と同じスケールで描画され、シーンの他の要素と整合性が取れていないことです。おそらく、訓練データではこれらのアイテムを相対的に小さめに描いておくべきだったかもしれません。そうすれば、最終的な推論結果でそれらが適切なサイズで表示されるようになるかもしれません。



