meishi-pix2realistic-f1kontext-lora

詳細

ファイルをダウンロード

モデル説明

私の主な焦点は、ヴィンテージゲームのピクセルアートをリアリスティックなレンダリングに変換することです。その他のタイプのピクセルアートは試していません(トレーニングデータはすべてヴィンテージゲームと私のファンアートで構成されています)。私の目標は、リアリズムを保ちながら、元の画像の外観と雰囲気を可能な限り忠実に再現することです(これはあくまで私の個人的な意見です)。たとえば、アーケードゲーム『Commander』に登場するカーロを考えてみましょう。彼女は美しさ、セクシーさ、そして筋肉質な体型を同時に備えています。これは、リアリスティックなキャラクターにビキニやレザージャケットを着せただけでは決して実現できない要素です。

現在、Kontextの優れた機能とLoRaの微調整により、この作業の70〜90%を達成できます。現在、私が考えるほど優れたリアリスティックなファンアートを生成するには、依然として10〜30%の手動調整が必要です。

上の画像は比較的自己説明的ですが、いくつか補足します。

元の画像の透過チャンネルはインデックスカラーで紫になっているため、Kontext画像にはややフォトグラフィックでフィギュアのような質感が生じます。このLoRaは、たとえ自然に見えなくても、元の画像のカラースキームに従うよう努めます。

58x72ピクセルという非常に小さな元画像でも、このLoRaは良好な結果を出力します(元画像のアップスケーリングの影響は、LoRaの使用と比べて顕著です)。ただし、可能な限り元画像を約512ピクセルまでアップスケールすると、さらに優れた結果が得られ、その効果は明確に確認できます。

「まずRGBに変換し、その後アップスケールする」というのは、元の画像が8ビットピクセル画像であることを意味し、アップスケールオプションはデフォルトで「詳細を保持(アップスケール)」に設定されています。このアップスケーリングには特別な手順は不要で、ワークフローにノードを追加するだけで済みます。

一方、「まずアップスケールし、その後RGBに変換する」という方法は、「ニアレストネイバー(硬いエッジ)」の方法と同等の効果をもたらし、このアップスケーリング手法が最も優れた結果を生み出します。(これはトレーニングデータに強く依存するため、他の人がトレーニングしたLoRaには適用されない場合がありますのでご注意ください。)

このモデルで生成された画像

画像が見つかりません。