Pony: People's Works v1-v6
詳細
ファイルをダウンロード
モデル説明
紹介:
Civitaiサイトから「最も収集された」および「最も反応の多かった」ポニー系モデル画像を収集して学習したスタイルLoConです。
これは、Civitai上で高評価と保存数が最も多かったポニー系モデル画像から学習された画風LoConです。
このLoRAは、特定のアーティストのスタイルや技法を模倣することを目的としていません。ただし、コミュニティの審美意識や画像の視覚的吸引力を一定程度反映している可能性があります。異なるプロンプトによって、画風はわずかに変化することがあります。
このLoRAは、特定のアーティストのスタイルや技術を再現することを意図していません。ある程度、コミュニティの好みや画像の視覚的魅力を反映している可能性があります。プロンプトによって、画風はわずかに変化します。
使用方法:
V2以前のバージョンには特定のトリガーワードは含まれていません。対応するモデルに付属する品質タグをご使用ください。
V3以降のバージョンでは、以下のタグを学習しました:
V2以前のバージョンには特定のトリガー単語は存在しません。対応するモデルに付属する品質タグをご使用ください。
V3以降のバージョンでは、以下のタグを学習しました:
ポジティブ:
masterpiece, best quality, very aesthetic
ネガティブ:
worst quality, low quality, displeasing
このタグを元にプロンプトを編集してください。
データ生成バージョン:
v6:
新たに500枚以上の画像を追加し、その一部はFluxから選択しました。品質が低いと判断した古い画像は削除しました。
現在、データセットの合計画像数は3,000枚を超え、6つのバージョンを通じて20以上の概念を手動で強化・編集しました。
モデルのrankも向上しました。
新たに500枚以上の画像を追加し、その一部はFluxから選択しました。品質が低いと判断した古い画像は削除しました。
現在、データセットの合計画像数は3,000枚を超え、6つのバージョンを通じて20以上の概念を手動で強化・編集しました。
モデルのrankも向上しました。
v5.9:
モデルの性能が期待通りではありませんでしたが、トレーニングデータセットの画像自体は問題ないと考えています。タグを手動で調整し、結果にどのような変化があるか確認する予定です。
モデルの性能が期待通りではありませんでしたが、トレーニングデータセットの画像自体は問題ないと考えています。タグを手動で調整し、結果にどのような変化があるか確認する予定です。
2025/1/3更新:
一部のタグを手動で更新しましたが、明るさや色とは関係がないようでした。一時的に、これはnoise offsetに関係している可能性があると推測しています。
一部のタグを手動で更新しましたが、明るさや色とは関係がないようでした。一時的に、これはnoise offsetに関係している可能性があると推測しています。
v5:
データセットを2,154枚に拡張し、約1,000枚のポニー画像を主なトレーニング対象としました。
V-predモデルはEps-predベースのモデルで学習されたLoRAを使用できますが、出力品質が大幅に低下します。このバージョンでは、2種類の異なるモデル上で別々に学習します。
最近のNoobAIは顕著なアーティファクトを生成しますが、Danbooruの「jpeg artifact」タグは効果的ではありません。この問題に対処するため、30枚の典型的で視覚的に目立つ画像を負例として選択しました。
現象が観察されました:Pony v6とNoobAIは、サイドロックスを持つヘアスタイルを生成する際、髪の根元に三角形の隆起を生じさせる傾向があります。Danbooruでは、この隆起は「hair intakes」や「curtained hair」とタグ付けされることがありますが、Ponyはすべてのキャラクターにこの構造を適用します。これが、Ponyでキャラクターを訓練する際に、ヘアスタイルが意図したデザインと一致しない主な理由の一つです。NoobAIでも同様の問題が観察されました。私の推測では、この特徴はDanbooru外のデータセットで広く存在し、適切にタグ付けされていない可能性があります。
データセットの画像をフィルタリングし、約3分の2が適切にアノテーションされました。現在、プロンプトに「hair intakes」を追加すると、ある程度この問題を軽減できる可能性がありますが、まだ完全な解決策は見つかっていません。
データセットを2,154枚に拡張し、約1,000枚のポニー画像を主なトレーニング対象としました。
V-predモデルはEps-predベースのモデルで学習されたLoRAを使用できますが、出力品質が大幅に低下します。このバージョンでは、2種類の異なるモデル上で別々に学習します。
最近のNoobAIは顕著なアーティファクトを生成しますが、Danbooruの「jpeg artifact」タグは効果的ではありません。この問題に対処するため、30枚の典型的で視覚的に目立つ画像を負例として選択しました。
現象が観察されました:Pony v6とNoobAIは、サイドロックスを持つヘアスタイルを生成する際、髪の根元に三角形の隆起を生じさせる傾向があります。Danbooruでは、この隆起は「hair intakes」や「curtained hair」とタグ付けされることがありますが、Ponyはすべてのキャラクターにこの構造を適用します。これが、Ponyでキャラクターを訓練する際に、ヘアスタイルが意図したデザインと一致しない主な理由の一つです。NoobAIでも同様の問題が観察されました。私の推測では、この特徴はDanbooru外のデータセットで広く存在し、適切にタグ付けされていない可能性があります。
データセットの画像をフィルタリングし、約3分の2が適切にアノテーションされました。現在、プロンプトに「hair intakes」を追加すると、ある程度この問題を軽減できる可能性がありますが、まだ完全な解決策は見つかっていません。
v4:
データセットのタグを部分的に最適化しました。NoobAI Epsilon-pred v1 を基に学習しました。
ポニー系モデルは、イヤリング、ピアス、その他の耳飾りを生成する傾向が強く、キャラクターの耳の構造を崩すことがあります。関連するタグを再整理し、データセット内の一部の微細な構造的問題を持つ画像を切り抜き、手動で編集し、修正が困難な画像は削除しました。
データセットのタグを部分的に最適化しました。NoobAI Epsilon-pred v1 を基に学習しました。
ポニー系モデルは、イヤリング、ピアス、その他の耳飾りを生成する傾向が強く、キャラクターの耳の構造を崩すことがあります。関連するタグを再整理し、データセット内の一部の微細な構造的問題を持つ画像を切り抜き、手動で編集し、修正が困難な画像は削除しました。
v3:
データセットを1,429枚に拡張し、ポジティブタグとネガティブタグ両方を含む画像を収録しました。
そのうち774枚は最も「好まれる」スタイルの画像です。
Illustrious v0.1 を基に学習しました。
データセットを1,429枚に拡張し、ポジティブタグとネガティブタグ両方を含む画像を収録しました。
そのうち774枚は最も「好まれる」スタイルの画像です。
Illustrious v0.1 を基に学習しました。
v2:
データセットを374枚に拡張しました。モデルに付属する品質タグと審美タグを使用して生成品質を制御します。
データセットを374枚に拡張しました。モデルに付属する品質タグと審美タグを使用して生成品質を制御します。
v1:
Civitaiから224枚の画像を学習し、正則化用に393枚の画像を使用しました。
Animagine v3.1 と Pony v6 の2つのバージョンを学習しました。
Civitaiから224枚の画像を学習し、正則化用に393枚の画像を使用しました。
Animagine v3.1 と Pony v6 の2つのバージョンを学習しました。
test ver.4:
ややアンダーフィットですが、機能しています。Animagine v3.1が学習した品質タグと審美タグ(best quality, masterpiece, very aesthetic など)が、このチェックポイントの生成スタイルを変化させることが判明しました。次のテストバージョンで修正します。
ややアンダーフィットですが、機能しています。Animagine v3.1が学習した品質タグと審美タグ(best quality, masterpiece, very aesthetic など)が、このチェックポイントの生成スタイルを変化させることが判明しました。次のテストバージョンで修正します。




















