Pony: People's Works +

詳細

ファイルをダウンロード

モデル説明

v8

肌理更新:以下のタグの学習を強化しました:

Texture Update: The following tags have been reinforced in training:

realistic, photorealistic, flat color,
shiny skin, matte skin, shiny hair,

Danbooruデータセットには、「写真」や「写真に近いスタイル」を表す複数のタグが存在します。私はトレーニングデータセット内でこれらの画像をすべて「photorealistic」に統一してラベル付けしました。しかし、Danbooruデータセットで学習されたSDXLモデルの多くは、リアルな画像をうまく描画できないため、「photorealistic」は低ウェイトでのみ、画像の質感を調整する目的で使用することをお勧めします。「realistic」は高ウェイトでも正常に機能します。

Please note that Danbooru dataset contains multiple tags to describe "photo" or "photo-like styles". I’ve tagged all such images as “photorealistic” in dataset.

However, most SDXL models trained on the Danbooru dataset do not render realistic images well. “photorealistic” is only recommended at low weight, where it can help adjust texture rather than create realism images. The “realistic” tag can work properly at higher weight.

すぐに始めよう | Quick Start

これは何ですか? | What is this?

  • Pony: People's Works(ppw)は、実験的な微調整モデルシリーズであり、データセットの約85%はCivitAI上でユーザーが公開したAI生成画像から収集されています。初期のppwのデータセットは、pony v6が生成した画像を基に構築されていたため、本シリーズの出力にはPony Diffusionの特徴が一部含まれています。

  • 本シリーズのモデルは標準的なDanbooruタグを使用しており、中距離・近距離のスタイル化されたポートレート生成に特化しています。主な目的は、アーティストキーワードや長めの品質タグを使わなくても、ベースモデルが比較的安定した画像品質を実現できるようにし、プロンプトのトークン空間を節約することです。
     本モデルはスタイルモデルではありません。異なるプロンプトや生成条件により、わずかに画風が変化することがあります。

  • Pony: People's Works (ppw) is a experimental fine-tuned model series, approximately 85% of the dataset comes from AI-generated images published by users on CivitAI. Since the earlier ppw dataset was built on images generated by Pony V6, the outputs of this series also carry some characteristics of Pony Diffusion.

  • This series uses standard Danbooru tags and is mainly optimized for generating stylized portraits at medium and close range. The primary effect of this model series is to allow the basemodel to achieve relatively stable image quality, without artist keywords or long quality tags, freeing up token space for prompts.
    These models are not style LoRAs. There may be subtle stylistic variations depending on different prompts and generating conditions.

バージョン情報 | Version Info.

  • 本ページでは、ppwの高次元LoConバージョンを公開しており、これが本プロジェクトのメインページです。

  • LoConバージョンのppwは、さまざまな機能LoRAやベースモデルと柔軟に組み合わせることができ、エフェクトの強さをより高精度に制御可能です。高次元のLoConは汎用性と細部表現が優れていますが、その分、ストレージと計算リソースをより多く消費します。

  • 主にオンライン生成サービスや、高性能PCを保有するユーザーによるローカル生成を目的としています。

  • This page features the high dim LoCon version models of ppw, which also serves as the main page of this project.

  • The LoCon versions of ppw can be flexibly combined with various functional LoRAs and checkpoints, offering greater controllability over effect weight. High dimension versions provide stronger generalization and more detailed rendering, but it requires more storage space and computational resources.

  • They are mainly intended for online generation services and local use by users with high-performance PCs.

簡易版LoCon | Lightweight LoCon ver.

ベースモデル版 | Checkpoint versions (Illustrious)

ベースモデル版 | Checkpoint versions (NoobAI)

その他 | more

使用方法 | Usage

positive:

masterpiece, best quality, very aesthetic

negative:

low quality, displeasing

更新履歴 | Change log

v7

v7版ではデータセット構造を大幅に見直し、異なるトレーニングパラメータと戦略を採用したため、v7は以前のバージョンよりも安定性が劣る可能性があります

The v7 version has undergone significant structural adjustments to the dataset, and utilizes different training parameters and strategies. As a result, v7 may be less stable than the previous versions.

v-predモデルはCivitAIのオンライン生成器での動作と、TensorArtのオンライン生成での動作が完全に異なり、同じパラメータでは再現できません。なぜか私もわかりません……

The v-pred model's performance on the CivitAI online generator is completely different from online generation on TensorArt. The results are entirely unreproducible with a same parameters. I have no idea why...

TensorArt version CivitAI ver. with same parameter on CivitAI with higher weight

v7版の概要:

これは前作のデータセットを基に発展させた画像品質LoConであり、約90~95%の画像データはCivitAI上で公開された画像から取得しています。

このモデルは、アーティストキーワードや長い品質タグを使わずに、ベースモデルが比較的安定した画像品質を実現できるようにし、トークン空間を節約する効果があります。また、モデルに内在する一部の生成上の欠陥も補正します。(ただし手の部分は対象外です)

データセットの選定のため、生成される画像にはPonyの質感が反映されます。しかし、特定のアーティスト、スタイル、技法を指向していないため、異なるプロンプトやモデル条件によって、わずかに画風が変化することがあります。

This is a generation quality LoCon developed based on the dataset from the previous work. About 90%-95% of the image data comes from CivitAI.

It allows models to achieve relatively stable image quality without artist tags or using long quality prompts, freeing up more token space. Additionally, it can fix some inherent generation flaws of the model. (except for hands)

Due to the dataset selection, the generated images exhibit a Pony-like style. However, since it does not reference any specific artist, style, or painting technique, there may be subtle stylistic variations depending on different prompts and checkpoint conditions.

データセットの出典とライセンス | Dataset Source & License

  • データセット内のすべての画像は、著者が手動で選別・分類・ラベル編集しています。そのうち数百枚は手動で編集・修正されています。

  • 本モデルは無料・オープンソースモデルであり、ユーザーは個人デバイス上で自由にデプロイできます。著者はモデルの販売から一切の報酬を得ていません。また、商業用生成サービス商業目的での画像生成への利用を制限していません。ただし、本モデルと併用するCheckpointや他のLoRAのライセンス条件にはご注意ください。

  • データセットの約90~95%はAI生成画像ですが、概念補完のために、約250枚以上が公共メディア、ニュースメディア、出版物から収集されています。今後のバージョンではこれらの素材を徐々に代替していく予定です。商業利用を検討しているユーザーは、関連リスクを自己判断でご確認ください。

 本データセットは、特定のアーティストのデータをトレーニングしておらず、アーティスト情報もラベル付けていません(AIによる誤ラベルの可能性は完全には排除できません)。

  • また、本モデルは閉源商用、モデル販売、閉源商用モデルへの統合には使用できませんオープンソースで統合されたモデルを生成サービスに使用することは制限しませんが、統合モデルの出典を明記することを推奨します。

  • Every image in the dataset has been manually selected, categorized, and annotated by the author. Additionally, hundreds of the images have been manually edited and corrected.

  • This model is free and open-source model, allowing users to deploy it on their personal devices. The author does not receive any compensation from selling the model. The author does not impose restrictions on using this model for commercial image generation services or generating images for commercial purposes. However, please be mindful of the license restrictions of the Checkpoint and other LoRAs used alongside this model.

  • Approximately 90%-95% of the dataset consists of AI-generated images. However, around 250+ images have been collected from public media, news outlets, and publications to supplement concepts. Future versions will gradually replace these materials. Users with commercial intentions should be aware of the potential risks.

    This dataset does not include training data from any individual artist, nor does it contain explicit artist attributions (though AI mistagging cannot be entirely ruled out).

  • Additionally, this model is not permitted for use in closed-source commercial applications, model resales, or merged into closed-source commercial models. There are no restrictions on open-source merged models being used for image generation services, but it is recommended to credit the sources of any merged models.

このモデルで生成された画像

画像が見つかりません。