SDS_FILM / 胶片摄影

詳細

ファイルをダウンロード

モデル説明

V5_SD1.5:

モデルは主にフィルム写真コンピュータービジョン写真、デジタルRAWの3大カテゴリを訓練し、アジア人のポートレートに対して深く微調整を行っています。現在のトレーニングデータの主体はアジアの若年男性・女性、および一部の風景です。タグ付けにはGPT4Vを使用し、一部ではCogvqaとWD1.4を組み合わせてラベリングしています。WD1.4でラベル付けされた「1girl」「1boy」は「woman」「man」に変更しており、年齢の誤認を防いでいます。

注意:このバージョンはSD1.5バージョンであり、他のモデルページから統合されたものです。また、このモデルはバランスの取れた総合的な訓練目標ではなく、機能的・審美的な偏りが明確に存在する可能性があります。

デジタルRAW:Raw format

フィルム類:Film photography

代表的なフィルム機種:Fuji C100 shooting、Fuji C200 shooting、Kodak 400 shooting、Kodak gold 200 shooting、Nolan 5219 shooting

コンピュータービジョン写真:computational photography

画質評価:Mobile phone image quality、Landline image quality、Pager image quality

開始時のプロンプト(実際の状況に応じて調整可能。計算摄影と以下の評価をネガティブに追加すると画質が最大限に向上し、逆にそれらを排除すると画質が低下します):

ポジティブプロンプト:8K,masterpiece, best quality:1.2,ultrahigh-res,

ネガティブプロンプト:anime,cartoon,3D rendering,high saturation,facial blemishes,lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username,CyberRealistic_Negative-neg,(SkinPerfection_NegV15),

その他のパラメータ設定は例画像を参照してください。

存在する問題:1.5モデルでは目の処理が常に不十分です。より深く修正したい場合は、XLモデルを使用して目の部分を別途再描画することを推奨します。

モデルはLEOSAM FilmGirl Ultraを基に訓練されています。すべての著作権使用声明は上位モデルと同様に継承されます。

V4:

モデルは主にフィルム写真コンピュータービジョン写真の2大カテゴリを訓練し、アジア人のポートレートに対して深く微調整を行っています。コアデータの最適化に加え、人気のあるフィルム機種を追加しました。画像に対して画質評価を導入し、さまざまな低品質画像を用いてネガティブ特徴を抽出し、画質制御能力を強化しました。

The model mainly trains film photography and computational photography, and makes in-depth fine-tuning of Asian portraits.

Add some popular film models while optimizing the core data.

The picture quality is rated, and a variety of low-quality images are introduced to extract negative features to enhance the ability of picture quality control.

本モデルはLEOSAM's HelloWorld5.0大規模モデル(以下、HW5.0と略称)をベースモデルとして使用しており、すべての使用ルールはHW5.0の声明に従います。本モデルを統合または修正する場合、説明文に必ず本モデルおよびHW5.0を明記してください。以下がHW5.0モデルのアドレスです:/model/43977/leosams-helloworld-sdxl-base-model

This model uses the LEOSAM's HelloWorld5.0 large model (hereinafter referred to as HW5.0) as the basic model, and all the usage rules also follow the statement of HW5.0. If you modify this model, be sure to mention this model and HW5.0 in the introduction.

The following is the HW5.0 model address: /model/43977/leosams-helloworld-sdxl-base-model

私のモデルをお気に召しましたら、コーヒーを一杯ご馳走ください、または愛发电でサポートしてください。また、返信画像やスター、コメントをぜひお寄せください。これは私にとって本当に重要です!

トレーニングプロンプト概要:

解像度については、896*1152を優先して推奨します。その他のパラメータはV4RC1またはHW5.0の説明を参照してください。

以下は重点トレーニング概念と呼び出し語です。

フィルム:Film photography

代表的なフィルム機種:Fuji C100 shooting、Fuji C200 shooting、Kodak 400 shooting、Kodak gold 200 shooting、Nolan 5219 shooting

コンピュータービジョン写真:computational photography

画質評価:Mobile phone image quality、Landline image quality、Pager image quality

(画質は順次低下:スマホ画質、固定電話画質、ポケベル画質)

**訓練済みネガティブプロンプト:**overexposed background,poor lighting,overexposed areas,uneven lighting,Low resolution,potential compression artifact(これらはテスト済みで、画像への過度な干渉は発生しません)

使用推奨:

フィルムを使用する場合Film photography+任意のフィルム名(またはフィルム名なし)を入力してください。

訓練済みネガティブプロンプトとworst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketchを追加してください。

オプションでcomputational photography、Mobile phone image quality、Landline image quality、Pager image qualityを追加できます。

計算摄影カテゴリを完全にネガティブに含めると、過度なシャープネスのリスクが発生します。また、データの主体は依然としてフィルムであるため、特定のプロンプトを追加しなくてもデフォルトでフィルム効果が適用されます。

コンピュータービジョン写真を使用する場合(つまりスマホ画質):computational photography+任意の画質評価を入力してください。

ネガティブには訓練済みネガティブプロンプトを含める必要はありません。なぜならこれらはコンピュータービジョン写真の特徴そのものだからです。

異なる写真カテゴリの画質比較:

異なるフィルム機種の比較:

異なるネガティブ埋め込みの比較:


注意:すべての写真効果は現実世界におけるフィルムやスマホ撮影の効果を反映していません。これらはすべてAIによるシミュレーション結果であり、個人の審美に基づいています。モデルの出力結果を現実の具体的機器と対応させないでください。

Note: all photography effects can not represent the real world film, mobile phone shooting effects, here are AI simulation results, with personal aesthetic, do not correspond to the model effect to the real specific equipment.

V4_RC1:

V4はローカルで数百時間にわたり訓練され、データ主体はGPT4Vでラベリングされ、一部はWD1.4+cogでラベリングされています。モデルは一部過学習の状態に陥りましたが、最初のMBWステップで緩和されています。前バージョンであるV4と比較して、手の構造が相対的に改善され、プロンプトへの反応がより敏感になり、色彩調整もより大胆になっています。(データの制限により、すべての効果を保証することはできません)

V4_RC1:

V4 has been training locally for hundreds of hours, and the data body is marked with GPT4V and partly with WD1.4+cog.

The model has also encountered the situation of partial overfitting, and the first round of MBW has been carried out to alleviate it.

Compared with the previous version of V4, the hand structure has relatively better performance, more sensitive cue response, and more radical color adjustment.(Due to the limited data, the comprehensive effect can not be guaranteed.)

使用方法:

通常、私はDPM++2M Kまたはrestartを使用し、サンプリングステップは30–40(restartは20)、CLIP終了値は1、**CFG:**5–7と設定しています。

ADetailerでは、エッジぼかしを20、リドロー強度を0.4に設定しています。

refiner0.8を接続すると、高周波のディテールがさらに向上します。

ハイディテール修復には8x_NMKD-Superscale_150000_Gを使用し、拡大率1.5、反復回数12、強度0.35と設定します。

ネガティブプロンプト:(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch),mole,skin blemishes,(このバージョンでは肌の瑕疵が発生することがあり、最後の2つを追加することで効果的に緩和できます)

Instructions for use:

usually I use DPM++2M K or restart, sample 30-40 (restart20), cilp terminates 1pm CFG restart20 5-7.

In ADetailer, the redraw edge is blurred by 20, and the redraw range is 0.4.

You can access refiner0.8 for better high-frequency details.

HD repair uses 8x_NMKD-Superscale_150000_G, zoom in 1.5, iterate 12, and range 0.35.

Negative prompts: (worst quality, low quality, illustration, 3D, 2d, painting, cartoons, sketch), mole,skin blemishes, (this version may have skin defects, adding the last two can effectively relieve)

The model may still have problems, and now GPT4V marking + new process retraining has been used.

V3正式版説明:

自然言語をFP32でトレーニングし、固定トリガー語は使用していません。サンプラーに関する問題はテストで検出されていません。人種の表現が不安定な場合、「アジア人」と入力することでトリガーを強化できます。状況に応じてハイディテール修復や顔面修復を有効にしてください(フルフェイスのカメラショットでは顔面修復は推奨しません)。

2.1.2

現在、ほとんどのサンプリング手法はほとんどのシーンで過剰なノイズを発生しないため、refinerは必須ではなく、After Detailerも正常に使用可能です。その他の設定は下記と同じです。

DPM++ 2M Karras、Euler、Restartのパフォーマンスが相対的に優れています。

Most sampling methods now no longer generate excessive noise in most scenarios, so refiners are no longer necessary, and After Detailer can also be used normally.

DPM++2M Karras, Euler, and Restart performed relatively better.The remaining parts are still the same as below.

2.1.0

1:多数のテストを実施した結果、最も推奨されるサンプラーはeulereuler aです。最適ステップ数は50を推奨し、refinerを有効にし、切り替えタイミングを0.9に設定すると良いです。

他のサンプラーは一部のシーンで不同程度のノイズを発生させるため、refinerでノイズ低減が有効です。しかし、ADetailerをオンにすると再びノイズが追加され、ほぼ使用不能になることがあります。他のサンプラーを使用する場合は、顔修復プラグインをオンにせず、直接ハイディテール修復のみを実行してください。これは私が現在直面している最大の問題です。

2:CILP:2(1でトレーニング、テストでは2にしても差異なし)

3:ADetailerはeulereuler aサンプラーを使用する場合のみ推奨されます。

4:解像度:896*1152(またはその他の公式推奨解像度)

使用方法:

1:多数のテストを実施した結果、最も推奨されるサンプラーはEulerEuler aです。最適ステップ数は50を推奨し、refinerを有効にし、切り替えタイミングを0.9に設定すると良いです。

他のサンプラーは一部のシーンで不同程度のノイズを発生させるため、refinerでノイズ低減が有効です。しかし、ADetailerをオンにすると再びノイズが追加され、ほぼ使用不能になることがあります。他のサンプラーを使用する場合は、顔修復プラグインをオンにせず、直接ハイディテール修復のみを実行してください。これは私が現在直面している最大の問題です。

2:CILP:2(1でトレーニング、テストでは2にしても差異なし)

3:ADetailerはEulerEuler aサンプラーを使用する場合のみ推奨されます。

4:解像度:896 * 1152(またはその他の公式推奨解像度)

プロンプト部分:

1:新しいラベリングモデルを使用しています。CLIPモデル:VIT-L-14/openai、キャプションモデル:bilp2-flan-t5-xl。画像の説明が分からないときは、これらのモデルを使い逆向きにプロンプトを推論すると最良の結果が得られます。

2:トリガー語について:テスト結果、画像に多少の影響はあるものの、それほど顕著ではありません。しかし、使用することを推奨します。

3:重要!すべての字幕ファイルを分析し、最も効果的なタグをまとめました:ulzzang,naver fanpop,ffffound,streaming on twitch,character album cover。これらはトリガー語に次いで最も頻繁に出現する内容です。最初にこれらすべてを一度に入力すると、非常に良い結果が得られます。

4:ポジティブ品質プロンプトについては、私は以下の2つを使用しています:lora:DetailedEyes\_xl\_V2:1,lora:neg4all\_bdsqlsz\_xl\_V7:1。これらはすべて@bdsqlszによるもので、ほぼ汚染がありません。手の修復にはlora:ClearHand-V2:1を使用します。これは@frostyforestによるもので、シンプルな手の関係を非常にうまく処理しますが、複雑な場合は依然として困難です。

5:ネガティブプロンプト:(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch),greasy skin,

最後に、私のQQ交流グループは749047075、パスワード:SDSです。興味のある方はぜひ参加し、議論・共有してください。新しいモデルが登場したときは、すぐに内部テストを行います。

Reminder section:

1: We have used a new marking model, cip model: VIT-L-14/openai, and capture model: bilp2 lan t5-xl. Therefore, when you don't know how to describe the image, you may want to try using these two models to infer prompt words, which will achieve the best results.

2: Regarding summoning words: I have also conducted a test and the conclusion is that it will have a certain impact on the screen, but not much, but it is recommended to still use them.

3: Here comes the key! I have compiled all the subtitle files and summarized the most effective ones: ulzzang, naver fanpop, ffffffound, streaming on tweet, character album cover. They are the content that appears the most frequently except for summoning words. You can add them all at once as a starting point, and the results are very good.

4: Regarding positive quality reminders, I usually use these two:<lora: DetailedEyes_ Xl_ V2:1>,<lora: neg4all_ Bdsqlsz_ Xl_ V7:1>, they all come from @ bdsqlsz and have almost no pollution. Hand repair<lora: ClearHand V2:1>, from @ frost forest, handles simple hand relationships well, and is indeed a challenge in complex situations.

5: Negative prompt words: (best quality, low quality, illustration, 3d, 2d, painting, cartons, sketch), great skin,

Finally, this is my QQ communication group 749047075, password: SDS. Interested friends can join the discussion and exchange. If there are new models, I will also conduct internal testing as soon as possible.

サンプラー/ステップ / Sampler/Steps:

トリガー語 / trigger word

このモデルで生成された画像

画像が見つかりません。