狲思邈,中国最著名的兔狲 | Sun Simiao, a Pallas's cat.

詳細

ファイルをダウンロード

モデル説明

モデル必須トリガー語: s4s the Pallas's cat、推奨他のプロンプト:manul、4K HD hi-res photo、realistic Hasselblad photography

モデル推奨重み: 0.6~0.8

モデル推奨パラメータ: サンプラー:DPM++ 2M Karras または Restart、CFGスケール:7~10、サイズ≥1024x1024、ステップ≥30

心の声:

孫思邈(2015–2022年10月10日)は、野生から救助され、西宁野生動物園で生活した雄のユキノスリガネネコであり、中国で最も有名なユキノスリガネネコだ。

西宁野生動物園の円掌(ユエンチャン)氏が長年にわたり継続的に普及活動を続けてきたこと、また孫思邈とその家族の大きな魅力のおかげで、近年、ユキノスリガネネコはほとんど知られていなかった種からスター種へと成長し、ヒョウやアカネコなどと並んで、青蔵高原の野生動物保護および生態系整備への関心を大きく高めた。

孫思邈の名前は、初めて観察された交尾行動がわずか4秒だったことから、音の似た「孫思邈」(古代中国の名医)に因んで名付けられた。彼の人生は、冗談のような名前で始まり、また冗談のような形で幕を閉じた。昨年10月10日、鶏肉を急いで食べすぎた結果、鶏の骨が喉に詰まり、窒息死した。飼育下のユキノスリガネネコの平均寿命は12〜15歳であり、7歳はまだ壮年期だ。私のユキノスリガネネコ好きの友人たちは、この出来事に大きな衝撃と悲しみを覚えた。

今年2月、私は初めてLoRAモデルに触れ、最初に作成したモデルがユキノスリガネネコLoRAだった。ユキノスリガネネコはマイナーな種であり、MidJourneyや公式SDモデルいずれも、正確なユキノスリガネネコの画像を出力できない状況だった。LoRAはこのようなニッチな概念を微調整する絶好の手段である。私の初代ユキノスリガネネコLoRAは、filmgirlのような汎用モデルで、異なる個体の300枚の写真を使用して訓練した。このモデル完成後、私は2番目のLoRAとして、孫思邈の専用イメージLoRAを作成することにした。そのために、ユキノスリガネネコ愛好者から孫思邈の写真を合計263枚収集した。その70%は@yspennyから、30%は@西宁野生动物园@円掌@天音文创馆から得た。しかし、結果はあまり良くなかった。主な理由は以下の3点:

  1. ほとんどの写真はスマホで撮影され、遠景を切り抜いたもので、画質がぼやけており、自動フィルターによる色調の変化が生じている。

  2. 西寧野生動物園の子猫館のガラスは緑がかった色調で、反射が激しく、画像品質をさらに劣化させている。

  3. 孫思邈は生涯、子猫館の小さな展示室で過ごし、背景が単調かつ固定化されていた。

これらの原因により、モデルの出力率が低く、大量の画像生成(roll)が必要だった。そのため、このバージョンの孫思邈LoRAは公開せず、毎晩ノートパソコンで画像生成を走らせ、翌朝、自分が最も理想的だと思う画像を自分の動物普及アカウントに投稿していた。私はかつてWeiboで冗談を投稿した。「この大量の画像選別は、AIが私を逆に微調整して脳を洗脳している」と。孫思邈の実際の顔貌を記憶から歪めてしまい、しばらくしたらリアルな写真を見直して目を「洗う」必要があると。

しかし今、これらの課題に新たな解決策が登場した。まだ多くの不完全さは残るものの、SDXLモデルの性能は明らかに高く、上限もより高い。孫思邈の命日1周年の直前に、私は改めて孫思邈専用のSDXL LoRAモデルを制作することを決意した。SD1.5モデルの不足点を補うため、以下の改善を試みた:

  1. SDXLモデルは訓練データの品質に非常に敏感であるため、元の訓練データは品質が不安定で全体的にぼやけていた。そこで、訓練データを224枚に再選別し、不要な画像を削除すると同時に、修復可能な画像についてはAIで画質を強化した。

  2. 正則化データセットに、世界中のユキノスリガネネコ個体の精选された1006枚の写真を追加した。訓練には、自然言語とラベルの混合タギング方式を採用し、異なるトリガー語の効果をテストして、孫思邈の訓練データセットと他のユキノスリガネネコ正則化セットの適切な区別と関連付けを追求した。個体の外見を汚染しないよう注意しつつ、正則化セットを利用して毛の細部を強化し、背景環境や表情・姿勢の汎化を図った。

  3. adam8bit、DAdaptAdam、Prodigy、adaFactorの4つの最適化アルゴリズムをそれぞれ用いて訓練を実施し、生成されたモデルを比較・融合させ、最終的に色再現性、汎化性、類似度の3つの観点で最もバランスの取れたバージョンを正式版LoRAとして選定した。

完成した結果には満足している。SDXL特有の遠景のぼやけは依然として存在するが、色彩、表情、環境の汎化性は大幅に向上した。

以上が、孫思邈LoRAモデルを制作した全体的な心の軌跡である。これは、実際に使う人が少ないマイナーなモデルにしかならないだろうが、私の眼には、これまで制作した他のどのモデルよりも価値がある。なぜなら、このモデルには、私と訓練画像を提供してくれた撮影者たちの、孫思邈への想いが込められているからだ。人生は短かったが、輝かしく生きた。貧しい西北の動物園で、多くの素晴らしい写真を残せなかったが、それでも、あなたはサイバースペースで永遠に生き続ける。一年が過ぎ、私たちはあなたをとても思い出す。孫星では、ゆっくりと食事をして、すべてがうまくいきますように。

孫思邈は亡きが、その姿は栩栩如生。

このモデルで生成された画像

画像が見つかりません。