AITK-Humanoids

詳細

ファイルをダウンロード

モデル説明

🔥 AITK-Humanoids — ベータ版更新

このプロジェクトをフォローされている方々へ、最新のアップデートをお届けします。新たに255枚の画像から構成されたデータセットを用いて、AITK-Humanoidsのベータ版をゼロから再学習しました。

今回の主な目標は、ロボットのような人型の陳腐さを解消することでした——そして、見事に成功しています。より多様なエイリアンにインスパイアされた人型が生成され、合成テクスチャ、プレーティング、顔構造の統合も改善されています。また、エイリアンタイプ全体の形状の多様性も顕著に向上しています。

⚠️ ただし、このバージョンは通常よりやや不安定です。詳細は以下の通り:

  • 90% の出力は安定しており、実用可能

  • 8%狂気的なほど——驚異的な構図、肌の質感、創造的なフォルム

  • 2% は単に破綻——ビジュアルの不具合や解剖学的な不自然さ

なぜリリースするのか?というと、このチェックポイントにおける創造性とテクスチャの質が、見過ごせないほど優れていたからです。個人的には、たまに傑作が得られる代わりに、少々使い物にならない出力があっても構わないと思っています。

安定性のヒント
このLoRAに以下の要素を組み合わせてください:

  • AITK-Cine+0.5

  • AntiFlux-0.5

この設定で、これまで使い物にならない出力はゼロでした。そして、美的品質は常に非常に高いままです。


🧠 いくつかの補足とプロンプトのヒント:

  • このLoRAは少し自立した考えを持っています——必ずしもプロンプト通りに動かないことがあります。しかし、それがむしろ強みです。ベースのFluxスタイルLoRAを使うよりも、はるかに多様な結果が得られます。

  • 前回のバージョンでも述べましたが:非常に詳細に指定しても、創造の余地を残しておくのもOKです。

  • 重要:「エイリアン」≠「人型」。キャラクターが人間に近いフォルムである場合は、「人型」や「女性人型」などの語を使いましょう。非人間的なシルエットや構造を望む場合は、「人型」という語を省いて、「エイリアン」のみを使用してください。

  • また、「woman」という語は結果を乱すことがあります——「female」「male」 のほうが中立的で信頼性が高いです。


🛠️ 知られているベータ版の問題(次回更新で解決予定)

  • モデルは丸みを帯びた、またはボリュームのあるボディタイプに対応しづらい——スレンダーまたは筋肉質な体型に偏りがち

  • 肥満または筋肉質なキャラクターは稀

  • ロボット型人型は今やうまく生成できるようになりました——次回更新でさらに洗練します

その他の問題やエッジケースに気づいた場合は、フィードバックをお送りください。これらは次のバージョンの改善に直接役立ちます。


AITK-Humanoids — 初版リリース

皆さん、また戻ってきました。

LoRAの学習をしばらく休んでいましたが、ベースのFlux開発モデルの弱い点の一つ——興味深く多様な人型キャラクターを正しく生成できないという問題に取り組む時が来たと感じました。それがAITK-Humanoidsの目的です。

このLoRAにより、スタイル化されたエイリアンやファンタジーの亜種、過小評価されている人種の人体まで、幅広い人型フォルムを生成できます。当初、ネアンデルタール人オーストラロピテクスホモ・エレクトスなどの初期人類の概念も試しましたが、今回のバージョンでは十分に定着しませんでした。それでも、試してみてください——エッジケースから面白い結果が生まれることがあります。


⚙️ LoRA仕様とデータセット

  • 重み:1.0が最適——独自で十分な強さを発揮します

  • 学習データ:99枚のカスタム画像

  • ソース:リアルな写真と、丁寧に選定された人工データの混合

  • 解像度範囲:512 → 1536px(通常は1MPで生成)

  • サンプラー/スケジューラ:IPNDM + Scheduler Beta(推奨ステップ:20)

このバージョンは、以下を得意としています:

  • 多様な人型の形状肌の質感体型

  • ほとんどの肌の色、特に珍しい色の組み合わせも

  • SFWNSFWの両方のコンテンツ(使用制限は設けていません——あなた次第です)

注目すべき制限:ロボット的またはサイバネティックなコンセプトはまだ十分に理解されていません——これは今後のアップデートで対応予定です。


🧠 プロンプトのヒントとテンプレート

このLoRAのキャプションは以下の構造で作成しました:

[アングル]、[キャラクターと属性]、[オプションのポーズ]、着用している[服]、[環境]、[光の種類]

正確さを重ねれば重ねるほど、コントロール力が高まります。しかし、創造的な多様性を求めたい場合は、意図的に曖昧にしてもOK——モデルが驚かせてくれるはずです。

🔄 アスペクト比:

すべてのアスペクト比を学習に含めています。縦、横、正方形のフォーマットいずれでも良好な結果が得られます。


✅ こんな用途にご利用ください:

  • SFやファンタジーの人型キャラクター

  • キャラクターの民族的多様性と包括性

  • コンセプトアート(フォトリアルまたはスタイル化)

  • NSFWまたは芸術的なヌード——現実的な解剖学と多様性を伴う


❌ 知られている制限:

  • ロボット的またはメカ風の人型にはまだ対応していません

  • 原始人類(ネアンデルタール人、ホモ・ハビリスなど)は改善が必要

  • 他のフォトリアルLoRAと併用すると安定しない場合があります——最良の結果を得るには単独使用を推奨します


結果や実験をぜひ共有してください。このLoRAを意図した範囲を超えて、どのように活用されているのか、常に興味があります。これは始まりにすぎません——次期バージョンでは、推測的進化、ロボティクス、さらなる多様性の深化をさらに深めていきます。

このモデルで生成された画像

画像が見つかりません。