Bad Card Template
詳細
ファイルをダウンロード
モデル説明
v1.0をご利用の場合は、以下の説明文を必ずご一読ください。(https://civitai.com/articles/671)
このモデルはボードゲーム/トレーディングカードゲーム用のカードテンプレートを作成します。
Loras
bct2_basic:カードを生成します。やや過剰に詳細化され(描写が多すぎ、3D要素が強調され、発色がやや鈍い)、見た目は悪くありません。
bct2_2080_basic:過剰に詳細化されたチェックポイントを削除したバージョン。
プロンプトの書き方
活性化ワード「bct2」
色:「緑色」、「溶岩赤色」、「黒と金色」
スタイル・アートスタイルや世界観:「水彩画風」、「スチームパンク風オイルペインティング」、「デジタルアート風」
背景の説明:「黒背景」、「背景に森」、「スケッチ模様の背景」
カードの説明:「金の装飾のあるカード」、「宝石のような見た目のカード」
タイトルバナーの説明:「青色のタイトルバナー」、「 hammered gold 字体のバナー」
描画の説明:「雷がある楕円形のイラストスペース」、「黒い額縁」
テキストボックスの説明:「雲のテクスチャのあるテキストボックス」
ステータスを記載するスペースの説明:「左上にハートのシンボル」、「右下にシールドのシンボル」
質:「傑作、最高品質」
ネガティブ:ぼやけている、不恰好に描かれている、不快な見た目、低品質(トレーニングデータ由来)
もちろん、すべてが画像生成に必要なわけではないし、すべてが正確に反映されるわけではありませんが、これがモデルが学習した内容です...
重み(Weight)
これは難しいポイントです。多くのモデルは人間や「わふう」キャラを描きたがるからです。
1.5~3.0:風景やオブジェクトを描けるモデル用
2.5~4.5:Lyrielや一部のアニメモデル用(アニメ少女を描きたがる傾向を抑制するため)
0.7~1.3:わふう基本用
描画がカードではなく「描画」になっている → 重みが低すぎ
詳細があるカード → 重みは適切
細部のないカード → 重みが高すぎ
中央にブラックホールのような黒い部分がある → 重みが極めて高すぎ
「plain card style」をプロンプトに追加することで、標準的なカード(長方形、タイトル、イラスト、タイトル、テキスト)を得やすいです。
いずれにせよ、新しいチェックポイントを使用する場合は、Lora重みを用いたPrompt X/Y/Zを強く推奨します。
アニメモデルでカードを作るとき
このモデルは、リアルな画像生成モデルであるOpenJourneyV4でトレーニングされています。
アニメモデルでカードを作るのは難しいです。カードの形状を正確に表現するのが困難(Lora重み > 4.5が必要だが、その重みではLoraが崩壊する)
ちゃんとしたカードが生成されるかどうかの主な要因はLora重みではなく、ランダムシードです(コントラストの高いシードが要る)
嘗めてみるべきこと:
複数のシードを試し、良い結果を得たものは再利用
良いシードを見つけたら、Lora重みを微調整
上記のように「plain card style」を追加してみる
「bct2」の活性化ワードの重みを下げてみる。これらのモデルはBooruプロンプト(タグベース)を使っているため、テキスト層にLoraが効かない可能性がある
代替案として、LyrielやXenoEngineでカードを作り、アニメチェックポイントでimg2img処理をループバックさせる(例:ノイズ除去0.6、ステップ数50、ループバック6回、最終ノイズ除去0.2)
その他コメント
「add_details」Loraの導入を強く推奨します(よりコメディカルまたはリアルな仕上がりに)/model/82098/add-more-details-detail-enhancer-tweaker-lora
不要な詳細は http://cleanup.pictures でクリーンアップ可能
セグメンテーション関連の拡張機能(segment-anythingベース)を使って、カードの関連部分をピックアップし、後処理ができます
モデルはときどき暗い画像を生成することがあります(黒背景・黒いイラスト枠を元にトレーニングしたため)。これはプロンプトで調整可能
制御ネット(ControlNet)で特定のカード形状を得るテクニックは、依然として有効です(v1.0の説明を参照)
トレーニングに使ったデータセットは公開されています。もし本当にゼロから再訓練するなら、補助語(例:「タブレット」や「スマートフォン」や「トレーディングカード」)を追加した方が良いと考えます
テキストインバージョンを試みましたが、失敗しました(Loraと相性が悪かった)。しかしヒントを得ました:有効な補助プロンプトは「📅」(カレンダーアイコン)です。複数の「📅」をプロンプトに追加すると、生成がプロンプトに従いやすくなり、アイコンの生成が促進され(ステータス表示に有効)、カードの領域分割も促進されることを確認
さらに多くのLoraについては /model/95424/pokeffects を参照
アートスコアについて
自身の観察では、4.5 は普通のカード、5.5~6.0 は非常に良い出来、6.2以上はカードではなく、描画とみなされてしまう
よって、「masterpiece, best quality」がプロンプトにない場合、カードの形状が安定しやすくなる
このモデルはリアルなチェックポイントでトレーニングされたため、リアル系では 5.5~6.0+ のスコアが得られるが、アニメ系では約 5.0~5.5 にとどまる。より良いスコアを得るには特化したデータセットとLoraの訓練が必要
配置について
現代のニューラルネットは注意機構(attentional networks)を使うため、画像のわずかな移動(上下1ピクセル)の影響は小さい(並進不変性を持つ)。しかし、これは特定の要素を画像の特定領域に正確に配置するのが難しくなる原因にもなる
精度の高い配置が必要なカードやボードゲームを作成するには、コントロールネット、SDXL/SD3、または注目度を高めるテクニックが必須(コントロールネットの色に関する記事の後半を参照)
YouTube動画について:
このユーチューバーは「AI/SDの時代において、ボードゲームアーティストはどのようにして報酬を得られるのか?」(/watch?v=SdgzH2OSZDY)と問いかけ。このLoraはアーティスティックな才能に欠ける方に向け、より良いプロトタイプを生成するためのツールです。テーマに関するご意見がある方は、動画を見てコメントをお願いします。
/watch?v=XDd4u2xnRtE - TCGカード作成における重要なルール
YouTubeで良い動画を観たので、いくつかコメント:
コンピュータビジョンにおける「オクルージョン問題」とは、他の物体に部分的に隠された物体の認識を指す。本技術は、カードの各部(互いに重なり合う部分)を一つずつ生成することで、重なりの問題を回避している
コントロールネットのテクニックはbct-v1.0と類似しているが、テクスチャ付きマスクの潜在表現(textured masked latent)というのは、自分にとって新発見。非常に小さなドットを使用しているため、超高精細なテクスチャ(細かいスケールのディテール、高周波フーリエ成分)を求めていると推測
つまり、コントロールネットによる厳密な寸法管理により、異なる部品を別々に生成して、クランや色、レアリティなどのバリエーションを自由に組み替えつつも、互換性を保てるという点で非常に優れていると感じます
彼は各パーツを合成した後、0.25のノイズ除去で最終的なimg2img処理を行っています。また、カードのすべてのパーツに同じモデルを使用しており、全体的な統一感を維持しています
シールドの部分については、bct-v1.0 + サイクル形状のControlNet + 低Lora重みの方が好き。bct-v1.0 Loraは「画像の平滑化・アイコン化」に優れるため、より良い結果が得られたかも
最終的なテキストと画像の合成については、既存のカード制作ソフト(ギャルカードやデッキ再生成が必要な場合)を使うのが望ましいが、最終的なimg2imgブレンドは行えなくなる
最後の不満点(非常に泥臭い指摘):ポートレートを構成の中で最も「隠れ」た部分(マスクされた部分)にしてほしいが、わずかな要素(この動画では宝石や髪の毛が、「巻物」と「額縁」の上に重なることも可能)は例外となる。この現象の名称や自動化方法はまだ不明
想像を絶する最終出力
