Hayakawa Moemi (Video Girl Ai) - 早川もえみ(電影少女)100% Manga【Body Shape LORA・体型再現LORA】
詳細
ファイルをダウンロード
モデル説明
ファイルサイズにご注意ください。品質を優先してサイズを犠牲にしています。
⚠️【重要安全警告】
このLoRAを非公式な再配布サイトからダウンロードした場合、その安全性、動作性能、最新バージョンであることを保証できません。安全で信頼できる利用を確保するため、必ずこの公式Civitaiオリジナルページからダウンロードしていることを確認してください。https://civitai.com/
本LoRAは、Civitaiでのみ無料(フリー)配布しています。
⚠️ 【重要安全警告】
本LoRAを無断転載先からダウンロードした場合、安全性、動作保証、最新バージョンの提供は一切できません。安全に確実にご利用いただくためには、必ず Civitai のオリジナル公開ページからダウンロードしていることをご確認ください。https://civitai.com/
👍️気に入っていただけましたら、「いいね!」ボタンをクリックして、次回の LORA 作成にご協力ください。
画像投稿して下さる方は末尾の注意書きを必ずお読みください。
組み合わせの例はサンプルを御覧ください
チェックポイント、埋め込み(ポジ・ネガ)、LORAウェイト
※サンプル画像には開発段階のLORA名が含まれます。そのままの名前では認識しませんので正式リリース版の名前に変更してください。
これはただの雑談ですが、「まあ、時間あるし読んでみるか」と思った方は、AI翻訳ツールをご自由にお使いください。このテキストは方言や会話調が混じっているため、一般的な翻訳ソフトでは対応が難しいかもしれません。
簡単に処理するには、以下の文をコピー&ペーストして、翻訳したい日本語テキストを一緒に送ってください。
AIへの指示: この日本語テキストを翻訳してください。テキストは非常に会話的で方言を含んでいますが、難易度は高くありません。流暢で自然な英語に翻訳してください。
【 版権キャラなのでアーリーアクセスなしです 】
日米を中心に法的に極めてややこしくなってきています。絶対に商用利用禁止です。ファンアートの範疇を逸脱しないようにご注意を。Civitai以外で公開、つまり二次配布した時点で多大なリスクが発生していることになります。知らんよ? 言ったからね。
今回のLORAは『どこまでやれるかのチャレンジ』です。
ファイルサイズが巨大で融通が効きません。
ご承知の上でダウンロードください。
だが、気に入っていただければ『今までのLORA全部この方法で作り直せ!』そんな要望がでそうな予感すらあります。
先にいいますが、そんな要望出されても無理があります(笑)
なぜ無理があるのか?
以下はそんな内容です。
唐突ですが。
LORAを触っていて『ありもの感』を感じたことはないでしょうか?
顔はいいのですよ。
キャラクターLORAが存在する理由でもありますので、ここで『ありもの感』を感じることはまずないはずです。
そうです。
問題は体型です。ハンコで押したように似た体型になってしまうのです。
(もちろん、それを避けるために色々するのですが。 生成するときも強度で調節しますよね。あれです。でも限界がある、付け焼き刃感も拭えません)
たとえば現実なら足が短い女の子だって、水泳部で肩幅が広い女の子だっているわけです。それは欠点ではなく、それも含めて女の子は可愛いのです。
ところが『ありもの感』の体型はそういったことはありません。
AIは元々、体型を(高い、低い、太い、細いなど)『限られたパターン』で認識し、その組み合わせによって無限に近い表現を生み出します。
しかし、新しいポーズや服に対応しようとするとき、AIは『体の比率を崩すリスク』を回避しようとし、自動的に最も安全で、無難なパターン(=どこかで見たことのある汎用品)を選び出してしまいます。『ありもの感』の原因ですね。
どのキャラを出力しても体型が似通ってくるのは、大きくふたつの原因があります。
1)データセットに含まれていない : 顔のアップやバストアップが多く、体型に関する知識を学習していない。そのためベースモデルがもつ「一般的な体型(平均化されたもの)が出力される」
つまり『ありもの感』が出るのは当然。ありものを出力しているから。
2)ベースモデルの強力なバイアス : ベースモデルは数十億の画像でトレーニングされており、これらを結果として「平均化された体型」のデータとして持っています。
LORAの学習データに全身画像が含まれていても、量が少なく、また汎用的なタグ付けが(例えば”1girl”)平均化を手伝っているという現状があります。
ようするにベースモデルに負けているわけです。
言い方を変えればベースモデルの強固なバイアスを打ち破って「キャラ固有の個性として持っている体型」を学習し、再現させれば可能です。
ややこしく聞こえますが要は、『顔だけじゃなく、身体の特徴も全て学習させたLoRA』です。
そこで、これら疑問をAIにぶつけ、ベースモデルの数十億のトレーニングデータに打ち勝って、本当の個性をLORAが手に入れる方法を相談してみました。
結果は。。。
おおよその想像通りなのですが解決策は大きくふたつです。
戦略1) 単純にベースモデルの呪縛を破るだけの学習データを用意する。
戦略2)トレーニングパラメーターで深く体型を学習できるようにする。
手前味噌ながら私のLORAで一番人気の、北村香織LORAが 戦略1)意図せず体型の個性を獲得していたことになります。
もともと肉体を描くジャンルの漫画であることに加えて、とても絵がうまく統一感がある全身画像をありったけ学習し、その上で作ったLORAで出力した厳選画像と元画像をミックスしてさらにLORA作成、それを数度繰り返すという『ちょっとオツムがいっちゃってる作り方』をしています。
要するに初心者が解らないなりに『作ったLORAを使って、新しい学習データを用意する』これを猛烈な枚数で繰り返していたのです。
・・・そうか、どうりで。
『なんか香織ちゃんだけ群を抜いて出来がいいなぁ・・・』と思っていたのです(オイ)
しかし考えようによっては、皆さんの”見る目”が確かな証拠です。
無論キャラクター自体が魅力的なのはありますし、原作漫画が良いというのは一番の理由ですが、現在1400ダウンロードで未だに毎日数を伸ばしています。
・・・アニメでTV放映したりした漫画じゃないです。当時私のフォロワー数が300ぐらいで「どこまでもニッチなエロ漫画でこの数字を頂きました。
気を抜いてLORAを作っちゃだめということですね。
さて。では具体的にはどうするか?
もう相談もこの頃になるとAIくんノリノリです。
『仮の呼称としてパーソナリティLORAと呼びます』とか言い出す始末(笑) はい、タグを新たに作りましたが名付け親はGeminiです。
AIによると学習データーに必要な最低条件は『あらゆる角度の顔画像30枚』『詳細な高画質全身画像130枚』が目安。
だ、そうです。
・・・え?
AI : 『詳細な高画質全身画像130枚』
なんですと?
AI : 『全身の画像が詳細に細部までわかる画質のもの130枚です』
言い方の問題ではなくてですね。。。
『おまっ、簡単にいうてくれるけどなぁ・・・』
30分のアニメを見ていて、頭のてっぺんからつま先までの全身が映るシーンがいくつあるでしょう?
漫画一冊の単行本で全身が映るぶち抜きコマが何箇所あるでしょう?
一本のエロゲで全身画像はいくつあるでしょう?
いきなりですが、壁にぶち当たりました。
たしかにジャンルによって多いものもあるのですが。
例えばバイク漫画ですね。無機物の主役たるバイクの構造上、それにまたがる人間は全身が表示されることが比較的多いです。
ところが一般的な漫画やアニメの場合、全身が表示されることなんて稀です。
30分間でゼロ、一巻通しでゼロなんて珍しくもありません。
比較的全身画像の多いジャンルと言うと恋愛・ラブコメ要素、つまり女性キャラの魅力を全力でアピールする必要があるストーリーです。
数だけの問題ではありません。
仮に全身画像が100枚あっても、そのすべてに一貫性、安定性が求められていきます。
ビシッっと決まった立ち絵を狂いなく描ける、そしてその絵が魅力的。
もう参考にさせていただく漫画家さんが限られてくるのです。
はい。
漫画読みの方は何名か名前が頭をよぎったと思います。
私と同じ漫画家先生が浮かんだ方も多いのではないでしょうか。
私の場合、筆頭は桂正和先生です。
圧倒的画力で一時期少年ジャンプを牽引されていた先生で、影響をうけた漫画家さんも多くいらっしゃいます。
そして影響の与え方に『絵の力』といったすべてを包括するパワーがあります。
特にこの方の描く女の子の”ケツ”はお見事です。
ハッキリ言おう。
このLORAは、このケツのために生まれたのだ!!
さて。
桂正和先生がいくら高い画力で全身を描いてくださっていて、それがメインヒロインであっても130枚の立ち絵はどうやっても無理です。
予想以上に多かったのですが、それでも30枚。
この30枚から左右反転して問題のない画像をチョイス。これで60枚に増えましたがようやく折り返し地点が見えてきたにすぎません。
とはいえ現在60枚で、これを130枚に増やすのはそう無理な話でもありません。(詳しくはデータオーギュメンテーションでググってください)※この方法で無限に画像を増やしたりはできません。元が同じ画像は過学習の問題を同時に引き起こします。
手作業でチマチマやるしかないので、どっと疲れたのは事実ですが(笑)
学習に関わってくるのですが、今回、背景をできる限り明確にする必要があります。
というのは、タグと学習が極めて強固に紐づけされ記憶されるからです。
例えば背景にスクリーントーンで処理がされているとしますよね? マンガ表現として普通に、しかも頻繁に起こることです。
ここで130枚の全身画像に1枚、スクリーントーンのタグを忘れたとします。
普通のLORAでは少々忘れたところで別に問題にならないのですが、今回、つけ忘れが発生するとプロンプトで背景を指定しても(タグをつけ忘れたスクリーントーンが)出っぱなしになります。
何故かと申しますと『スクリーントーンのタグがないというのは、トーンが貼られているのが普通と学習したから』です。
AIにいわせると『あんたがそうしろって言ったからそうしたんだよ?』ですね。
そこで130枚の画像すべてをチェックして背景を白抜きしたものと、背景を詳細にタグ付けしたものを作りました。
要するに『詳細に抜けが発生しないレベルで背景にタグ付けしないと、それが普通だと(キャラクターとセットだと)学習しちゃうよ!』ってことです。 詳細にタグを付ける(名前をつける)事ができないなら、それは背景を白で塗りつぶして(白の背景)として学習するしかありません。
結果だけ報告すると、『二度としない・・・までは言わんがしばらくしたくない』程度には疲弊しました(笑)
『そもそもなんでそんなめんどくさいことを?』
というのは最もなんですが、深く体型を学習するためです。
一般化されることを排除して、すべてをLORAのトリガーに集約して覚えさせるとでもいいましょうか。
特徴を個性として全ふりし、それを普通より大きなタンクに全部ぶち込んだって感じです。吐き気を催す腐った歌の歌詞みたいですが、一般化すると無価値に陥る、一見つまらないことをかけがえのない価値として見出すといいまししょうか。。。
手っ取り早くパラメーターを。(学習データ155枚)
トレーニングの参考にご自由にお使いください。
1. Epochs 8
2. Num Repeats 3
3. Train Batch Size 1
4. Resolution 1024
5. Enable Bucket ON / 有効
6. Shuffle Tags ON / 有効
7. Keep Tokens 1
8. Clip Skip 2
9. Flip Augmentation OFF / 無効
10. Unet LR 0.00005
11. Text Encoder LR 0.00003
12. LR Scehduler Cosine
13. LR Scheduler Cycles 1
14. Min SNR Gamma 5
15. Network Dim 128
16. Network Alpha 64
17. Noise Offset 0.1
18. Optimiser AdamW8Bit
19. Optimizer Args (空欄)
目玉は、Network Dim: 128 です。
これのせいで容量がでかくなり、これのおかげで体型の記憶ができています。(と、思うw)他の設定はほぼほぼ、これを支えるためのもの。
注意点は、設定もさることながら、とにかくタグ付けがピーキーです。
どこで拾ったか、本lORAでも”タンブルウィード”を覚えてしまっています。(西部劇で道を転がっている草です)たまーに出てきます。
思い出していただきたいのは、電影少女にダンブルウィードなんて出てこないということです。学校の校庭をカラカラと転がっていたり、通学路で歩行者の邪魔になるほど大量発生していたり・・・そんなシーンはありません(笑)
つまりこういう事です。『155枚の画像で一枚、人間が見ても気が付かない情報が混じっていて、それをAIがダンブルウィードだと誤認して勝手に学習した』
金田くんに『ピーキー過ぎておまえにゃ無理だよ!』とおちょくられた気分です(笑)
追記するならもうひとつ。
モノクロデータ(カラーは制服を覚えるために彩色した5枚のみ)というのが良かったのではないか? というのが想像です。
・・・想像ばっかやなw
ということで、お胸にだけにクローズアップしても。
『AI生成界隈ではチッサイ胸』
『現実的には充分な大きさやろ』
という、ありもの体型ではない、”早川もえみ”の体型を手に入れたLORAが完成しました。
お楽しみ頂ければ幸い。
**"Final Note: An Important Announcement and Request"**
Lastly, I have a very important announcement and a request to make.
After creating 70 LoRAs, I feel compelled to share a thought that has been simmering in my mind for a long time. There is one major reason I decided to take such an extreme approach this time.
I completely respect your choice not to press the 'Like' button; that is your prerogative.
However, if this particular creation still doesn't bring you any enjoyment, I genuinely believe my LoRAs are simply not a good fit for you. When you don't enjoy it, I don't feel happy either.
The solution is simple: I believe we would both be happier if you stopped downloading my work.
Currently, I have 85 downloads and 22 likes (👍️).
I must conclude that the 63 silent users who have downloaded my work and offered zero reaction or feedback for over a day find that my LoRAs are not suitable for them. This continuous silence is the single biggest drain on my motivation.
It’s strange that the creator is the one forced to deal with this dissatisfaction. While I wish there was a feature to block users who consistently offer no engagement after repeated downloads, such a feature doesn't exist.
As this is a hobby for me, my motivation suffers greatly. Ultimately, this lack of engagement could lead me to step away from my hobby entirely.
Therefore, to those who consistently download my creations while offering no reaction whatsoever, please do not download my work. I kindly ask for your understanding.
最****後になりますが。重要な発表とお願いです。
70個のLORAを作ってきて、ずっと燻っていた考えを書かせていただきます。
今回極端なことをしたのには、ひとつだけ大きな理由もあります。
これで楽しんで頂け無かったら、私のLORAはあなたには合わないと思います。
あなたは楽しめない。わたしも嬉しくない。
答えはひとつで、もうダウンロードされない方がお互い幸せだと思います。
現在ダウンロード数85件。 👍️が22件。
無反応の63人の方で一日以上放置されている方は私のLORAが合わないということでしょう。イイネを押す、押さないはあなたの意志ですし、実際どうでもいいのです。 無反応というのがモチベーションに一番影響が出ます。
私だけの問題ではなく、全ての人に対して一定回数反応が無い人をブロックできる機能があればいいのですが、そういう機能はありません。
作り手が不満を強いられるというのも変な話です。
私も趣味でやってますのでモチベーションが下がります。
最終的には趣味から離れる原因になると思いますので、日常的に無反応を貫いている方はダウンロードしないでください。お願いします。
The "1girl" tag is unnecessary for general use.
汎用性を高める"1girl"タグは不要です
トリガー : h_m0em1,hay4k4w4
基本(ほぼ不要) : Black hair, dark brown eyes, Bangs, medium-long hair,
制服 : kanda1_uniform,red tie, skirt, Short sleeves, white socks, loafers
必要に応じて体型タグ : Specific body proportions, Unique posture,Narrow shoulders,Tight buttocks,Slim figure,Small but ample breasts,Attract a man
※トリガーワードに体型比率を集約させていますので、 1girl タグは基本不要です。むしろ使わない方が良い結果が出力されることが多いです。とはいえ無意識に使っちゃいますよね・・・。意識して抜いてください。
ネガティブに1girl をいれ「汎用的な(1girl要素)の排除」が有効になることも多いです。私自身手探りなので、お気付きの点があれば教えて下さい。
※意外なほど体型タグが仕事をしています。明確に不要でない限り(プロンプトのはじめの方に)(全部のせ)が一番再現に力を発揮します。
"We have integrated the body proportions directly into the trigger words, so the 1girl tag is generally unnecessary. In fact, you will often get better results without using it. We know it's easy to use it unconsciously... Please make an effort to leave it out."
"Putting 1girl in the negative prompt can often be effective for 'excluding generic 1girl elements.' I'm still exploring the optimal use myself, so please let me know if you notice anything useful."
"※The body-related tags are surprisingly effective. Unless explicitly unnecessary, applying 'all-in' (including all body tags) near the beginning of the prompt yields the best reproduction power."











