Otome TEST LORA

詳細

ファイルをダウンロード

モデル説明

LORAはCivitaiでのみ公開しています

TEST LORA

申し訳ありません。英語に翻訳しないのは、微妙なニュアンスや翻訳ミスに気づけないためです。また、英語が母語でない方が多くいらっしゃるため、日本語から翻訳をご希望の方にはそちらで対応していただきたいと考えています。

このLORAはあくまでテストです。テスト結果に興味がある方はどうぞ。

今後のLORA作成のため、学習画像が極端に多い場合のテストです。

手探りでLORAを作っていますが、断片情報で『学習画像は多い方が良い』『画像サイズは統一するのが良い』というのが以前より気になっていました。

そこで一度LORAを作成し、そのLORAを使用して1344✕768のサイズ統一画像800枚を作成し学習しました。またテストの一環として背景あり画像が8割程度しめています。
しかしながら、そもそもの比較、”背景なしの800枚”や”サイズを統一しない800枚”などもありませんし、1024✕1024でのテストもしていません。あくまで感覚的なテストですので過度な期待はしないでください。

好きでもないキャラで一からLORAを作ってテストするのは辛いので、大好きなキャラとして【オトメドリから桜木乙女】を選択しています。

桜木乙女は先人が大変すぐれたLORAをIllustriousで作ってらっしゃいます。大変すばらしいLORAで私も何枚か投稿画像を作成していす。

桜木乙女LORAをお求めの方は、/model/1121521 こちらをどうぞ。

このLORAはあくまでテストです。テスト結果に興味がある方はどうぞ。

結果所感:第一段階のLORAで公開できるレベルでした。今回はその作成したLORAを使用し、統一画像多学習のテストです。一番期待したのは「よろしくない部分の平均化」です。
で、正直あんまり変わりません。確かに良くなっていると感じますが、劇的ではない。「細部まで十二分に比較したか?」といわれると、時間的にもまだまだ不十分ではあります。が、パッと見では「髪の質感」「学習した服」「ムチムチ感」に関してはなかなか良いと思います。
不十分な情報ではありますが、8種ほど毛色の異なるチェックポイントでテストしたところ「あなた誰?」みたいな画像は吐いていませんので、今のところ最大の恩恵なのかな?と考えています。あと、これはテスト前から経験則で感じていたことですが安定感でしょうか。様々なポーズや表情で結構ねばります。

私のGPUは生成とは別目的で選定したIntelのARC770 16GBという微妙な代物なのですが、そんなに速くないので元画像800枚を作る時間コストに見合うものか? と問われると否です。

すっごい気に入ってるキャラの最高LORAを求める、出来ることは全てやる! というならアリという感じ。

つまり私にとって乙女ちゃんは大好きなキャラなので後悔はしていない!です(笑) 

テストの目的ですが、もうひとつ。現在ローカルでのLORA作成はしていません。GPUの占有時間が長く、その間は仕事を(広義で食品に関する自営ですが、PCを非常によく使います。数台のサブもありますがそれはそれで稼働しているので)圧迫しますのでCivitaiで生成する方が都合がよいのです。
なに? 「仕事とプライベートをわけろ?」 そのとおりです!
でも自営で分けてるような管理のしっかりした方は、とっくに会社になってます。財布まで一緒ってのが自営業の自営たる所以でして。。。

閑話休題。

そこで浮かび上がるのがBuzzコストです。「一発で完成させれば良い」というのは重々承知しているのですが、元ネタがアニメならばともかく、個人的にかなりアニメの好みが偏っています。早い話があんまり知らない。知らないから好きになりようがなく、好きじゃないものは作れないw という状態です。 元ネタが漫画かラノベの挿絵という状態です。
また「原作を読んでいる(漫画・ノベル問わず)」というケースについては、どうしても元データの大半が白黒という場合がとても多い・・・と、申しますか、そればっかりです(汗)

必然、一発で成功というのはなく「カラーのイメージが異なる」となる場合が多くなります。(一枚でもカラーがあればおおよそ大丈夫なのですが) で、カラーを例にしましたが漫画は全身画像だとか、後ろ姿、座り姿(ここまでいくとアニメも一緒ですね)が存在しないことも珍しくなく、どうしても「スタイルに違和感」がでてしまうことがあります。
そうすると、ひとつのLORAを調整しつつ2ラウンド、3ラウンドと繰り返すことになります。(ええ、わかってるんですよ。手間かけすぎなのは)
結果、Buzzがいくらあっても足りねぇ! ^^;

3ラウンドで(最小)1500Buzzです。・・・たいがい最小で決着つきませんが。
だったらなんとか2ラウンドで! と思い、それも今回のテストの動機です。
ちなみに今回(初回生成500Buzz)
初回を元にプロンプトをいじって調整。プロンプトで調整できないものはフォトショップ調整。それらDATAで約800枚。(2ラウンド目、800枚のDATAからLORA生成代金は1000Buzzほど)でした。・・・意外と安いな、オイ。
まぁBuzzについては2ラウンドで決着ついたので良かったと思います。
800枚生成はワイルドカードを使い、ほったらかしで生成してますので、同じほったらかしでもLORA作成より多少手間がはぶけます。
びみょーに今回の方が良い・・・かも? ぐらいですね。タグの編集時間までいれると多大なる恩恵です。枚数が多くなりますがワイルドカードでパターン化もされます。

皆さんが作った画像『こんなことになったぞ?』や『ええやん!』などなど、ジャンルも結果も問いませんので参考のために協力していただければ大変ありがたいです。(ご自身のために新規約にはご注意ください。オムツつけてるとか酩酊、銃を突きつける、催眠など同意のない行為画像は完全禁止のようです)
ちなみに表紙っつーか、LORAのサムネになっている画像で”R”です。スポーツマンが爽やかに運動後の水分補給をしている・・・というのは通用しませんでした(笑) エロいぞ!けしからん!、ということらしいですw
忌憚ないご意見をお待ちしておりますのでよろしくお願い致します。

テストのコーナー

ひょっとしたら役に立つかも?と思い、新規約、つまりはclavataのチェック傾向のテストを兼ねてます。大したことはしてませんが、何もしないよりはマシだと思いますので参考までに。

お気づきだと思いますが画像テーマは全てスポーツです。ですので本来はSFW、健全なものであるはずです。以下(画像:レイティング)として記入します。

1.(水分補給:R)
これはプロンプトがマズかったかも?という気がします。運動後の一息、恍惚感を出すために”in heat”を使用したのが原因かも?

2.(ヨガ:R)
現実に女性がヨガをするときの服装を参照したのですが”R”でした。ヨガが「成人向けのテーマや状況」??? いうまでもなく一般的にヨガは健全なものという認識だと思います。解せぬ。

3.(ボクシング:PG)
画像の別名はデンプシーロールです(笑)スポーツでも暴力的要素が存在しますので、そのテストを兼ねてます。結果はSFWですが、グローブでオッパイが隠れているからかも?

4.(サーフィン:R)
女性サーファーの極一般的なスタイルですが不健全らしいです。これは単純で前時代的判断方法ですが、肌色の専有面積が関係するのか? という気がしてきました。AIの仕事である必要性が薄れますし、そうでないことを祈りたいです。

5.(ロングレンジシューティング:PG)
肌色が少ない、でも銃を使用する故に暴力的に見える人が存在すると想定されるスポーツ、射撃です。狙いを定めるどころか、銃を構えていない画像ですのでSFWです。AIがヒステリックでなくてちょっと安心しました。余談ですがクレー射撃にしようとしたところ(日本では散弾銃所持から10年経過後ライフル銃の所持申請ができるため最低でも28歳ということになります。乙女ちゃんは28歳には見えんだろ、ってことです)上下二連の散弾銃が生成不可能だったため断念しました。それどころか水平二連も不可。ポンプやガスオートでも競技はできますが、弾丸装填の有無が遠方から判別しにくいので、あまり好まれません。地域によっては嫌われるらしいです。散弾銃LORAを作りたくなった。。。

6.(テニス:R)
乳か! 乳が原因なのか!? やっぱり肌色占有面積なのかもしれません。ガックリ。

7.(バスケットボール:PG)
乳が原因ではない、だと? あ! 乳がバスケットボールに見えたのか! 
AIには「おっぱい3つ? そういう人類がいるのかも。差別になったら大変」ってことかもしれません。やるなぁAI。 トータル・リコールのミュータントみてぇやん。 ポール・バーホーベンもびっくりやん(笑)
肌色専有面積説が信憑性を増してきました。。人間の目だと健康的なエロなんだけどなぁ。アメリカ企業なのでバスケットボールには寛大なのかもしれません。ポロとかだと、けしからん! って怒られるのかも(笑)

8.(ボート:PG13)
はい? PG13:「露出の高い服」 ってなんで?? 短パンは駄目だと??
やっぱり肌色? 金粉ショーなら全裸でもSFWになるのだろうか??

9.(スカイダイビング:PG)
納得のSFWです。「登場人物本人が危険を担保する限り、当局はその行動に一切感知しないものとする」ってところでしょうか。

10.(乗馬。仔馬の鞍ならし:PG)
計算ではなく偶然の産物なのですが個人的にお気に入りの画像です。元は普通に乗馬させようとしたんですが、どのチェックポイントも微妙に馬のサイズが小さかったのです。生成枚数を重ねたところ、いい画像を吐きました。仔馬というにはデカいんですが、何らかの原因で仕込みが遅くなったのでしょう、ということですね。馬に鞍をつけて「ほらイッチ、ニ、イッチ、二。怖くないよ。上手だね。かしこいね」と並走している図です。こういう作業は女性がうまい! 女性のパワーを強く感じる時でもあります。
馬が褐色の肌色(に、見えなくもない色)ですが、流石に馬と人の判別はしているのでしょう。単純な肌色専有面積でもない、みたいで安心しました。

このモデルで生成された画像

画像が見つかりません。