Stable-Diffusion v1.5 は、Huggingface Diffusers train_text_to_image スクリプト を用いて 10k ステップで微調整され、Norod78/microsoft-fluentui-emoji-512-whitebg を基にしています
Microsoft Fluent-Emoji を学習対象とした。これは「Microsoftから提供される、親しみやすく、フレンドリーで現代的な絵文字のコレクション」と説明されている。
絵文字のファイル名をテキスト説明に変換した。これにより、モデルは「flat」、「high contrast」、「color」といったいくつかの特別な単語を学習するようになった。