AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AI「Emi(Ethereal master of illustration)」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。
「Stable Diffusion XL(SDXL)」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。
なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。
モデルをダウンロードして指定フォルダーに入れるだけ
まずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待とう。
ダウンロードしたファイルは「Fooocus」フォルダー内の「\models\checkpoints」にコピーしておこう。準備はたったのこれだけだ。さっそく「Fooocus」を起動しよう。
起動したら画面左下にある「Advanced」にチェックを入れる。
右側に各種パラメーターが表示されるので「Advanced」タブにある「SDXL Base Model」プルダウンメニューから先程コピーした「emi_stable.safetensors」を選択。リファイナーは用意されていないようなのでSDXLのものを使用する。
「Style」タブでは生成される画像のスタイルを指定できるが、まずはEmi単体の実力を見たいため、すべてのチェックを外しておこう。
設定が終わったら、さっそくプロンプト欄にいつもの呪文「1 girl」を入れてGenerateだ。
うーん、実写系だなあ、、。
ということでEmiのModel Card(モデルについての説明が書かれているページ)を熟読すると、「モデルの出力向上について」の項にたくさんのアドバイスが書かれていた。
「確実にアニメ調のイラストを出したいときは、anime artwork, anime styleとプロンプトの先頭に入れてください」
ということで、まずは上記を参考にプロンプトを改造。
おお!!ばっちりアニメ絵になった。
「プロンプトにtransparentという言葉を入れると、より最近の画風になります。」
とのことなので、それも追加。
うん、よくなった気がする。
「ネガティブプロンプトにTextual Inversionを使用することをおすすめします。」
「Textual Inversion」は、モデルに対して追加の学習結果を適用できるStable Diffusionの機能。こちらの指示に従い、「unaestheticXL」というTextual Inversionを導入した。
ファイルのインストール先は「Fooocus」フォルダー内の「\models\embeddings」だ。
もちろん完璧ではないが、かなり完成度が上がってきたのではないだろうか。
多少輪郭や指先が怪しいのはご愛嬌、これをベースに細かく修正をかけていけばいいだろう。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります