Stable Diffusion入門 from Thailand

第6回

画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた

2023年12月13日 09時00分更新

文● 田口和裕

本命の「LCM LoRA」を試す

　次に、LCMをLoRA（追加学習モデル）化した「LCM_Lora」を試してみよう。

　まずは比較のため、SDXLで通常どおり生成する。解像度は1024x1024、Step数は30、CFG Scaleは7だ。

　23秒（RTX4070 12GB）で生成された。

　続いては下準備だ。LCMには「LCM Sampler」という専用のSamplerが用意されている。拡張機能「sd-webui-animatediff」をインストールすると追加されるので、事前に入れておこう。GitHubのレポジトリは以下だ。（インストール方法は前ページを参照）

https://github.com/continue-revolution/sd-webui-animatediff

　次に、LCM LoraをDLしよう。Huggingfaceの「lcm-lora-sdxl」のページにアクセスする。

「↓」でダウンロード

　「pytorch_lora_weights.safetensors」のダウンロードアイコン（↓）をクリックしてダウンロード。保存先はいつものように「\stable-diffusion-webui\models\Lora」以下だ。

　

　準備が終わったらさっそく生成してみる。モデルはSDXL、解像度は1024x1024、Step数は8、CFG Scaleは2だ。

プロンプト：1 girl, <lora:pytorch_lora_weights:1>

　プロンプトはいつもの「1 girl」にLoraを呼び出すプロンプトを追加したもの。

　生成にかかった時間は4.3秒！！クオリティーもそこまで低くない。

通常の生成画像との比較

　2枚を比較してみると、さすがにLCM-Loraを使った方は書き込みが少ないが、そのぶん5倍近く早く生成できる。

　1度に16枚生成しても所要時間は1分9秒しかかからなかった。ただし、明らかに失敗している画像も散見された。

Step数1〜8の比較

　推奨Step数は8だが、Step4、5くらいまではまともな絵が出ている。当然Step数を減らすとさらに高速化できる。

CFG Scale比較

　CFG Scaleも推奨は2だが、1にしても画質的には問題はなかった。

　ちなみに、タスクマネージャーを見てみると、かなりビデオメモリーを使用しているようだ。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

Follow @weeklyascii

カテゴリートップへ

この連載の記事

この連載の一覧へ

Tweets by weeklyascii