週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた

2023年12月13日 09時00分更新

本命の「LCM LoRA」を試す

 次に、LCMをLoRA(追加学習モデル)化した「LCM_Lora」を試してみよう。

 まずは比較のため、SDXLで通常どおり生成する。解像度は1024x1024、Step数は30、CFG Scaleは7だ。

 23秒(RTX4070 12GB)で生成された。

 続いては下準備だ。LCMには「LCM Sampler」という専用のSamplerが用意されている。拡張機能「sd-webui-animatediff」をインストールすると追加されるので、事前に入れておこう。GitHubのレポジトリは以下だ。(インストール方法は前ページを参照)

https://github.com/continue-revolution/sd-webui-animatediff

 次に、LCM LoraをDLしよう。Huggingfaceの「lcm-lora-sdxl」のページにアクセスする。

「↓」でダウンロード

 「pytorch_lora_weights.safetensors」のダウンロードアイコン(↓)をクリックしてダウンロード。保存先はいつものように「\stable-diffusion-webui\models\Lora」以下だ。

 

 準備が終わったらさっそく生成してみる。モデルはSDXL、解像度は1024x1024、Step数は8、CFG Scaleは2だ。

プロンプト:1 girl, <lora:pytorch_lora_weights:1>

 プロンプトはいつもの「1 girl」にLoraを呼び出すプロンプトを追加したもの。

 生成にかかった時間は4.3秒!!クオリティーもそこまで低くない。

通常の生成画像との比較

 2枚を比較してみると、さすがにLCM-Loraを使った方は書き込みが少ないが、そのぶん5倍近く早く生成できる。

 1度に16枚生成しても所要時間は1分9秒しかかからなかった。ただし、明らかに失敗している画像も散見された。

Step数1〜8の比較

 推奨Step数は8だが、Step4、5くらいまではまともな絵が出ている。当然Step数を減らすとさらに高速化できる。

CFG Scale比較

 CFG Scaleも推奨は2だが、1にしても画質的には問題はなかった。

 ちなみに、タスクマネージャーを見てみると、かなりビデオメモリーを使用しているようだ。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

この連載の記事