週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

画像生成AI「Stable Diffusion」を爆速化。秒単位で美少女を生成できるLCM系ツールを使い比べた

2023年12月13日 09時00分更新

本命の「LCM LoRA」を試す

 次に、LCMをLoRA(追加学習モデル)化した「LCM_Lora」を試してみよう。

 まずは比較のため、SDXLで通常どおり生成する。解像度は1024x1024、Step数は30、CFG Scaleは7だ。

 23秒(RTX4070 12GB)で生成された。

 続いては下準備だ。LCMには「LCM Sampler」という専用のSamplerが用意されている。拡張機能「sd-webui-animatediff」をインストールすると追加されるので、事前に入れておこう。GitHubのレポジトリは以下だ。(インストール方法は前ページを参照)

https://github.com/continue-revolution/sd-webui-animatediff

 次に、LCM LoraをDLしよう。Huggingfaceの「lcm-lora-sdxl」のページにアクセスする。

「↓」でダウンロード

 「pytorch_lora_weights.safetensors」のダウンロードアイコン(↓)をクリックしてダウンロード。保存先はいつものように「\stable-diffusion-webui\models\Lora」以下だ。

 

 準備が終わったらさっそく生成してみる。モデルはSDXL、解像度は1024x1024、Step数は8、CFG Scaleは2だ。

プロンプト:1 girl, <lora:pytorch_lora_weights:1>

 プロンプトはいつもの「1 girl」にLoraを呼び出すプロンプトを追加したもの。

 生成にかかった時間は4.3秒!!クオリティーもそこまで低くない。

通常の生成画像との比較

 2枚を比較してみると、さすがにLCM-Loraを使った方は書き込みが少ないが、そのぶん5倍近く早く生成できる。

 1度に16枚生成しても所要時間は1分9秒しかかからなかった。ただし、明らかに失敗している画像も散見された。

Step数1〜8の比較

 推奨Step数は8だが、Step4、5くらいまではまともな絵が出ている。当然Step数を減らすとさらに高速化できる。

CFG Scale比較

 CFG Scaleも推奨は2だが、1にしても画質的には問題はなかった。

 ちなみに、タスクマネージャーを見てみると、かなりビデオメモリーを使用しているようだ。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事