これは便利!「Stable Diffusion」が超簡単に始められる「Stability Matrix」
新UI「Inference」も搭載。もうこれでいいじゃん(笑)
さて、このツールにはもう一つ特筆すべき機能が用意されている。左側「Inference」をクリックすることで表示される「Inference」と呼ばれる新たなUIだ。
画面は大きく4つのエリアに別れており、左側にモデルやサンプラー、サイズといった設定項目、その右側にプロンプト(ポジティブ/ネガティブ)、その右に生成画像、一番右が画像ブラウザーになっている。
シンプルを追求したFooocusよりは多機能だが、WebUI系に比べるとかなり限定された機能に絞られている印象だ。
何よりバックエンドに「ComfyUI」を利用しているらしく生成速度が速い。新しいモデルの確認や、単純なt2iならこれで十分に感じた。
モデルセレクターにサムネイル画像が付くだけでもかなり新鮮だ。
「Model Browser」ではおなじみ「CivitAI」「Hugging Face」から直接モデルを検索・閲覧・インストールまでできる。
複数バージョンがあったり、専用のVAEが用意されている場合も問題ない。
Hugging Faceからダウンロードできるのは、「Stable Video Diffusion」といった基礎モデルや「ControlNet」「IP Adapter」関連のモデルだ。
生成した画像を保存する「OUTPUT」フォルダーは、それぞれのPackageごとに用意されているが、共有画像フォルダーで一括管理もできる。
なんて簡単にStable Diffusionが使えるんだ!
以上、簡単に見てきたが、これまでインストールや環境構築の難しさに悩まされてきた身としては「なんて簡単にStable Diffusionが利用できるんだ!」と感動してしまった。
もちろん「昔はよかった」などと言うつもりは毛頭ない。ツールを使うハードルは低ければ低いほどいい。
DALL-Eをはじめ、無料で使える画像生成AIも増えてきたが、やはりローカル生成の自由度は代えがたい。これまで難しさに躊躇してきた人も、Stability Matrixなら恐らく大丈夫だろう。果てしないローカルAI画像生成の世界に一歩踏み出してみるのはどうだろうか。
田口和裕(たぐちかずひろ)
1969年生まれ。ウェブサイト制作会社から2003年に独立。雑誌、書籍、ウェブサイト等を中心に、ソーシャルメディア、クラウドサービス、スマートフォンなどのコンシューマー向け記事や、企業向けアプリケーションの導入事例といったエンタープライズ系記事など、IT全般を対象に幅広く執筆。2019年にはタイのチェンマイに本格移住。
新刊:発売中「生成AI推し技大全 ChatGPT+主要AI 活用アイデア100選」、:https://amzn.to/3HlrZWa
週刊アスキーの最新情報を購読しよう