週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

画像生成AIの激変は序の口に過ぎない

2022年12月02日 16時00分更新

 画像生成AI「Stable Diffusion」がコンテンツ製作の技術革新を急速に促しているという話を「すさまじい勢いで世界を変えている画像生成AI」に書きました。あれから約2ヵ月が経ち、状況はさらに大きく変わってきています。

Novel AIソースコード流出事件

 最も影響が大きかったのは10月8日に起きたとされる「Novel AI」のソースコード流出事件です。どういった形でハッキングされたのかは明らかにされていませんが、流出したとされるコードはおそらく本物だという結論になっています。

 Novel AIは10月3日にサービスが開始された画像生成AIサービス。Stable Diffusionや「Midjourney」と比べても圧倒的に高品質な日本アニメ風の画像出力ができることにより、日本やアジア圏で高い人気を得ています。

 Googleトレンドの傾向を見てみても、日本ではNovelAIがリリース後にトレンドのトップを維持しており、海外と比較しても人気の高さが伺えます。NovelAIは月額課金モデルで展開されており、最低設定で10ドルですが、25ドルのプランであれば、作成できるサイズに制限はあるものの、いくらでも画像を生成することができます。

日本のトレンド。青線がNovelAI。他のサービスよりも常にトレンドの上位にいる

全世界の傾向。MidjourneyやStable Diffusionの方が関心が高い

 ところが、リーク版Novel AIは現在ネット上で共有されていて、Stable Diffusionにデータセットのモデルとして読み込ませることができてしまいます。つまり無料で使うことができてしまうのです。もちろん、盗難されたデータということで、違法性の高いデータです。しかし、ネット上で共有され、一気に広がってしまったため、もはやその流通を止めることは事実上不可能になってしまいました。

 Novel AIもStable Diffusionをベースに拡張開発されたものですが、ソースコードの流出により、どうやって品質の高い画像を生み出しているのかが明らかになりました。その中で画像を生成するための「プロンプト」と呼ばれるコマンドの研究がアジア圏で進み、10月中旬には「元素法典 第1巻」と呼ばれるプロンプト事典が公開されました。

公開されている「元素法典」。「正面tag」はプロンプト、「反面tag」はネガティブプロンプトのこと

 「元素法典」は、日本の利用者にも大きな驚きを持って受け止められました。

 Novel AIでは、これまでアニメ風の絵柄は出せるものの、絵画風の複雑な絵柄は作りにくいと考えられていたからです。しかし元素法典の中では、複雑で繊細な絵が作れるプロンプトも提案されていたんですね。

 ただ、これがリーク版Novel AIで作られたプロンプトがかなり混じっているのは間違いありません。なぜかといえば、製品版のNovel AIにそのまま打ち込んでも完全に絵が出てこないというのが1つです。製品版Novel AIとリーク版Novel AIには微妙に違いがあるようで、同じプロンプトでも似たような絵は出ても、完全に同じ絵は出ません。さらに製品版のNovel AIにはプロンプトの文字数に225字の上限があるんですが、元素法典には上限をはるかに超える長文のプロンプトが含まれている手法も紹介されている中にはあるというのがもうひとつです。

 現在、ローカル環境でStable Diffusionを動作させるアプリとして最も普及しているのは、AUTOMATIC1111さんが公開しているStable Diffusion web UIだと思われます。アプリにはプロンプト数の制限をなくしたバージョンがあり、リーク版Novel AIはそこでも動作するため、その環境で開発されたものではないかと推察できるんですね。

 元素法典は、これまでのプロンプト以外にも、何を描いてほしくないかを指定する「ネガティブプロンプト」の有効性の発見にもつながり、劇的に画像生成AIの複雑な絵の作成に道を開くことになりました。現在では「元素法典 第2巻」もリリースされ、さらなる研究が進んでいます。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう