「YOASOBIの歌の作り方」解説動画も
RVCが公開された後、音声の学習データのやりとりも非常に活発にされているようです。音声AIについての情報を交換するDiscordの「AI Hub」では登録ユーザーは約40万人に達しています。そこには政治家から俳優、声優、シンガーなどの様々な個別に学習したRVCデータのリンク情報が公開されています。
最近、これをさらに進めたような動画も出てきました。7月28日にYouTubeに人気音楽ユニットのYOASOBI風の楽曲の作り方を解説する動画が投稿されました。作成者は海外の方のようです。動画ではYOASOBIの楽曲を分析し、打ち込みで“それっぽい”楽曲を制作。さらに、メインメロディを作った後、楽曲に合うように“それっぽい”日本語の歌詞をChatGPTに作ってもらい、それをボーカロイドを当てはめて歌わせています。
そして、AI Hubで得た情報を元に、ボーカロイドが歌っていた部分をRVCに学習させたYOASOBI風の音声に変更。すると、恐ろしいほどに“YOASOBIっぽい”曲ができてしまうというものです。実際、曲も良くできているので、何も知らずに聴くとYOASOBIの曲と勘違いする人は出ると考えられます。
再生回数は23万再生を超えていますが、動画はメイキング動画であり、単体の曲として配信されていないので、公式動画ではないことは一目瞭然です。しかし、曲の魅力を引き上げているのはYOASOBIの学習データであることは明らかなため、権利的にグレーではないかという印象を受けてしまいます。
日本でも、8月15日からは「AI釈迦」というタイトルで有名な楽曲を歌っている動画が次々に公開され、X(Twitter)上でトレンドになりました。
これは、人気ストリーマーのSHAKAさんの音声から学習したと思われるAIを使って、楽曲を歌わせたもの。作成者は「すべての動画はAI生成によって作られています。実際の人の歌唱ではありません」と説明を付けてますが、非常に自然な出来で、本人が歌っているのではないかと間違えそうになってしまう品質のものです(例:「AIに『インフェルノ』歌わせた様子」)。
技術的なハードルが一気に下がったこともあり、学習させたAIに楽曲を歌わせる「AIカバー」は日本でも人気を集めつつあり、多数のアップロードされた動画を見ることができるようになってきています。まだ、お遊びの延長線上のような段階ですが、より高度化していく姿は容易に想像が付きます。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります