NoMaps 2019レポート:VOCALOIDを開発した2人がそのすべてを語る
初音ミクが創造した「誰でもクリエイター」文化のある世界
2007年に発売され、爆発的な大ヒットとなった「初音ミク」。VOCALOIDという歌声合成ソフトと少女の声を収録した音声ライブラリをパッケージし、それにバーチャルシンガーのキャラクターを持たせた。自然な歌声だけでなく、魅力的なキャラクターがニコニコ動画やYouTubeの普及とともに若者を中心に受け入れられ、音楽のみならずゲームや漫画、アニメなど活躍の場が急速に拡大。ニコニコ動画における「初音ミク」タグのついた動画は23万本、「VOCALOID」タグのついた動画は52万本を超えるなど、プロの作曲家・音楽家ではない一般の音楽愛好家が自作のコンテンツを創作・公開するCGM(Consumer Generated Media:消費者生成メディア)文化の発展に多大なる貢献を果たすこととなった。
特に若者における高い知名度により、トヨタ、Google、SONY、ユニリーバ・ジャパンや江崎グリコといった国内外の大企業がプロモーションやTVCMに起用するなど、単なる一過性のブーム以上の存在、日本のポップカルチャーの一翼を担う存在となっている。
そのVOCALOIDの開発をリードしているヤマハ株式会社 電子楽器開発部 ソリューション開発グループの吉田雅史氏と、クリプトン・フューチャー・メディア株式会社 初音ミク歌声合成関連プロジェクト・プロデューサーの佐々木渉氏という、VOCALOIDの裏の裏まで知り尽くした2氏がVOCALOID文化の魅力とその成長のすべてを語ったNoMaps2019のセッションをレポートする。
生みの親が語るVOCALOIDの魅力
初音ミクは様々なクリエイターによって創作活動が続けられていると同時に、フィギュアやゲームキャラクターなどに採用されている。ユーザーごとに感じる魅力は異なると思うが、その開発を行なっている2氏にとって、VOCALOIDの魅力とはどこにあるのだろうか。
ヤマハという楽器の製造・販売を行なっている企業の社員である吉田氏は、「楽器のように自由に歌を歌わせることができるということが魅力だと思っています」と言う。「(VOCALOIDは)電子楽器だと思っていますので、人間のように歌わせることもできれば、逆に人間とは全然違う歌わせ方もできる。そういった非常に幅広いことができるというのが魅力かなと思います」(吉田氏)。
一方、VOCALOIDというソフトに初音ミクという命を吹き込んだ佐々木氏からはこういう答えが返ってきた。
「(開発側は)作曲者の想いみたいなものに干渉したり妨げたりするアプローチを一切していない。曲を作る方の想いとか気持ちといったものをダイレクトに反映させられるツールとして、すごくデジタルで機械的なものなのですけど、だからこそピュアだという部分がボカロの魅力として一番大きかったのではないかと思います」(佐々木氏)。
「非常に繊細で、歌詞の非常に細かいディテールによく気づくリスナーが最近増えた。リアリティのある表裏のない言葉であったり、伝わりやすい言葉であったりが曲を作った人からダイレクトに飛んでくるというのが受け止めやすかったし、面白かったというところが多かったのではないか」(佐々木氏)。
初音ミクなどのバーチャルキャラクターは人間と違って経済的な利益を求めない。ビジネスとしての音楽からは、好むと好まざるとにかかわらず、そういう意図を排除することができない。VOCALOIDの歌う楽曲は、そのようなよくある意図と無関係に言葉が伝わってくる感覚が、ユーザーの心にストンと落ちたのではないかというのが佐々木氏の見解だ。
インターネットの歌姫:初音ミクの誕生
VOCALOIDの開発は2000年から始まった。吉田氏は当時ヤマハに所属しておらず、社外から音声ライブラリのレコーディングなどに携わっていた。ヤマハに入社したのは2008年であり、その時にはすでに初音ミクが一大ブームを巻き起こしていた。
「今なら自分の曲にボーカルをつけたいというときには選択肢として人間に歌ってもらう、VOCALOIDのような合成音声を使う、サンプリング素材を持ってきて加工して使うなどいろいろな選択肢がある。しかし当時の社内は歌える人が歌えばいいんじゃないかという考え方が強かった。そんな時代に、ニコニコ動画という動画投稿サイトと一緒に、特に秋葉原とかサブカルチャー、アニメカルチャー、オタクカルチャーの方々にインターネットを通じて支持してもらって、その流れを変えていくきっかけが初音ミクだった」(佐々木氏)。
VOCALOIDで使用する音声ライブラリのレコーディングは3時間から6時間程度のスタジオ収録が必要になる(日本語の場合)。これには佐々木氏らいわく「音素片」という音のかけらの収録のためのスクリプトを使用するが、初期のものは意味のない「呪文」のようなもので、発声者にとっても開発者にとっても退屈この上ない作業となる。「ひどいときは私とアシスタントエンジニアしか起きていないときもあった」(吉田氏)。
この状況を改良し、もっと意味のある言葉を使って収録できるようにした成果として、2010年に「VY1」というヤマハ初の音声ライブラリが発売されている。
歌声合成エンジンにも改良が加えられ、2011年に日本語と英語以外に中国語、韓国語、スペイン語にも対応したVOCALOID3が発売された。2015年にVOCALOID4、2018年にVOCALOID5がリリースされ、「表現力の向上、合成音の品質の向上を達成した」(吉田氏)。特にVOCALOID5では音楽制作の作業スタイルを調査しなおし、それに合わせて大幅にUIを変更するとともに、他の音楽制作ソフトとの連携も強化し、大幅に操作性を向上させた。
これと並行して、PC以外のプラットフォームでもVOCALOID技術の利用を進めた。例えばボカロネットというサービスは、クラウド上にサーバーを置き、ブラウザからそこに歌詞を送るだけで、曲が付き、歌声と伴奏が付いた楽曲を自動生成してくれるサービスである(現在は提供終了)。また、VOCALOIDエンジンを内蔵したショルダーキーボードで、歌詞を入力することによってキーボード操作でリアルタイムにVOCALOIDに歌わせることができるVKB-100も開発された。
2020年からは小学校で、2021年からは中学校でプログラム教育が必修化される。大学入試の共通テストでもプログラミングが取り入れられる。「ボーカロイド教育版」は、試行錯誤しながら楽しく歌作りが楽しめるソフトで、プログラミングでも重要な論理的思考も育てるデジタル音楽教材として導入する学校現場も増えている。「現在、前に進む、右に曲がるといったコマンドを用意して四角をつくるといった教材はあるが、音楽ではそういうものはない。(ボーカロイド教育版を使えば)楽しく音楽を勉強しながら、論理的な思考も養える」(吉田氏)。
続いて、初音ミクを生んだ佐々木氏から、初音ミク、鏡音リン・レン、巡音ルカと続く「キャラクター・ボーカル・シリーズ」の開発秘話が語られた。
「もともとあまり(細かい)設定などはなかった。パッケージのイラストがあって、年齢と身長と体重があるだけ。(イラストも)最初は普通の女子高生の格好をしていたが、DX-7というヤマハのシンセサイザーのカラーリングとか、イメージをKEIさんの方に指定させてもらって、こういうかたちになった」(佐々木氏)。
初音ミクは10万本以上売れた。当時、アコースティックギターでアルペジオを鳴らすソフトや、ドラマーの代わりに演奏をするようなソフトの販売が数千本程度だったことを鑑みると、驚異的な数だ。
一方で、佐々木氏たちの悩みは、初音ミクの次をどうするかだったという。「初音ミクが売れたのはいいが、そのあとのソフトを出した時のインパクトをどう出したらいいんだろうと悩んだ。ミクが人気すぎるからリンを出しても(女の子というだけでは)インパクトないし、ちょっと声が似ている気もする。そんなときに声優の方が男性の声もできる人だったので、男性女性をセットにして2倍お得、作る方は2倍つらい、みたいな形で(鏡音リン・レンを)リリースした」(佐々木氏)。
巡音ルカの開発については、「インパクトをつけるために英語を追加しようと、英語ができるスタッフを雇った。日本語の5倍くらい労力がかかるので、1年くらい細かい英語のかけらのようなものをつなぐテストや、そろえるテストをしてもらった」(佐々木氏)という。
日本語VOCALOIDの5倍の労力をかけて巡音ルカの開発を終えたあと、次は6種類の日本語ライブラリ(初音ミク・アペンド)の開発を始めた。そのため、現場の担当開発者からは「この人ハードル上げていくスタイルなんだな、ブラックだっていう風になった」(佐々木氏)というエピソードが語られた。さらにこの件については、製品の最終チェックが吉田氏の手元にも送られてきて、吉田氏も6倍のチェック作業を行なうこととなり、「佐々木さんのブラックの影響が最終的にチェックをする私のところまできた」(吉田氏)。
巡音ルカの発売後もクリプトンでは開発が続けられ、「ただかわいらしいだけの声じゃなくて暗くて陰鬱なダークな声も出せるようにとか、フォークっぽい曲を歌わせられるようにとか、いろんな歌を歌わせられるソフトを作っていきたいというところで初音ミクアペンドとか、その後もヤマハのバージョンアップに合わせてV3,V4とリリースしてきた」(佐々木氏)。
現在も、幅広い表現ができる歌声合成エンジンの開発が続いており、ヒップホップやラップ、ガラガラ声やシャウトに対応できるようにしたいなど、講演中には多彩な目標が挙げられていた。研究開発中の歌声合成ソフトのデモも行なわれたが、しゃがれ声やシャウトに近い強い歌声が合成されており、近い将来の製品化が期待できるクオリティだった。
初音ミクは、海外展開を含む様々なコラボレーション・メディアミックスが行なわれている。例えばBUMP OF CHICKENや安室奈美恵氏とのコラボレーション曲のリリースや、中村獅童氏共演による京都南座歌舞伎公演などがある。「こういった活動は、初音ミクの音声の表現力の向上、CGの表現技術の向上に伴っていろんなところで実施されるようになってきた」と佐々木氏。
佐々木氏が特に重視しているのがバーチャルライブと呼ばれるコンサートである。もともとは、セガがPlayStation Portable向けにリリースした初音ミクのゲームの企画から、ゲームの中で使われているCGを使ったライブをゲームのプロモーションとして行なったもの。これが非常に好評で、ステージを動き回る初音ミクを分かりやすくファンに伝えていくことに成功した。
世界ツアーシリーズとして展開している「MIKU EXPO」では、これまでに27都市計63公演を実施し、のべ17万人以上を動員している。「そういった音楽作品を中心にした展開が広がる中で、グッズやスマホを出してみたり、Google ChromeのCMに起用してもらったり、最近ではアニメのキャラクターにも採用してもらっている。ファンの方々はそういうのもアリだということで今のところ大目に見ていただいていてありがたいと思っている」(佐々木氏)。
歌姫開発にまつわるマル秘エピソード
次に、あらかじめ吉田氏と佐々木氏から聞いておいた開発エピソードが、さらに深掘りして紹介された。
■声質とVOCALOIDの相性を求め、歌よりも声質を求め、声がハッキリと聞こえやすくした(初音ミクの開発に関して)
初音ミクの大ヒットもあり、現在はVOCALOIDの知名度も上がってアーティストからの協力も得やすくなったが、それ以前は歌手に録音を依頼に行なっても、同意を得られないことが少なくなかった。特に歌手はその人独自の歌い方や歌いまわしにこだわる傾向があり、「実は歌いまわしは全く引き継がれずに、声質だけが欲しいと言えなくなってしまう」(佐々木氏)。
そこで、歌手ではなく声優に「声質が欲しいのであって、歌を録るわけではありません。ですから音痴であっても全然かまわない」(佐々木氏)とアプローチしたところ、「非常にあっけらかんとかわいらしい声で、気楽にやっていただけた」(佐々木氏)。
■キャラクター性を排し、スタンダードな楽器としての側面を強めた(VY1の開発に関して)
VY1はヤマハが独自に音声ライブラリを企画・制作したVOCALOID製品である。VOCALOID製品には初音ミクのようなキャラクター名がついていることが多いが、これはスタンダードな楽器として自由に使えるVOCALOIDを目指して開発したため、あえて色のつかない名称をつけたとのことだ。
「キャラクター性がないということで、NetVOCALOIDなどいろんなサービスで使っていただけた」(吉田氏)。キャラクター性を排したことで、結果的により使いやすくオールマイティになったということらしい。
■何度もアップデートされ、試行錯誤した英語版(初音ミクEnglishの開発に関して)
「英語の収録は(日本語に比べると)5倍くらい長い。そうすると。収録している声優さんの声がだいたい1時間でテンション下がってくる。1時間半くらいで一番低くなる。そのまま録り続けると最初の1時間分だけ違和感が出るので、それならテンション低いまま最初のところを録りなおしましょうと」(佐々木氏)。
■英語製品を繰り返し制作する中で、様々な知見を活かした製品(CYBER DIVAの開発に関して)
日本語女性の音声ライブラリVY1と、その後に作成された日本語男性ライブラリVY2に続いて、英語女性の音声ライブラリCYBER DIVAが開発された。吉田氏はこの英語ライブラリの開発に非常に苦労したらしい。
「たとえばI(アイ)と打ち込んだらVOCALOIDの発音記号の[aI]と変換する辞書があるんですけど、結構間違っていたり思い通りにいかなかったりがある。10万語くらいあるが、全部見なおして修正できるところは直した」(吉田氏)。
「英語のスクリプトが無意味な言葉でつらいと先ほど言いましたが、それでもできる限り知っている単語、歌えるようなスクリプトにしていこうと。いろいろ研究した結果、できたのがCYBER DIVAです。スクリプトの知見は現在でも我々の中で生きているので、やってよかったなあと思います」(吉田氏)。
初音ミクのすべてを知りたい!生みの親に7つの質問をぶつけてみた
最後に、VOCALOID開発にまつわる質問に吉田氏と佐々木氏から直接回答をしてもらった。
――ひとつのVOCALOIDを作るのにどのくらいの時間がかかるのでしょうか?
吉田氏:レコーディングを終えてから、すべての開発が終わるまで日本語版で順調に行ってだいたい3~4ヵ月くらい。
佐々木氏:企画が立ち上がって、ぽしゃっての連続で、むしろこちらのほうが長い。ぽしゃった企画には、例えば、完全に音痴に歌う初音ミク、ぐちゃぐちゃに歌う初音ミク、みたいなのがありました。
--VOCALOIDを開発するうえで、大切にしているポイントを教えてください。
吉田氏:やはりコンセプトですね。VOCALOIDのライブラリは100個を超えています。そういう中で新商品を作りましょうとなったときに、何かと何かを足して割ってみたような声だなというのは、やはり没になっていたりする。この商品はどういう歌わせ方をメインにするのか、最初の企画のコンセプトが一番大事になってきます。
佐々木氏:人間関係とコミュニケーションだと思っている。最初に英語を開発するときに(海外で先に発売されていた)英語のVOCALOIDの録音テープをいただいたんですけど、女性の方が途中でものすごく怒っている。録音しながら「もうこんな録音やってられないわよ!」と入っている。とにかく退屈な録音が続くので、途中で怒らせてはいけないし、雰囲気を悪くしてはいけない。そういうところが非常に大きいかなと思う。
吉田氏:歌手の方が6時間スタジオに詰めることはあっても、何時間も(歌い続けて)声を出すということはやらない。声優の方であっても、セリフならどのくらい進んでいるかがわかるが、VOCALOIDのレコーディングではわからない。だからキャラ声で歌ってほしいけどだんだんテンションが落ちたり、地声に戻ったりする場合がある。休憩のポイントを見極めたり、どういう風に説明すると良いところを引き出せるかだったり、プロデューサー、ディレクターの役割が大事。
――初音ミクリリース前、YouTubeやニコ動が出るまで、VOCALOIDはどういう状況だったのでしょうか。VOCALOIDのプロトタイプの頃の話や当時のテスト録音の話などを聞かせてください。
佐々木氏:剣持さん(剣持秀紀氏、VOCALOID開発の最初期から携わっているVOCALOIDの父と呼ばれるヤマハの開発者)がデモソングに童謡を使うのが好き過ぎ問題というのがありまして、僕の入社時のVOCALOIDの印象は、ずっと夕焼け小焼けとかをMEIKOがゆったりと歌っていた。
吉田氏:私も初めてボーカロイドの開発ツールを使って、ライブラリ作りを覚えるときに再生していたシーケンスは赤とんぼで、一週間くらいたってようやく赤とんぼをちゃんと歌えたとか、そういう経験があるので、あの曲を聞くとつらい時代を思い出す。『ゆうや~けこやけ~の』というのが『ゆうや~けけここやけけの~』みたいになったりとか、どうやって調整したらいいのか、何が起きているのか当時は全く分からなかった。
佐々木氏:端的に言うと、初音ミクリリース前、ニコニコ動画で流行る前のVOCALOIDは、童謡を歌うゆったりとしたシンガーであると。その後すごく早口で歌うボーカロイドを聞かされた時には『そういうの想定していないからやめてくれ!』みたいな気持ちに一瞬なったのを覚えています。
――初音ミクやVOCALOIDはキャラクターとしても目立った楽器になりましたが、だからこそいろいろ勘違いされたのではないでしょうか。楽器屋さんや業界関係者は困惑していませんでしたか。
佐々木氏:ソフマップさんみたいな若干サブカル寄りの展開をしようとしていたメーカーさんはものすごく喜んでいた。ヨドバシカメラやビックカメラさんはとにかく売れたからびっくりしていた。ある楽器屋さんには『そちらに初音ミクさんいらっしゃいますか』という電話がかかってきて困惑していた。
佐々木氏:(業界関係者の間でも)音楽を作るソフトだと思う、ゲームではないらしい、程度にしか認識できなかった。しかも、だいたい売り切れていて初音ミクさん店頭にいないんですよ。……こういうやり取りが、楽器屋の店員の中で都市伝説的になっていましたね。
――今だから言える失敗談や、やってしまったな~という困惑エピソードはありますか?
吉田氏:ある製品のレコーディングの時、その声優さんにとって初めての現場だった。(そこに)偉い人が来て、声優さんが緊張して全然声が出ない。すごくいい声で、ぜひこの声で作りたいと思ったけれどその声が得られない。私の方からその偉い人にちょっと出てってくださいという話をして、なんとか乗り切ったんですけど、あのあと大丈夫だったのかな。あとで何か言われなかったかな…。
佐々木氏:僕も鏡音リン・レンを作ったときに、声優さんが緊張していらっしゃって、僕は何を思ったか、その緊張している感じがいいんで、緊張したまま行きましょうと、読み上げの呪文のスピードを少し上げたんですね。剣持さんも『スピード上げても大丈夫ですよ、攻めていきましょうよ』みたいなことを言っていた。早目に録ったら、すごくパンチのある強いボーカルになりましたね。それで初音ミクはリラックスした感じなのに対してリン・レンのときには打ち込んだ時に言葉が聞き取りにくいところがあったと思います。
――お二人がプライベートで体験した、周囲のリアクションのエピソードはありますか。
佐々木氏:油断しているプライベートの時にいきなり初音ミクらしき声が鳴り始めるとすごい勢いで振り返る癖がついてしまいました。そういうのは周りの人がびっくりしますね
吉田氏:3年くらい前に歌手の小林幸子さんの出演する番組に出させていただいたんですけど、そのあとに近所の方から『テレビ見たよ、ああいう仕事をやっていたんだね』と。それでようやく自分の仕事が認知されたということがありました。
佐々木氏:ずっと通っていた美容室の美容師さんが、髪を切りながらいきなり初音ミクの話を始めたことがあって、バレていたわけではなくて、しかもそのお姉さんが好きなんじゃなくてうちの夫がはまっていて困っているみたいな話。そういう時は気まずくなりますね。
――お仕事何されてますか、と聞かれたときには、ボーカロイドの開発をやっていますという話はされるんですか?
吉田氏:するんですけど、以前はあまり理解されなかった。サウンドエンジニアです、と名乗っていました。今ならボーカロイドを開発していますと言うと、あれね、という感じでちゃんとわかっていただける。そういう時代がきたなと思う。
佐々木氏:札幌だとあまりないけど、東京だと店員さんに『VOCALOIDの関係の方なんですか』と言われたりとか一時期よくあったんですけど、今はちょっと落ち着いてきた。初音ミクと言えばCGのやつね、みたいな、そういうふうに理解されやすくはなりましたね。
***
この記事をご覧になった方のなかにも、あの初音ミクの大ブレークをニコニコ動画で実体験された方がいると思う。誰もかれもが自分の気持ちを歌に変えて世に送り出すことができる、自分の代わりに少女がみんなに届けてくれる、あの浮揚感、疾走感は形を変えて、InstagramやYouTubeの中で花開いている。誰もが発信者になれる、日本のCGM文化は、間違いなく初音ミクがきっかけの一つになっている。
吉田氏と佐々木氏の話からは、初音ミクという少女をこの世に産み落とすために費やした膨大な労力が伺えた。エンジニア、ディレクター、プロデューサーらの苦労だけでなく、音声データを提供した声優や歌手もまた、緊張や怒りや疲労に耐えた。その結果が、単なるコンテンツに留まらない、世界に誇るべき文化として花開いている。
本セッションを聞いて、素晴らしき文化のある世界にいるという事実に、改めて幸福を感じている。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります