第187回
深夜に叫びながら「Gemini live」と一緒に文章を書く
みんな大好き雑誌『ムー』と旧ソ連の昭和100年問題と「バイブライティング」
2025年05月09日 09時00分更新
「AI・人間ペア」で「バイブライティング」がはじまりつつある
文章を書くために「Gemini live」がどこまで使えるのか、どのように活用できるのか。結論からいえば、CURSORほどの万能性はないものの、「いま文章を書くのに《Gemini live》を使わないのは損だ」と言いたくなる手応えがある。万能ではないというのは、現在執筆しているようなエッセイ的な文章が最も相性がよく、その他のジャンルに関してはそうでもないかもしれない(未検証)。
次の動画は、ChatGPTの「高度な音声モード」を使ってこの原稿を書いているところだ。さすがに、GPT-4oだけあっけて文書生成や推論を使った返答の内容は申し分ない。
次は、Gemini liveを使っているところである。liveに入る直前に画面にはFlash 2.0と表示されていたが、Gemini側が内容によってモデルを切り替えるという説がある。
ド忘れしたことや表現につまったときに、「あれなんだっけ?」とか「こういうときはどう言ったらいい?」とか質問をする。あるいは、何かインスピレーションを得たくて限りなく雑談の世界に入っていくことができる。また、人間とのやりとりのように融通が利かないこともままあったりもする。これが、「AI・人間」による「ペアライティング」の世界である。
「ChatGPT」があるのに、なぜ「Gemini live」を選ぶのかと思われる人もいると思う。実は、「ChatGPTの音声モード」のほうがこの用途には適していると思う。しかし、ChatGPTの無料プランでは肝心の「高度な音声モード」が利用できない。Plusプランであっても30分ほどで使用制限がかかってしまう(数時間から十数時間でリセットされる)。Proプランは無制限のようだが月額200ドル(約3万円)は誰でも払えるとは言えないだろう。使用制限後でも「スタンダードモード」は使えるがレスポンスの質が今ひとつである。
それに対して、「Gemini Live」は、そのような時間的制限がないように見える。使用制限になるのを恐れず、延々と会話しながら使うこのスタイルに最適といえる。ChatGPTが、有料コンサルだとすると、Gemini liveは、まさに同僚というわけだ。いまのところ、私の場合は「ChatGPTの高度な音声モード」と「Gemini live」を目的によって使い分けている。
ちなみに、上記のビデオでもわかるのだが、私は、Windows 11で標準となった音声入力を活用している(Win+Hでスタート)。これを使いながら「Gemini live」や「ChatGPTの音声モード」を使っていると、その声でCURSORに私の質問と彼らの返答が自動的に入力されていく。昨今話題の「バイブコーディング」(vibe coding)ではないが、「バイブライティング」(vibe writing)と呼べる世界がいまや始まりつつあるという気分になってくる(よいかわるいかは別として)。
それにしても、昼間でも深夜でも「そうじゃなくてこんなことでしょ」とか「いやいや、ありがとそれのことだ」とか、生成AIを相手に声をはりあげて原稿を書いている。これはもう十分に「ムー的」なところに来ていると思う。ところが、「ムー的」と言われないのは、先に述べたキーワードである“あるかないかわからない”ではなく、我々の目の前にあるからだ。
麹町アジャンタ:東京都千代田区麹町にある老舗インド料理店。1990年代、IT業界関係者や外国人技術者の交流の場としても知られていた。
たまごっち(PCソフト版):バンダイが発売した携帯型育成ゲーム「たまごっち」のPC向けソフトウェア版。
クロックアップ:コンピューターや電子機器の動作クロック(周波数)を本来の仕様よりも高く設定し、処理速度を向上させる改造行為。
『ムー』:1979年創刊の日本の月刊オカルト雑誌。超常現象、UFO、UMA、都市伝説、陰謀論など幅広いテーマを扱う。
銀河探索編集部:2023年公開の中国映画。監督コン・ダーシャン。製作総指揮ワン・ホンウェイ。
王様の映画:1986年公開の映画。監督カルロス・ソリン。
人再囧途之泰囧:2012年公開の中国映画。英題は「Lost in Thailand」。監督徐崢。
AIでRCカーを走らせよう!:ラジコンカーなどにRaspberry PiやJetson nanoなどのマイコンを搭載して、Tensor FlawのようなAIで走らせるコミュニティ。公式ページ。
バイブコーディング(vibe coding):開発者が自然言語でAIに指示を出すことで、AIが自動的にコードを生成しアプリケーションを構築する新しいプログラミング手法です。
ペアプログラミング:実際にコードを書く「ドライバ」、もう1人を「ナビゲータ」の2人で協力してコードを書く開発手法。
Gemini live:Googleが提供するAI「Gemini」のライブ対話モード。音声やテキストでリアルタイムにAIとやりとりしながら作業や執筆ができる。
CURSOR:AIアシスト機能を搭載したコードエディタ。AIと対話しながらプログラミングや文章作成ができる。
ChatGPT:OpenAIが開発した大規模言語モデル(LLM)を用いたAIチャットサービス。音声モードやテキストモードなど複数のインターフェースがある。
遠藤諭(えんどうさとし)
株式会社角川アスキー総合研究所 主席研究員。MITテクノロジーレビュー日本版 アドバイザー。ZEN大学 客員教授。ZEN大学 コンテンツ産業史アーカイブ研究センター研究員。プログラマを経て1985年に株式会社アスキー入社。月刊アスキー編集長、株式会社アスキー取締役などを経て、2013年より現職。趣味は、カレーと錯視と文具作り。2018、2019年に日本基礎心理学会の「錯視・錯聴コンテスト」で2年連続入賞。その錯視を利用したアニメーションフローティングペンを作っている。著書に、『計算機屋かく戦えり』(アスキー)、『頭のいい人が変えた10の世界 NHK ITホワイトボックス』(共著、講談社)など。
X:@hortense667
Bluesky:https://bsky.app/profile/hortense667.bsky.social
mixi2:@hortense667
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります

