アップルは6月8日、第3世代のAI基盤モデル「Apple Foundation Models」を発表した。新しいSiriなどを支えるAI基盤となる。なかでも注目されるのは、200億パラメーター規模の「AFM 3 Core Advanced」が端末内で動作する点だ。
200億パラメーターと聞くと、クラウド上の大型AIモデルを思い浮かべるが、アップルは、このモデルをiPhoneなどのAppleシリコン搭載端末で動かすために、MoEと呼ばれる仕組みに近い“疎活性化アーキテクチャー”を採用した。全体では200億パラメーターを持っているが、1回の処理で使うのは10億から40億パラメーター分に絞られる。大きなモデルを丸ごと動かすのではなく、必要な部分だけを選んで使うという発想だ。
通常の大規模AIでは、モデル全体の重みを高速なメモリーに置く必要があり、これが大きな制約になる。一方、アップルはAFM 3 Core Advancedで、モデル全体をNANDフラッシュに置き、必要な専門部分だけをDRAMに読み込む設計にしている。質問や依頼の内容に応じて使う部分を選び、生成中にも必要に応じて選び直すことで、端末のメモリー容量を超える規模のモデルを、実用的な速度で動かせるようにしたわけだ。
性能面で大きいのは、音声まわりの改善だ。AFM 3 Core Advancedは音声合成で既存の読み上げシステムを上回った。会話文の読み上げでは、5点満点の評価で従来システムの3.82に対し、AFM 3 Core Advancedは4.24だった。音声入力でも、全体品質や句読点、意味の把握などで従来の音声入力システムより好まれたとしている。これはつまり、新しいSiriの聞き取りが正確になり、返す声が自然になり、ユーザーが普段の言葉で頼みやすくなるということをあらわしている。
ただし、すべてを端末内だけで完結させるわけではない。サーバー側モデルとして「AFM 3 Cloud」「AFM 3 Cloud Pro」も用意されている。複雑な推論、画像生成・編集、より重い処理はPrivate Cloud Compute上で動かすようになっている。AFM 3 CloudがApple Intelligenceの日常的なクラウド処理を担う標準サーバーモデル、AFM 3 Cloud ProがGoogle CloudやNVIDIA GPUの力も使う高負荷・高難度処理向けの上位モデルという位置づけだ。なお、アップルは、この仕組みではユーザーデータを保存せず、アップルを含む誰とも共有しないとしている。
AI競争は、クラウド上の巨大モデルだけで決まらない。毎日持ち歩くiPhoneの中で、どれだけ賢いAIを安全に、速く、自然に動かせるか。アップルの第3世代Foundation Modelsは、Siriリニューアルの本気度を示す発表となっている。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります

