第867回
計算が速いだけじゃない! 自分で電圧を操って実力を出し切る賢すぎるAIチップ「Spyre」がAI処理を25%も速くする
2026年03月16日 12時00分更新
IBMがTelum IIプロセッサーと併せてSpyre(スパイア)というAIアクセラレーターを発表した話は連載790回で最初に紹介した。このSpyreはz17だけでなくPower 11でも利用可能という話は連載844回で説明したが、肝心のSpyreの中身についてはこれまで説明がなかった。
普通に考えればTelum IIの推論アクセラレーターのスケールアップ版と思うわけだが、そのTelum IIに先駆けて2021年に発表されたTelum(z16相当)に搭載された推論用アクセラレーターの話は連載790回で説明している。
もっともこれとTelum IIの構造と同じかどうかは不明なままだった(そもそもTelum→Telum IIで推論性能が4倍になっているので、少なくとも同一ではない)。そんなわけでSpyreはいろいろ発表こそあったものの中味がよくわからなかったのだが、今回その内容がISSCCで説明された。
謎に包まれていたIBMのAIアクセラレーター「Spyre」の中身を追う
まずSpyreの歴史が下の画像である。
「え、ISSCC 2024でなにか発表あったっけ?」と思って確認したら、なんと"14.1 A Software-Assisted Peak Current Regulation Scheme to Improve Power-Limited Inference Performance in a 5nm AI SoC"というタイトルで説明があった。
そもそもこのSession 14というのは"Digital Techniques for System Adaptation, Power Management and Clocking"という、要するに電力やクロックの供給に関する技術の説明を行なうセッションで、アクセラレーターの中身そのものに関する話は下の画像だけである。
アクセラレーターの中身そのものに関する話はこれだけ。説明しているといえばしているのだろうが。MPEというのはMixed-precision Processing Elementの略だそうだ。ちなみにこのカードは外部にLPDDR5×8と、PCIe Gen4 x16のI/Fを持つ
TelumのAI推論アクセラレーターの説明に似てはいるが、同じとも言いにくい。なぜなら、TelumはMPEではなくPT(Processor Tile)という言い方をしているからだ。さらに、North FIFO/South FIFOに相当するものがなく、Telumは行列演算はFP16のみ、アクティベーションがFP16/FP32のサポートというあたりも異なる。
そもそもPOWERやZ系列でAIが必要な理由としてIBMが示したのが下の画像。最近では生成AIなどがターゲットに入ってくるが、もともとトランザクション処理の中でAIを利用するものが多く、こうしたものをトランザクションの性能を落とさずに処理するニーズが出てきた、ということである。
こうした用途向けのアクセラレーターとしての条件としてIBMが示すのが下の画像である。カードあたりの性能は(消費電力枠が75Wなので)そこそこだが、拡張性があることが求められているのがわかる。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります





