集積回路国際学会ISSCC 2026の論文解説だが、ここから数回にわたりインターコネクトの話をしたい(プロセッサーよりインターコネクトに興味が出てしまうのは筆者の悪い癖であるが、もうそういう仕様だと諦めていただきたい)。
初回は総論ということで、Arista NetworksのAndreas Bechtolsheim先生による"Data Center Interconnect:400G, 800G, and Terabit Pluggable Optics"である。
なぜ光ファイバーが必要なのか?
1600Gイーサネットから次世代への布石
昨今はAIデータセンターのネットワークはスケールアウトとスケールアップの2種類に分類されるようになった(この話は次回か次々回にする予定)が、もともとは1種類(スケールアップ)で統一され、かつ速度をどうやって引き上げるかに腐心しているわけである。
特にデータセンターの場合、ラックが数十本並んだ列が整然と何十列もそろっていることが珍しくない。こうなるとラック間の接続は短くても数メートル、長いと数百メートルになる。ちなみに最近はデータセンターそのものも巨大化しており、配線距離がキロメートルになることも珍しくない。
こうなると銅配線では到底到達できないので、基本は光ファイバーを利用してのイーサネットを使うことになる。よくToR(Top of Rack)スイッチという言い方をするが、ラックの最上段(NVLinkではラックの中央だったりする)にネットワーク接続用のスイッチが配され、これとブレードサーバーの間は銅配線、そしてToRスイッチ同士の接続は光ファイバー配線になるわけだ。
この光ファイバー配線(銅配線でも同じだが)で使われるのがPluggable Transceiverである。このトランシーバーも規格が何種類かあり(よく使われるのはOSFPやQSFP-DDだが、ほかにもいくつか存在する)、これを差し替えるだけで異なるイーサネットへの対応が可能である。
LPOはCPOの変型版とでもいう構成。この派生型としてLRO(Linear Receiver Optics)というものもあるが、このあたりの話はまた項を改めて。Bechtolsheim先生はまるでLPOが広く利用されているように書いているが、現時点ではまだごくわずかしか使われていない
例えば800Gbpsのイーサネットであれば100G PAM4のSR8/DR8/FR8/LR8といった異なる特性の規格があり、それぞれに対応したOSFPなりQSFP-DDのトランシーバーが販売されている。これを差し替えるだけで異なる規格に対応できるというわけだ。
さて前置きが長くなったが、現在は特にAIデータセンター向けには1600Gのトランシーバーが投入されつつある。もちろんこれをそのまま実装すると消費電力が大きくなるので、LPOの採用やシリコン・フォトニクスの利用、あるいは変調方式の変更によるライトソースの削減などのアプローチは見られるが、これがすべて広く利用できるか? というとそれはまた別の話で、いろいろ制限もある。
例えばLPOの場合、ASIC/スイッチ側にDSPの機能が必要になるので、これを持たないI/Fでは利用できない。ただ市場が立ち上がれば毎年1億個レベルの出荷すら可能、というところまで来ているとする。問題はその市場が立ち上がっていないことだ。
本稿はこれに続く話である。現在は1600Gイーサネットの普及に向けて動きがある状態だが、2028年にはこれが3200Gイーサネットになるとする。
2028年には3200Gイーサネットになる。例えば8×100Gというのは16芯(送受信それぞれ8対)の光ファイバーを利用してそれぞれ100Gbpsを通すという意味で、この本数は増やさずに速度を上げようという話だ
"reduces cost and power"というのは、1bitを送るためのコストと消費電力を下げましょうということで、モジュール単体で言えば1.5倍くらいに跳ね上がっているのだが、速度が2倍になれば結果として減るという話である。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります
