第800回
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU
2週間空いてしまったが、再びHot Chipsの話に戻ろう。今回取り上げるBroadcomはCPUでもGPUでもNPUでもない。というか演算の話ではなく、インターコネクトの技術である。今年のHot Chipsでは、Broadcomとインテル、それとTeslaがインターコネクトの技術に関する発表を行なった。
このうちTeslaに関しては、物理層はイーサネットながらその上のプロトコルをDojo同士の通信に最適化したという話で、「Hot ChipsよりHot Interconnectsでやりなさい」という内容であった(それを言えばBroadcomとインテルもそうなのだが)。
これはこれでおもしろかったのだが、マニアックすぎるので割愛して、Broadcomとインテルの方を説明したい。ということで今回はBroadcomのCPO(Co-Package Optics)の話である。
光学インターコネクトにおいては
電気信号の遅さが問題になる
Package Opticsに関しては、連載676回のLightmatterの際に少し触れた。もっともLightmatterの場合、演算そのものを光ベースで行なっている関係で当然入出力も光信号になるため、光インターコネクトが必要である。
一方Broadcomの方は動機が違っている。同社は大規模イーサネットスイッチのベンダーでもあって、例えば2019年に発表したTomahawk 4ことBCM56990は、ワンチップで25.6Tbit/秒のスイッチング速度を誇る。25.6Tbitというのは400Gbitイーサネット×64ポート、200Gbitイーサネット×128ポート、100Gbitイーサネット×256ポートのいずれかを選択可能である。最大256ポートなので50Gbit×512ポートは不可能だ。
2022年には速度を2倍にしたTomahawk 5ことBCM78900を発表しており、800Gイーサネット×64~200Gbitイーサネット×256ポートまで対応。そして現在、速度をさらに倍にしたTomahawk 6を開発中であり、おそらく2025年頃には発表されると思われる。このスピードもたいがいなのだが、問題はこれをどうシャーシに実装するかである。
エンタープライズ向けのイーサネットスイッチの場合、トランシーバーモジュールと組み合わせて利用するのが一般的である。トランシーバーモジュールというのは、例えば安価な互換トランシーバーを多く提供しているFSの200/400/800Gイーサネットであればこんな感じだ。
実はイーサネットにもいろいろ規格があって、単に400Gイーサネットといっても山ほど、それこそIEEEで標準化された400GBASE-XXだけで10種類以上、ベンダー独自のものやIEEE以外で標準化されたものまで含めると20種類以上規格が存在する関係で、イーサネットのスイッチそのものはあくまでも電気的に400Gの信号のスイッチングができる機能に留め、個々のイーサネットの規格に合わせた光なり電気の信号の変調そのものは、トランシーバーモジュール側に留めておくことで、トランシーバーモジュールの交換で複数種類の規格に容易に対応できるようになっている。
ここまでは良いのだが、問題はスイッチチップとトランシーバーモジュールの間の配線である。400Gの場合、モジュールの規格としてはOSFP/QSFP-DD/CFP8の3種類が一般的(ほかにも独自のものがあるが割愛する)であるが、400Gbpsの電気信号なんて高速すぎて通せないので、実際には50Gbps×8での接続となる。
信号はディファレンシャルで、しかも双方向分が必要なので、1ポートのモジュールには8×2×2=32本の配線が必要になる。これが64ポートだと2048本、128ポートだと4096本もの配線となる。
それでもポート数が少ない、薄型のスイッチなら基板だけでなんとか配線ができるのだが、ポート数が増えるのにともなって厚みが出てしまう。
画像の出典は、Broadcomのプレスリリースより
1枚の基板で配線できなくなるとどうなるか? というのが下の画像だ。
画像の出典は、ServeTheHomeのウェブサイトより
大量の配線が筐体の中を這いまわっているわけで、この先信号の高速化やポート数が増えると、さらにシャレにならないことになる。また、本来光信号のイーサネットにもかかわらずスイッチは電気信号で実装され、トランシーバーの中で光と電気信号の双方向変換をしているわけだが、この際に問題になるのが電気信号の遅さである。
先に書いたが400Gなら50G×8で送受信しているので、トランシーバー内部には50G×8と400Gを双方向変換する回路(これはGearboxと呼ばれる)が必要になるが、このGearboxの消費電力がシャレにならない。これは速度差があるほど消費電力が増える傾向にある(100G×4と400Gの変換の方が消費電力が低い)ので、できればもう少し信号速度を引き上げたい。
前置きが長くなったが今回Broadcomが発表したCPOは、こうした問題を解決するための方策である。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります