爆熱を賢く制御
TDP 600Wを手なずける独自の電力マネジメント術
次が電力管理の話である。先に「1つは時間的な電流負荷の分散」という話をしたが、REBEL-Quadではチップレット内(というかクラスター)内でのニューラルコアの分散やチップレットをまたいでの分散などの技法をサポートしている。
一方ISCの詳細が下の画像だ。右のグラフを見ると、ISCを使うことで電圧変動がかなり抑えられてるのがわかる。
Rebel100本体への供給を考えると、こんな風にダイの脇に置くよりも、GraphCoreのBowのように真下に配して給電する方が効果的である。そのあたりも鑑みて、HBMとPHYのみへの供給に留めたのかもしれない
分散の方だが、具体的な手法が下の画像である。単純に順序の分散以外に階層構造別分散や動的な分散などの手法があり、下のグラフにもあるようにピークの電力そのものは変わらないにしても、その上がり下がりが緩やかになっているのがわかる。
分散の具体的手法。Google TPUのProject Smoothieと同じ発想である
実際電圧/電流の変動では分散で明確に変化し、これにともないノイズを削減できたとしている。
冒頭にも書いたがすでにRebel100のシリコンは完成して実際に動作可能となっており、NVIDIAのH200との比較では絶対性能、性能/消費電力比のどちらでも勝っているとしている。
また今後の展開として、IOチップレットを2026年第1四半期中にテープアウトするほか、より大容量のメモリー(SRAMなのか3D DRAMの類なのかは不明)をチップレットの形で接続することを予定している。
ただ問題は先にも触れたI-CubeSの最大パッケージサイズである。特にメモリーに関しては、パッケージがどこまで大きい物を提供できるか次第なところがあるだけに、現状ではなんとも言い難い。とはいえ、ベンチャーにもかかわらずわりと先端プロセスを使ってチップレットを生かしたAI プロセッサーを製造できるという事例の1つであることは間違いない。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります





