NVIDIAを射程に捉えた韓国の雄rebellionsの怪物AIチップ「REBEL-Quad」

2026年03月09日 12時00分更新

文● 大原雄介（http://www.yusuke-ohara.com/）　編集●北村／ASCII

爆熱を賢く制御
TDP 600Wを手なずける独自の電力マネジメント術

　次が電力管理の話である。先に「1つは時間的な電流負荷の分散」という話をしたが、REBEL-Quadではチップレット内(というかクラスター)内でのニューラルコアの分散やチップレットをまたいでの分散などの技法をサポートしている。

ほかにも電圧と動作周波数の制御(DVFS/Throttling)や温度検出/電圧降下検出(Thermal/Droop Detector)などのメカニズムが当然実装される

　一方ISCの詳細が下の画像だ。右のグラフを見ると、ISCを使うことで電圧変動がかなり抑えられてるのがわかる。

Rebel100本体への供給を考えると、こんな風にダイの脇に置くよりも、GraphCoreのBowのように真下に配して給電する方が効果的である。そのあたりも鑑みて、HBMとPHYのみへの供給に留めたのかもしれない

　分散の方だが、具体的な手法が下の画像である。単純に順序の分散以外に階層構造別分散や動的な分散などの手法があり、下のグラフにもあるようにピークの電力そのものは変わらないにしても、その上がり下がりが緩やかになっているのがわかる。

分散の具体的手法。Google TPUのProject Smoothieと同じ発想である

　実際電圧/電流の変動では分散で明確に変化し、これにともないノイズを削減できたとしている。

左が電流(上)/電圧(下)の変動で、変化がはるかにゆっくりになっているのがわかる。結果、右のグラフでわかるようにノイズが減っていることが確認できる

　冒頭にも書いたがすでにRebel100のシリコンは完成して実際に動作可能となっており、NVIDIAのH200との比較では絶対性能、性能/消費電力比のどちらでも勝っているとしている。

これはチップ1個での動作テスト風景らしい。それでも600WものTDPなので水冷チラーは必須というわけだ

実測値ではあるが、問題はREBEL-Quadにした時に性能が4倍になるかどうかだろう(性能/消費電力比は今と変わらないままだろう)

　また今後の展開として、IOチップレットを2026年第1四半期中にテープアウトするほか、より大容量のメモリー(SRAMなのか3D DRAMの類なのかは不明)をチップレットの形で接続することを予定している。

"Memory Expansion"というあたり、あるいはSambaNova的に外部にDDRなりLPDDRなりを接続できるようにするI/Fを想定している可能性もある

　ただ問題は先にも触れたI-CubeSの最大パッケージサイズである。特にメモリーに関しては、パッケージがどこまで大きい物を提供できるか次第なところがあるだけに、現状ではなんとも言い難い。とはいえ、ベンチャーにもかかわらずわりと先端プロセスを使ってチップレットを生かしたAI プロセッサーを製造できるという事例の1つであることは間違いない。

この記事をシェアしよう