週刊アスキー

  • Facebookアイコン
  • Xアイコン
  • RSSフィード

わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU

2024年11月11日 12時00分更新

性能/消費電力比でNVIDIAのL40Sを60%上回る
2025年には改良モデルのRNGD-SとRNGD-MAXを提供予定

 そんなRNGDの性能として公開されているのが下の画像である。絶対性能はともかく性能/消費電力比でNVIDIAのL40Sを60%上回る、としている。

これはMLPerf Inference:Datacenter Benchmarkで、オフラインテストでの結果。ちなみにGaudi 2は8枚、TPU v5eは4枚でのデータが登録されており、表はこれを1枚あたりに換算した数字である

 テストはパラメーター60億個のGPT-Jで、こうしたサーバーソリューション向けチップに仕上がっていることを示していると言える。またRGNDは複数カードをPCIe経由で、ホストを介さずに直接接続できるのも特徴である。

普通はこうしたカード同士の接続のために100Gイーサネットあたりを利用するケースが多い。ただその場合、下の画像のような利用の仕方が難しくなる

 さらにPCIeのI/Oバーチャライゼーションをサポートしているので、例えば1枚のシャーシに複数枚のRNGDを搭載したうえで、PE単位で複数のアプリケーションに割り振るといった動作も可能になっている。

NVIDIAのカードも、1枚のGPUの内部を複数のインスタンスに分割可能であり、これと同等のことができる

 FuriosaAIによれば、今回発表のRNGDをベースに、2025年にはより高い性能になるRNGD-Sと、2チップを搭載したRNGD-MAXを提供予定としている。

RNGD-Sは動作周波数を引き上げたバージョン、RNGD-MAXは150WのRNGD×2と、PCIeスイッチを積んだバージョンと思われる

 RNGDカードは今年第3四半期提供とあるが、現時点ではまだ出荷は始まっていないようだ。とはいえ既にかなり高い完成度を保っているだけに、出荷がそう遅れることはないだろう。

2ページ目にあるRNGDのプロトタイプボードの画像と見比べると、補助電源コネクターやカード上のファン用と思われるコネクター類など、細かいところに違いが見られるが、おおむねプロトタイプボードと同じ構成になっている。これ、ヒートシンクだけどうにかできれば長さはもっと詰められそうではある

 すごく高い競争力を持つというわけではないが、手堅い設計もあってスタートアップ企業とは思えないスピードで製品を市場投入できていることは評価すべきであろう。サーバーと言ってもエッジ向けという感じではあるが、おもしろい製品である。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事