週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

内部データパスはTuringの2倍

GeForce RTX 30-Series Tech SessionsでわかったAmpereが超進化した理由

2020年09月05日 06時00分更新

GDDR6Xメモリーの採用とワットパフォーマンスの改善

 GeForce RTX 3090とRTX 3080にはGDDR6Xメモリーが使われる点もトピックだ。GeForce Special Eventの詳報記事でも書いた通り、GDDR6Xは2段階の電圧レベル(いわゆる0か1か)ではなく、4段階の電圧で情報をエンコードして転送する。結果、情報密度が上がるためより短時間で転送が終わるというわけだ。これを筆者がわかる範囲で補足しておきたい。

GDDR6が使う波形(左)は電圧がゼロか、電圧がかかっているかの2値のみなのに対し、GDDR6X(右)は4段階の電圧を使用するPAM4シグナリングが使われる。同じデータを送信するのにGDDR6が500ピコ秒かかるところを、GDDR6Xなら380ピコ秒で終わるという図だ

 GDDR6Xで扱うシグナルを波形として見ると次のような図になるが、単純に2ビットの情報を4段階の電圧に変換しているわけではない。“眼”のようなスペースが広くキレイに出現するよう設計する必要があり、目頭や目尻に相当する部分はシグナルが0とも1ともとれる場所となる。なので、はっきりと電圧があるかないかのポイントが必要になり、微妙な4段階の電圧を区別しなければならない。

 そこで、GDDR6Xでは眼のパターンがキレイに出た瞬間で電圧を判定するアルゴリズムを採用するほか、電圧の両極端から両極端へ飛ぶようなシグナルを禁じている。一番下の電圧レベルから一番上の電圧レベルへ飛べば、電圧が上がりきるまで時間がかかる。結果として眼の開口部が狭くなってしまうからだ。このあたりの細かい解説は、いずれ大原氏の連載でやってくれると思うので、襟を正して待ちたい。

GDDR6Xで採用されている技術。中央の「Max Transitin Avoidance Coding」が、両極端な電圧レベルへの遷移を禁じてシグナルのクオリティーを保つためのテクニックだ

波形をよく観察すると、電圧レベルの変動は±2レベルに制限されていることがわかる。図は筆者が「こんな感じでは」と線を引いてみたものなので、あくまで参考程度に

仮にMax Transitin Avoidance Codingがなく、両極端な電圧レベルへの遷移があるとこんな感じになり、眼の開口部が狭くなってしまうことがわかる

 ワットパフォーマンスの改善については、実のところあまり多くは語られなかった。単純にパフォーマンスが2倍になったのでワットパフォーマンスが2倍という雑な計算のようにも思えるが、一応設計レベルでも工夫されているようだ。具体的にはGPUのコア部分とメモリーまわりの回路部分で電力のレールが分けられている、とのこと。だがそれ以上の情報は公開されなかった。

右の図でGPUのコア部分とメモリーまわりで電力の系統が分かれていることを言いたいようだ。左の図はGeForce Special Eventで示されたものに具体的な数値が入ったものだが、同程度の温度ならAmpereはTuringの2倍近いフレームレートを出せるようだ。ただし、TGP(Total Graphics Power)は240W→320Wに増えているので、相応の消費電力は覚悟するべきだろう

次回はRTX IOとNVIDIA Reflexに迫る

 今回のGeForce RTX 30-Series Tech Sessionsレポートはこのあたりにしておこう。次回は最も興味を惹かれる(しかし実用化にはまだ時間が必要な)「RTX IO」、そしてeスポーツの世界を変えてしまう予感もする「NVIDIA Reflex」について迫りたい。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう