2020年02月07日23時00分

物理64コアCPU「Threadripper 3990X」は自作PC市場に降臨した“巨人”だった

  • この記事をはてなブックマークに追加
  • Pocket

 2020年2月7日23時、AMDは第3世代Threadripperのフラッグシップモデル「Ryzen Threadripper 3990X」の販売を解禁した(本邦では8日11時販売解禁)。7nmプロセスのチップレット(CCD)と12nmプロセスのIOダイ(cIOD)の組み合わせでCPUを構成できるZen2アーキテクチャーの登場により、AMDのCPUはこれまでにないスケーラビリティーを持つに至った。

 今回のThreadripper 3990Xはそのスケーラビリティーをフルに活かし、自作PC市場向けのCPUとしては未曾有の64コア(C)/128スレッド(T)という強烈な並列度を武器にしたCPUである。昨年終盤に登場したThreadripper 3970Xの2倍のコア数(8コアのCCDを8基搭載)を備えた、超メニーコアCPUである。ライバルであるインテルが1ソケット28コアの壁を突破できずにいる一方で、AMDはZen2のメリットを活かし、一挙に1ソケットで64コアの世界に突入したわけだ。

 気になる国内発売日は2月8日11時で、AMDが公開した販売価格は税込49万4780円(税別44万9800円)。米国の希望小売価格3990ドルを単純にドル円換算すれば約43万円なので、かなり頑張った価格設定と言える。

 今回はそのThreadripper 3990Xのレビュー用個体を入手し、いち早くテストする機会に恵まれた。最大128スレッドが生み出すパワーは、PCの処理性能をどこまで高めてくれるのか、簡単ではあるが検証していきたい。

パッケージの形状はすでに発売済みの第3世代Threadripperと共通。フラッグシップモデルなのにそれほどの特別感はない
ソケット形状は従来のThreadripperと共通。PCI Express Gen4に対応しているため、TRX40チップセットを搭載し、最新のBIOSに更新されたマザーで動かせる
ソケットカバーを開閉するためのトルクレンチと、Socket AM4/LGA115x用の簡易水冷ユニットを利用するための専用マウンターが付属する

コア数倍でもTDPが据え置き

 Threadripper 3990Xのスペックは、すでに報じられた通り。cIOD(Client I/O Die)に接続される(動作する)CCDの数が4基から8基に増えたただけで、設計的な変更点もない。cIODから8基のCCDはsすべてが独立したInfinity Fabricで連結され、各CCDからメモリーを読み書きするには、等しくcIODを経由してアクセスすることになる。

 第2世代Threadripperの2990WX/2970WXのようにNUMA(Non Unified Memory Access)ではなく、UMA(Unified Memory Access)であることがThreadripper 3990Xの大きな強みとなっている。ライバルであるXeonでThreadripper 3990Xと同規模のコア数を得ようとすれば、CPUは2ソケット。必然的にNUMAとなってしまう。ここがThreadripper 3990Xの強みといえるだろう。

Threadripper 3990Xのスペック

 すでに発売済みのThreadripper 3970Xとスペックを比較すると、コア数は単純に倍となっているものの、TDPは280Wで据え置かれているため、既存のTRX40チップセット搭載マザーボードでもBIOSさえ更新していれば問題なく使用できる。ただベースクロックは2.9GHzとかなり控えめになっているため、コア数よりもクロックが効くような処理では格下のThreadripper 3970Xや3960Xの方が速くなることは容易に想像がつく。

「CPU-Z」でThreadripper 3990Xの情報を拾ってみた。右下のCoresとThreadsの数に注目
タスクマネージャーの表示はThreadripper 3970X以上の迫力。あまりにコア数が多すぎて、ウインドウをある程度大きくしないと、コアのヒートマップが一望できない

 だが動作クロックの差異以上に気をつけねばならないのは、「プロセッサーグループ」と呼ばれるWindows(7より盛り込まれた)の仕様だ。Windowsでは論理64コアを1つのプロセッサーグループとみなす。つまりThreadripper 3970Xは論理64コアだから1プロセッサーグループに収まるが、3990Xは論理128コアだから2プロセッサーグループとOSから扱われる。そして困ったことに、基本的に1つのプロセスが使えるのは1プロセッサーグループのみだ。つまりアプリによっては、3990Xのコアの半分しか使えないこともあり得る。

 もちろんこれはアプリ側で対処することによりプロセッサーグループの壁を越え、論理128コアすべてを使用することが可能だ。ただ論理65コア以上の展開を見据えた設計になっているアプリはそう多くない。今回試した限りでは、CG系アプリでのみ確認できた。

タスクマネージャーで「詳細」を開き、あるプロセスに対し「関係の設定」を選択すると、どのコアで実行させるか決められることができるが、Threadripper 3990Xの場合は「プロセッサグループ」も追加される。グループ0ないし1のどちらかが選択され、同グループ内の論理64コア中から処理を受け持つコアが選択される
選ばれてない方のプロセッサーグループを選択すると、すべてのコアがノーチェックになっている。手動で「すべてのプロセッサ」にチェックを入れると、今までオンになっていた方が自動的にノーチェックになる

 そのため、AMDもThreadripper 3990Xを“史上最強のCPU”というストレートな押し出し方ではなく「猛烈な処理性能を求めるクリエイター向けCPU」とアピールしている。価格が高いので買う層もプロクリエイターに絞られるが、特にクロックよりもコア数が生み出す膨大な計算量がモノを言う作業のためのCPUといってよい。

AMDの資料より抜粋。Threadripper 3990Xのターゲットはコア数が生み出す圧倒的馬力が効く分野。有り体にいえばCGレンダリングやソフトのコンパイルといった作業だ

検証環境は?

 では今回の検証環境を紹介しよう。Threadripper 3990Xに比肩できるインテル製プラットフォームは高価すぎて入手できなかったため、今回はシンプルにThreadripper 3970Xと対決させる。プロセッサーグループの縛りがあるため、Threadripper 3990Xの方がベースクロックが低い分遅い状況が生まれることは容易に想像がつく。

 また、前回はメモリーは32GB、ストレージは1基のみで検証したが、今回はメモリー64GB&ストレージはPCI Express Gen4対応のSSD3基(OS用、素材用、結果書き込み用)という布陣で実施した。グラフィック(TITAN RTX)も“Studioドライバー”を使用している。

【検証環境】
CPU AMD「Threadripper 3990X」
(64コア/128スレッド、2.9~4.2GHz)
AMD「Threadripper 3970X」
(ES版、32コア/64スレッド、3.7~4.5GHz)
マザーボード ASRock「TRX40 Taichi」
(BIOS P1.30)
ビデオカード NVIDIA「TITAN RTX」
メモリー G.Skill F4-3200C16D-32GTZRX×2
(DDR4-3200、16GB×4)
ストレージ GIGABYTE「GP-ASM2NE6200TTTD」×3
(NVMe M.2 SSD、2TB)
電源ユニット Super Flower「Leadex Platinum 2000W」
(2000W、80Plus Platinum)
CPUクーラー CRYORIG「A80」
(簡易水冷、280mmラジエーター)
OS Windows10 Pro 64bit版(November 2019 Update)

CG系ベンチでは圧倒的に強い

 ではいつもの「CINEBENCH R20」で計算力を見てみよう。CINEBENCHはプロセッサーグループの縛りを受けない設計になっているため、問題なく論理128コアすべてを使ってくれた。

「CINEBENCH R20」のスコアー

 コア数が2倍だからスコアーも2倍……とはいかなかった。国内価格でざっくりと計算すると、Threadripper 3970X(実売約25万円)に対し、Threadripper 3990Xは価格が約2倍、しかしマルチスレッド性能のスコアーは1.43倍となるので、スコアーは伸びたものの費用対効果としてはパッとしない印象はある。しかし、1ソケットで完結し、定格運用でこれだけのスコアーがポンと出せるのは驚きと言える。

 続いては「blender」のベンチマーク速度も見てみよう。「barbershop_interior_cpu」を1フレームレンダリングする時間を計測した。

「blender」のレンダリング速度

 blenderも特別な設定をしなくても全コアをフルに使えている。Threadripper 3990Xを使えばレンダリング時間が1フレームにつき約1分短縮できた。当然アニメーション作品ともなれば、その差はどんどん広がる。まさに時間をお金で買いたい人のためのCPUであるといえる。

 ではここで消費電力もチェックしておきたい。電力計はラトックシステム「REX-BTWATTCH1」を使用し、システム起動10分後の安定値を“アイドル時”、前掲のblenderテスト実行時における最高値を“高負荷時”として計測した。

システム全体の消費電力

 HEDT向けハイエンドマザーにSSDやらメモリーも多めに載せているのでアイドル時の消費電力はかなり高い。だが高負荷時の消費電力はThreadripper 3990Xと3970Xに差といえるほどの差は観測できなかった。

 TDP280Wの枠にキッチリとはまるように電力やクロックを調整する設計の働きが見事に発揮されている。ビデオカード1枚&定格運用するならば、1KW級の電源ユニットを無理に用意しなくても良い、ということになる。

エンコード系では条件次第

 では動画エンコード系の結果もチェックしよう。まずは「Premiere Pro CC」を利用して作成した4K動画のシーケンス(約3分半)を「Media Encoder 2020」で1本の4K H.264動画にエンコードする。

 しかし、このテストは、1本だけエンコードさせてもCPUはほとんど使ってくれない。そこで同じシーケンスに対し微妙にビットレートを変えて並列エンコードさせてみた。エンコード設定はグラフにある通り、75/80/85/90Mbpsである。

「Media Encoder 2020」で1クリップずつH.264でエンコードさせた時のCPUの使われかた。負荷の強くかかっているコアが上半分(プロセッサーグループ0)に集中している
2本並列エンコードさせてもスカスカ感は変わらない
4本並列で動かすことで、ようやく片方のプロセッサーグループがほぼフルで使われるようになった
4本並列にエンコードさせるテストの様子。本来は1本の動画からYouTube用やBD用の動画を同時に出したい時に使う機能だが、今回はビットレートを少しだけ変えただけにとどめた。H.264しか試さなかったのは、H.265で同じことをやっても並列でエンコードしてくれなかったためである
「Media Encoder 2020」のエンコード時間。並列度とは同時にエンコードさせる動画の数を意味する。並列度4なら75~90Mbpsの動画4本が同時にエンコードされる

 まず注目したいのは並列度1、つまり動画を1回だけエンコードする時だ。Threadripper 3990Xがコア数半分のThreadripper 3970Xに負けているが、これは前掲のスクリーンショットにある通りCPUを使っていないから。コア数が少なくてもクロックが高いThreadripper 3970Xの方が高速になるのは当然の話だ。

 しかし、並列度2になるとその差は縮まり、並列度4になるとついに逆転する。  ただ並列度4でもCPUの半分程度は遊んでいる状態なので、プロセッサーグループの壁を越えるようなエンコーダーを使う、もしくはプロセッサーグループの壁のないOSを使わない限り、動画エンコード時間は劇的には改善しないのだ。

まとめ:Windowsが最大の壁

 今回の検証はここまでだ。CGレンダリング系ベンチではすさまじいパワーを発揮できたThreadripper 3990Xだが、プロセッサーグループの壁を越えられないエンコード系では3970Xに負けるという弱点が存在する。Threadripper 2990WXの時はCPUの設計も今ひとつ熟れてなかったためエンコードが遅かったが、3990Xでは純粋にOSが壁になっているのだ。Threadripper 3990Xはかなり使い手を選ぶCPUであることは間違いない。

 今回の検証で触れられなかったその他のアプリ(RAW現像など)の結果や、プロセッサーグループの壁のないLinux環境によるパフォーマンス比較は、追って稿を改めて解説するとしよう。乞うご期待だ。

●関連サイト

関連記事

あわせて読みたい

最新のニュース

アスキーストア人気ランキング

アクセスランキング

Like Ranking