クリエイティブ系アプリでの挙動をみる
ゲームが一通り終わったところで、クリエイティブ系アプリでの検証に入ろう。VRAMが16GBである点はクリエイターにも嬉しいからだ。
まずは「UL Procyon」を利用し実際に「Premiere Pro」を動かす“Video Editing Benchmark”を試してみよう。総合スコアーのほかに、そのスコアー算出の根拠となったテスト結果(エンコード時間)も比較する。スコアーは4本の動画のエンコード時間から算出されるが、単なる動画→動画のエンコードではなく、ぼかしや色調整など、基本的な調整処理を加えたクリップを繋いでいる。
総合スコアーで見ると、RTX 4070 Ti SUPERはRTX 4080とRTX 4070 Tiの中間だが、ほんの少しだけRTX 4070 Ti寄りに立っている。
VRAM搭載量的にRTX 4070 Ti SUPERに並ぶRTX 4060 Ti (16GB)は、RTX 4070 Ti SUPERの48%下あたりに位置している。恐らくRTX 4070 Ti SUPERの実売価格はRTX 4060 Ti (16GB)の2倍あたりだと推察できるため、価格なりのパフォーマンスになる、ということだ。
Video Editing Benchmarkで実施されるテスト4本の結果に目を向けると、処理時間の長いグループと短いグループに分かれるが、後者に関してはメモリーバス幅で処理時間が決まっているような印象を受ける。最も遅いのはRTX 4060 Ti (16GB)等の128bit幅使用の製品で、続いてRTX 4070 Ti等の192bit幅製品、最後にRTX 4070 Ti SUPER等の256bit幅製品となる。
RX 7800 XTに関してはメモリーバス幅が広いがGeForceの192bit幅製品より遅いという結果になった。この辺りはGPUアーキテクチャーの差というよりは、CUDAとOpenCLの違いといったところか。
GPUを使った動画エンコードといえば「DaVinci Resolve Studio」を避けて通るわけにはいかない。ここでは2本のテストを準備した。まず1本目はAV1エンコードの時間比較だ。
再生時間約2分の8K動画(ProRes 422HQ)を編集し、それを1本の8K AV1動画(CBR、80Mbps、High Quality)にエンコードする時間を計測した。エンコードに使用するパラメーターのうち、Presetに関してはVery SlowからVery Fastまで7段階あるうちの“Medium”および“Faster”(真ん中と速い方から2番目)の設定を選んだ。
RX 7800 XTでは全く同じ設定にはできないため、“Prefer Speed”“Prefer Quality”としているが、完全に同じ設定ではないため参考値として見ていただきたい。
NVEncがデュアルであることがRTX 4070 Ti SUPERの魅力ではあるが、Presetの設定を重くしてしまうとシングルとデュアルの差が縮まってしまう。RTX 4060とRTX 4080でMedium設定でのエンコード時間が10秒しか違わない。しかしFasterにするとデュアルNVEnc仕様のRTX 4070 Tiより上のGeForceが輝きはじめる。
2番目のテストはMagic Maskの処理時間比較だ。ここでは再生時間約16秒の4K動画に写っている被写体にマスクをかける処理の速さを比較する。最初のフレームで人物にマスクをかけ、そこから動画の最後まで被写体をトラッキングしつつ連続でマスク処理をする時間を計測した。
VRAM搭載量の等しいRTX 4080、RTX 4070 Ti SUPER、RTX 4060 Ti (16GB)を比較すると分かりやすい。このテストではVRAM使用量はせいぜい6GB弱といったところだが、GPUコアをAI処理に使うためGPU性能の差が処理時間の差に直結。同じソースでもRTX 4060 Ti (16GB)とRTX 4070 Ti SUPERとでは10秒以上違ってくる。RX 7800 XTもVRAM搭載量という点では同じだが、処理時間という観点ではGeForce勢に全く及ばない。
AI処理の話が出たので、AI関連のベンチもやってみよう。まずは「Topaz Video AI」に内蔵されたベンチマーク機能を使用する。入力動画の解像度を1920×1080ドットとし、ノイズ除去や拡大といった様々な効果のある処理をかけていった時のフレームレートを比較する。
Topaz Video AIのベンチマーク機能は20本近いテストをするため、比較的軽めのテスト3本の結果を抜粋した(省略したテスト結果の傾向に大きな変化はない)。基本的にGPUの格が高いほどフレームレートが高く、結果としてより短時間で処理を終了する。
今回のテストではRTX 4080が最も速く、RTX 4070 Ti SUPERはRTX 4070 Tiにやや寄りつつも両者の間に着地している。唯一のRadeon勢であるRX 7800 XTの性能はRTX 4060 Ti (16GB)相当となった。Topaz Video AIがTensorRTを利用しているためこうなったと考えるのが妥当であり、Radeonはもとから不利なテストではある。
最後に再びUL Procyonに登場いただき、AI推論処理のベンチマークである“AI Inference for Windows”を実施する。AI処理デバイスにはGPUを、計算精度はFP32を指定した。Radeonも参加させる関係上、APIは“WindowsML”としている。総合スコアーの他にテストごとの推論回数も比較する。
ここでもRTX 4070 Ti SUPERはRTX 4080とRTX 4070 Tiの間に着地。Inception V4やDeepLab V3といった処理でRTX 4070 Tiと大差ない結果に終わっている。RTX 4080相当のコアを使っているが少し性能を絞りすぎた結果、RTX 4070 Tiと差別化できない処理も出てきてしまった、という感じだろうか。
RX 7800 XTに関してはここでもRTX 4060 Ti (16GB)相当の評価となるが、唯一Real-ESRGANの推論回数だけはRTX 4070 Ti SUPERのすぐ下に迫っている点に注目したい。推論処理においてはGeForceが圧倒的である点は異論はないのだが、どんな処理でもGeForceが速いと言う訳ではないのだ。
RTX 4070 Tiの後釜たる実力はあるが
もう少し飛ばしてもよかったような気がする
以上でRTX 4070 Ti SUPERの検証は終了だ。前回のRTX 4070 SUPERもそうだったように、今回も既存モデルの検証データから逸脱せず、想定通りの所に収まった。
ただ、負荷が軽いテストにおいてはRTX 4070 Tiとの差が見いだしにくい結果が出ているので、もう少しTGPやSM数を盛ってもよかったのではないか。そう考えるとRTX 4070 Ti SUPERはやや強めのファクトリーOCを選ぶのが好適であるといえる。
また、VRAMやメモリーバス幅が強くなったことで、ゲームによっては4Kも狙えるようになった、という点は高く評価したい。ただ冒頭で述べた通り、価格の告知に問題があったことで、さらに割高感が出てしまった点に関してはNVIDIAはもっと慎重にやるべきだった。
RadeonがAFMFを実装したことで、DLSS FGという唯一無二だったフレーム生成機能という強みが消失してしまった事で、RTX 40シリーズの強みが相当消えてしまった、という点は前回のレビューから変わっていない。DLSS FGが使えるタイトルに関してはAFMFよりもDLSS FGの方がより良い結果を得られる(Cyberpunk 2077やStarfieldの結果を参照)ことは分かっているが、ゲームの対応が必要な時点でDLSS FGは圧倒的に不利だ。
NVIDIAはAFMFに相当するフレーム生成機能を生み出さなければ、ゲームでの優位性を失うことになりかねない。AFMFについてレイテンシーや画質などをもっと詳細に検証すべき部分はあるが、フレームレートが増えるという魅力において、ユーザーの心が動かないわけはない。今後のNVIDIAの奮闘に期待するとしよう。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります