第413回

DLSS FGやAI処理のパフォーマンスは？GeForce RTX 4060 Ti（8GB）レビュー【後編】

2023年05月24日 08時00分更新

文● 加藤勝明（KTU）　編集● ジサトラユージ／ASCII

「V-Ray Benchmark」ではRTX 3080をやや上回る

　ここから先はクリエイティブ系アプリの検証となる。ここではCGレンダラー「V-Ray」をベースにした「V-Ray Benchmark」を試す。「V-Ray GPU CUDA」と「V-Ray GPU RTX」を使用し、スコアーを比較した。

V-Ray Benchmark：GTX 1060はRTコアを使わないGPU CUDAのみ実行

　スコアーの傾向としては前編で使用した3DMark、あるいは前編〜後編で散々見てきたゲームのフレームレートの力関係に近いものがある。即ちRTX 4060 Ti（8GB）のポジションはRTX 3070 TiとRTX 3060 Tiの間だが、ややRTX 3070 Ti寄りといったところ。RTX 2060のような旧世代RTXシリーズから見ると、RTX 4060 Ti（8GB）でも十分なパワーアップになるといえるだろう。

AV1エンコード速度を「DaVinci Resolve Studio」で検証

　動画エンコード性能は「DaVinci Resolve Studio」を使用する。ProRes 422HQベースの8Kと4K動画（それぞれ再生時間約2分）を編集し、それを1本の8Kないし4K動画（CBR、80Mbps、Faster、High Quality）にエンコードする時間を計測した。コーデックはH.265に加え、RTX 4070およびRTX 4060 Ti（8GB）はAV1も追加。エンコーダーは明示的に「NVIDIA」を指定している。

DaVinci Resolve Studio：NVEncを利用した8K/4K動画のエンコード時間

　RTX 4060 Ti（8GB）のNVEncは前編で解説した通り1基のみであるため、エンコード速度の上限は低めだが、それでも旧世代GeForceよりも確実に速い。RTX 3070 TiやRTX 3060 Tiに比べて、8K H.265のエンコードにおいてRTX 4060 Ti（8GB）が30秒程度エンコード時間を短縮している。

　AV1エンコードについては、RTX 4070とRTX 4060 Ti（8GB）の間に差はなく、8KのエンコードでもVRAM 8GBで特にエラーを出さずに終了した。ただ凝った作品を作ろうと考えているなら、よりVRAM搭載量の多いRTX 4070以上を選ぶべきだ。

AI系はRTX 3070 Tiに勝つこともある

　続いてはAI系のベンチマークとなる。まずは「UL Procyon」の「AI Inference benchmark for Windows」だ。AIでよく使われる処理6つ（MobileNetV3/ ResNet50/ Inception-V4/ DeepLab v3/ YOLOv3/ Real-ESRGAN）を実行させ、その推論時間からスコアーを算出するテストになる。

　今回の検証はGeForce系しかないため、AI Inference benchmark for Windowsを“TensorRT”“Float32”の設定で動かした際のスコアーを比較した。

UL Procyon：AI Inference benchmark for Windowsのスコアー

UL Procyon：ベンチマーク時に観測された平均推論時間。全部を載せると見辛いので4つの結果を抽出している

　このベンチではRTX 4060 Ti（8GB）が総合スコアーにおいてRTX 3070 Tiを上回る。ただ推論時間をチェックすると、Real-ESRGANではRTX 3070 Tiが優位に立つなど、RTX 4060 Ti（8GB）の格上（正確には2つ上）撃破には至らなかった。

　続いては「Topaz Video AI」のベンチマーク機能も利用して検証する。入力解像度を1920×1080ドットし、超解像処理“Artemis”、スローモーション処理“4X Slowmo”系を処理した時のフレームレートを比較した。

Topaz Video AI：超解像処理（Artemis）テストの平均フレームレート。2Xや4Xになるほど負荷が高い

Topaz Video AI：スローモーション処理（4X Slowmo）テストの平均フレームレート。ApolloやChronosは使用するAIモデルの違いを示す

　UL Procyonとは傾向が大きく変化し、RTX 4060 Ti（8GB）はArtemisではRTX 3060 Ti寄りのポジション、4X SlowmoではRTX 3060 Ti未満のポジションで終了した。Topaz Video AI側の改修によって性能が伸びる可能性はあるが、RTX 4060 Ti（8GB）のポジションはRTX 3060 Ti前後、と考えた方がよいだろう。

　最後に「Stable Diffusion」＋「Automatic1111」における画像生成速度を検証する。学習モデルは「v2-1_768-ema-pruned」、cuDNN v8.6.0を導入している。またStable Diffusionの起動には“--xformers”も引数に含めた。

　テストに使用したプロンプトは以下の通りだ。サンプリングステップは50、出力解像度は768×767ドット、映像を2枚ずつ10回出力させている。これに要した時間から、1分あたり何枚の画像を生成できるか（img/min）を算出して比較した。

beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette

Stable Diffusion：768×768ドットの画像生成時間。GTX 1060 6GBでもStable Diffusionを実行することができたが、今回のテスト条件ではエラーも出る（しかし画像は生成される）

　ゲームではほぼ負けっぱなしだったRTX 2060が意外な粘りを見せたテストになったが、RTX 4060 Ti（8GB）はRTX 3070 Tiのやや下、というこれまでの観測通りの結果となった。正直なところこの程度のパフォーマンスであれば、AI処理目的であえてRTX 4060 Ti（8GB）を買うという選択はない。VRAMも8GBなので扱えるデータも限られているし、手持ち/中古のRTX 3070あたりでも同じ働きをしてくれるだろう。最新ゲームもやりつつ、さらにジェネレーティブAIで楽しみたいというなら、RTX 4060 Ti（8GB）を買うのは十分ありといえる。

上から下に展開する戦略の弱点

　RTX 4060 Ti（8GB）レビューの後編はこれにて終了となる。多くのシチュエーションにおいてRTX 3070 TiとRTX 3060 Tiの間に着地することが多く、買い換えターゲットはRTX 3060より下のGeForceとなる。

　特にRTX 20シリーズ、GTX 16シリーズからであれば劇的なパフォーマンス向上が期待できる。まだ人類には4Kプレイは早いという人なら、良いチョイスになるだろう。DLSS FGに対応するゲームはまだ少ないが、Unreal Engine 5にDLSS FGのプラグインが近日追加される等のニュースも考えれば、徐々に増えていくことが期待できる。

　ただ残念なのは、RTX 4090〜RTX 4070 Tiまでにあった、旧世代の格上GPUをなぎ倒すようなロマンがあまり期待できないGPUであることだ。NVIDIAにしてみれば60番台なのだから当たり前という話だが、DLSS FG以外はRTX 3070あたりで代用できることを考えると、食指の動きも鈍るというもの。消費電力の制約やコスト的な制約もあると思うのだが、RTX 4070も含めもう少し性能を上に設定し“新世代ならではのお得感”が欲しかった。

　このRTX 4060 Ti（8GB）の魅力が本当に開花するには、決定的なお買い得感が必要である。最安7万円〜では割高感が強く、価格設定の見直しを期待したい（出た早々無体な話だが）。あと1万円価格帯が下がれば、フルHDゲーミングの良い選択になれるポテンシャルはあるのだが……。

■関連サイト