週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

DLSS FGやAI処理のパフォーマンスは?GeForce RTX 4060 Ti(8GB)レビュー【後編】

2023年05月24日 08時00分更新

文● 加藤勝明(KTU) 編集● ジサトラユージ/ASCII

「V-Ray Benchmark」ではRTX 3080をやや上回る

 ここから先はクリエイティブ系アプリの検証となる。ここではCGレンダラー「V-Ray」をベースにした「V-Ray Benchmark」を試す。「V-Ray GPU CUDA」と「V-Ray GPU RTX」を使用し、スコアーを比較した。

V-Ray Benchmark:GTX 1060はRTコアを使わないGPU CUDAのみ実行

 スコアーの傾向としては前編で使用した3DMark、あるいは前編〜後編で散々見てきたゲームのフレームレートの力関係に近いものがある。即ちRTX 4060 Ti(8GB)のポジションはRTX 3070 TiとRTX 3060 Tiの間だが、ややRTX 3070 Ti寄りといったところ。RTX 2060のような旧世代RTXシリーズから見ると、RTX 4060 Ti(8GB)でも十分なパワーアップになるといえるだろう。

AV1エンコード速度を「DaVinci Resolve Studio」で検証

 動画エンコード性能は「DaVinci Resolve Studio」を使用する。ProRes 422HQベースの8Kと4K動画(それぞれ再生時間約2分)を編集し、それを1本の8Kないし4K動画(CBR、80Mbps、Faster、High Quality)にエンコードする時間を計測した。コーデックはH.265に加え、RTX 4070およびRTX 4060 Ti(8GB)はAV1も追加。エンコーダーは明示的に「NVIDIA」を指定している。

DaVinci Resolve Studio:NVEncを利用した8K/4K動画のエンコード時間

 RTX 4060 Ti(8GB)のNVEncは前編で解説した通り1基のみであるため、エンコード速度の上限は低めだが、それでも旧世代GeForceよりも確実に速い。RTX 3070 TiやRTX 3060 Tiに比べて、8K H.265のエンコードにおいてRTX 4060 Ti(8GB)が30秒程度エンコード時間を短縮している。

 AV1エンコードについては、RTX 4070とRTX 4060 Ti(8GB)の間に差はなく、8KのエンコードでもVRAM 8GBで特にエラーを出さずに終了した。ただ凝った作品を作ろうと考えているなら、よりVRAM搭載量の多いRTX 4070以上を選ぶべきだ。

AI系はRTX 3070 Tiに勝つこともある

 続いてはAI系のベンチマークとなる。まずは「UL Procyon」の「AI Inference benchmark for Windows」だ。AIでよく使われる処理6つ(MobileNetV3/ ResNet50/ Inception-V4/ DeepLab v3/ YOLOv3/ Real-ESRGAN)を実行させ、その推論時間からスコアーを算出するテストになる。

 今回の検証はGeForce系しかないため、AI Inference benchmark for Windowsを“TensorRT”“Float32”の設定で動かした際のスコアーを比較した。

UL Procyon:AI Inference benchmark for Windowsのスコアー

UL Procyon:ベンチマーク時に観測された平均推論時間。全部を載せると見辛いので4つの結果を抽出している

 このベンチではRTX 4060 Ti(8GB)が総合スコアーにおいてRTX 3070 Tiを上回る。ただ推論時間をチェックすると、Real-ESRGANではRTX 3070 Tiが優位に立つなど、RTX 4060 Ti(8GB)の格上(正確には2つ上)撃破には至らなかった。

 続いては「Topaz Video AI」のベンチマーク機能も利用して検証する。入力解像度を1920×1080ドットし、超解像処理“Artemis”、スローモーション処理“4X Slowmo”系を処理した時のフレームレートを比較した。

Topaz Video AI:超解像処理(Artemis)テストの平均フレームレート。2Xや4Xになるほど負荷が高い

Topaz Video AI:スローモーション処理(4X Slowmo)テストの平均フレームレート。ApolloやChronosは使用するAIモデルの違いを示す

 UL Procyonとは傾向が大きく変化し、RTX 4060 Ti(8GB)はArtemisではRTX 3060 Ti寄りのポジション、4X SlowmoではRTX 3060 Ti未満のポジションで終了した。Topaz Video AI側の改修によって性能が伸びる可能性はあるが、RTX 4060 Ti(8GB)のポジションはRTX 3060 Ti前後、と考えた方がよいだろう。

 最後に「Stable Diffusion」+「Automatic1111」における画像生成速度を検証する。学習モデルは「v2-1_768-ema-pruned」、cuDNN v8.6.0を導入している。またStable Diffusionの起動には“--xformers”も引数に含めた。

 テストに使用したプロンプトは以下の通りだ。サンプリングステップは50、出力解像度は768×767ドット、映像を2枚ずつ10回出力させている。これに要した時間から、1分あたり何枚の画像を生成できるか(img/min)を算出して比較した。

beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette

Stable Diffusion:768×768ドットの画像生成時間。GTX 1060 6GBでもStable Diffusionを実行することができたが、今回のテスト条件ではエラーも出る(しかし画像は生成される)

 ゲームではほぼ負けっぱなしだったRTX 2060が意外な粘りを見せたテストになったが、RTX 4060 Ti(8GB)はRTX 3070 Tiのやや下、というこれまでの観測通りの結果となった。正直なところこの程度のパフォーマンスであれば、AI処理目的であえてRTX 4060 Ti(8GB)を買うという選択はない。VRAMも8GBなので扱えるデータも限られているし、手持ち/中古のRTX 3070あたりでも同じ働きをしてくれるだろう。最新ゲームもやりつつ、さらにジェネレーティブAIで楽しみたいというなら、RTX 4060 Ti(8GB)を買うのは十分ありといえる。

上から下に展開する戦略の弱点

 RTX 4060 Ti(8GB)レビューの後編はこれにて終了となる。多くのシチュエーションにおいてRTX 3070 TiとRTX 3060 Tiの間に着地することが多く、買い換えターゲットはRTX 3060より下のGeForceとなる。

 特にRTX 20シリーズ、GTX 16シリーズからであれば劇的なパフォーマンス向上が期待できる。まだ人類には4Kプレイは早いという人なら、良いチョイスになるだろう。DLSS FGに対応するゲームはまだ少ないが、Unreal Engine 5にDLSS FGのプラグインが近日追加される等のニュースも考えれば、徐々に増えていくことが期待できる。

 ただ残念なのは、RTX 4090〜RTX 4070 Tiまでにあった、旧世代の格上GPUをなぎ倒すようなロマンがあまり期待できないGPUであることだ。NVIDIAにしてみれば60番台なのだから当たり前という話だが、DLSS FG以外はRTX 3070あたりで代用できることを考えると、食指の動きも鈍るというもの。消費電力の制約やコスト的な制約もあると思うのだが、RTX 4070も含めもう少し性能を上に設定し“新世代ならではのお得感”が欲しかった。

 このRTX 4060 Ti(8GB)の魅力が本当に開花するには、決定的なお買い得感が必要である。最安7万円〜では割高感が強く、価格設定の見直しを期待したい(出た早々無体な話だが)。あと1万円価格帯が下がれば、フルHDゲーミングの良い選択になれるポテンシャルはあるのだが……。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

この連載の記事