週刊アスキー

  • Facebookアイコン
  • Xアイコン
  • RSSフィード

DLSS FGやAI処理のパフォーマンスは?GeForce RTX 4060 Ti(8GB)レビュー【後編】

2023年05月24日 08時00分更新

文● 加藤勝明(KTU) 編集● ジサトラユージ/ASCII

「V-Ray Benchmark」ではRTX 3080をやや上回る

 ここから先はクリエイティブ系アプリの検証となる。ここではCGレンダラー「V-Ray」をベースにした「V-Ray Benchmark」を試す。「V-Ray GPU CUDA」と「V-Ray GPU RTX」を使用し、スコアーを比較した。

V-Ray Benchmark:GTX 1060はRTコアを使わないGPU CUDAのみ実行

 スコアーの傾向としては前編で使用した3DMark、あるいは前編〜後編で散々見てきたゲームのフレームレートの力関係に近いものがある。即ちRTX 4060 Ti(8GB)のポジションはRTX 3070 TiとRTX 3060 Tiの間だが、ややRTX 3070 Ti寄りといったところ。RTX 2060のような旧世代RTXシリーズから見ると、RTX 4060 Ti(8GB)でも十分なパワーアップになるといえるだろう。

AV1エンコード速度を「DaVinci Resolve Studio」で検証

 動画エンコード性能は「DaVinci Resolve Studio」を使用する。ProRes 422HQベースの8Kと4K動画(それぞれ再生時間約2分)を編集し、それを1本の8Kないし4K動画(CBR、80Mbps、Faster、High Quality)にエンコードする時間を計測した。コーデックはH.265に加え、RTX 4070およびRTX 4060 Ti(8GB)はAV1も追加。エンコーダーは明示的に「NVIDIA」を指定している。

DaVinci Resolve Studio:NVEncを利用した8K/4K動画のエンコード時間

 RTX 4060 Ti(8GB)のNVEncは前編で解説した通り1基のみであるため、エンコード速度の上限は低めだが、それでも旧世代GeForceよりも確実に速い。RTX 3070 TiやRTX 3060 Tiに比べて、8K H.265のエンコードにおいてRTX 4060 Ti(8GB)が30秒程度エンコード時間を短縮している。

 AV1エンコードについては、RTX 4070とRTX 4060 Ti(8GB)の間に差はなく、8KのエンコードでもVRAM 8GBで特にエラーを出さずに終了した。ただ凝った作品を作ろうと考えているなら、よりVRAM搭載量の多いRTX 4070以上を選ぶべきだ。

AI系はRTX 3070 Tiに勝つこともある

 続いてはAI系のベンチマークとなる。まずは「UL Procyon」の「AI Inference benchmark for Windows」だ。AIでよく使われる処理6つ(MobileNetV3/ ResNet50/ Inception-V4/ DeepLab v3/ YOLOv3/ Real-ESRGAN)を実行させ、その推論時間からスコアーを算出するテストになる。

 今回の検証はGeForce系しかないため、AI Inference benchmark for Windowsを“TensorRT”“Float32”の設定で動かした際のスコアーを比較した。

UL Procyon:AI Inference benchmark for Windowsのスコアー

UL Procyon:ベンチマーク時に観測された平均推論時間。全部を載せると見辛いので4つの結果を抽出している

 このベンチではRTX 4060 Ti(8GB)が総合スコアーにおいてRTX 3070 Tiを上回る。ただ推論時間をチェックすると、Real-ESRGANではRTX 3070 Tiが優位に立つなど、RTX 4060 Ti(8GB)の格上(正確には2つ上)撃破には至らなかった。

 続いては「Topaz Video AI」のベンチマーク機能も利用して検証する。入力解像度を1920×1080ドットし、超解像処理“Artemis”、スローモーション処理“4X Slowmo”系を処理した時のフレームレートを比較した。

Topaz Video AI:超解像処理(Artemis)テストの平均フレームレート。2Xや4Xになるほど負荷が高い

Topaz Video AI:スローモーション処理(4X Slowmo)テストの平均フレームレート。ApolloやChronosは使用するAIモデルの違いを示す

 UL Procyonとは傾向が大きく変化し、RTX 4060 Ti(8GB)はArtemisではRTX 3060 Ti寄りのポジション、4X SlowmoではRTX 3060 Ti未満のポジションで終了した。Topaz Video AI側の改修によって性能が伸びる可能性はあるが、RTX 4060 Ti(8GB)のポジションはRTX 3060 Ti前後、と考えた方がよいだろう。

 最後に「Stable Diffusion」+「Automatic1111」における画像生成速度を検証する。学習モデルは「v2-1_768-ema-pruned」、cuDNN v8.6.0を導入している。またStable Diffusionの起動には“--xformers”も引数に含めた。

 テストに使用したプロンプトは以下の通りだ。サンプリングステップは50、出力解像度は768×767ドット、映像を2枚ずつ10回出力させている。これに要した時間から、1分あたり何枚の画像を生成できるか(img/min)を算出して比較した。

beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette

Stable Diffusion:768×768ドットの画像生成時間。GTX 1060 6GBでもStable Diffusionを実行することができたが、今回のテスト条件ではエラーも出る(しかし画像は生成される)

 ゲームではほぼ負けっぱなしだったRTX 2060が意外な粘りを見せたテストになったが、RTX 4060 Ti(8GB)はRTX 3070 Tiのやや下、というこれまでの観測通りの結果となった。正直なところこの程度のパフォーマンスであれば、AI処理目的であえてRTX 4060 Ti(8GB)を買うという選択はない。VRAMも8GBなので扱えるデータも限られているし、手持ち/中古のRTX 3070あたりでも同じ働きをしてくれるだろう。最新ゲームもやりつつ、さらにジェネレーティブAIで楽しみたいというなら、RTX 4060 Ti(8GB)を買うのは十分ありといえる。

上から下に展開する戦略の弱点

 RTX 4060 Ti(8GB)レビューの後編はこれにて終了となる。多くのシチュエーションにおいてRTX 3070 TiとRTX 3060 Tiの間に着地することが多く、買い換えターゲットはRTX 3060より下のGeForceとなる。

 特にRTX 20シリーズ、GTX 16シリーズからであれば劇的なパフォーマンス向上が期待できる。まだ人類には4Kプレイは早いという人なら、良いチョイスになるだろう。DLSS FGに対応するゲームはまだ少ないが、Unreal Engine 5にDLSS FGのプラグインが近日追加される等のニュースも考えれば、徐々に増えていくことが期待できる。

 ただ残念なのは、RTX 4090〜RTX 4070 Tiまでにあった、旧世代の格上GPUをなぎ倒すようなロマンがあまり期待できないGPUであることだ。NVIDIAにしてみれば60番台なのだから当たり前という話だが、DLSS FG以外はRTX 3070あたりで代用できることを考えると、食指の動きも鈍るというもの。消費電力の制約やコスト的な制約もあると思うのだが、RTX 4070も含めもう少し性能を上に設定し“新世代ならではのお得感”が欲しかった。

 このRTX 4060 Ti(8GB)の魅力が本当に開花するには、決定的なお買い得感が必要である。最安7万円〜では割高感が強く、価格設定の見直しを期待したい(出た早々無体な話だが)。あと1万円価格帯が下がれば、フルHDゲーミングの良い選択になれるポテンシャルはあるのだが……。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事