コアレイアウトの変化はレイテンシーに影響するか
最後に前回時間の都合で記載できなかったこまごまとした検証結果を紹介しよう。まずは、コア間のレイテンシーの検証だ。
コアのレイアウトが大きく変化したCore Ultra 200Sシリーズにおいて、コア間レイテンシーは前世代と比較して変わったのだろうか? 今回はRyzen 9000シリーズで検証(https://ascii.jp/elem/000/004/224/4224364/)した時と同じ、「core-to-core-latency(https://github.com/nviennot/core-to-core-latency)」を利用し、ヒートマップを生成した。
こうして見るとコアの構造がレイテンシーによく表れていることがわかる。Core Ultra 9 285Kの場合、左上と右下にレイテンシーの短いブロックがあるが、これはEコアのクラスター4基に相当する部分だ。Eコア同士はL2キャッシュで連結されているため非常に低レイテンシー(およそ15~21ns)で動作する。
一方、Pコア同士は36ns程度に長くなるが、中央付近のPコアは他のコアに対し微妙に低レイテンシー(26~32ns)となる。検証したCPUのサンプル数が少ないためまだ仮説に過ぎないが、Core Ultra 200Sシリーズではこの中央付近のコアに負荷を集めるという工夫もしている可能性がある。
また、PコアからEコアのレイテンシーは36~41nsと、Pコア同士よりも若干レイテンシーが増加している。
一方、Core i9-14900Kのヒートマップでは、左上の大きなPコア地帯(SMTで増えた論理コアも含まれる)と、右→右下→下一帯を占めるEコア地帯で構成され、レイテンシーの出方が完全に異なる。
Pコア同士だと31~36ns、同コア内の論理コア同士だと5ns程度(時々0nsのペアが出現するが、なぜこうなるかは不明)。一方Eコアは特にレイテンシーの長いエリア(41~52ns)と、そうでもないエリア(31~41ns)の2種類がある。
この結果から、PコアとEコアを固めて配置するコアトポロジーにおいて、極端にレイテンシーが増えてしまう部分ができてしまうことが確認できた。レイテンシーを平均化するという観点では、Core Ultra 200Sシリーズの一見奇妙な配置(PP+EEEE+EEEE+PPが基本単位)は、実に合理的と考えられる。
電源プラン“バランス”で運用すると?
続いて、OSの電源プランを異なる設定で試した場合の性能も見てみた。まずはインテルが推奨してきた“高パフォーマンス”電源プランと、Windows 11のデフォルトである“バランス”電源プランとの違いだ。ここではCINEBENCH 2024と「UL Procyon」Photo Editing Benchmark、FF14ベンチの3つで比較する。なお、CPUはCore Ultra 9 285Kに限定した。
CINEBENCH 2024のように、CPU負荷が高い状況においては電源プラン“バランス”でも十分なパフォーマンスは発揮できるが、負荷の軽いクリエイティブ系アプリやゲームにおいては、電源プラン“高パフォーマンス”でないと高スコアーが発揮できない。
今回のレビューにおいて、Core Ultra 200Sシリーズのみ高パフォーマンスにした理由は、Windows 11側の問題でバランスだと本来意図した性能が出ないからだが、これが今後“バランス”でも相応のパフォーマンスが出るようになって初めて、Ryzen 9000シリーズやCoreプロセッサー(第14世代)との対等な比較ができるようになるだろう(つまり、筆者の補修確定である)。
NPUはちゃんと動作する
Core Ultra 200Sシリーズに搭載されているNPUはちゃんと動作するのかも検証してみたい。音声編集アプリ「Audacity」にはOpenVINOを用いたプラグイン「OpenVINO AI effects for Audacity(https://www.audacityteam.org/blog/openvino-ai-effects/)」が存在する。
これを利用しテキストからサウンド(ドラムパート)を生成する時間を計測した。OpenVINOプラグインでは処理をCPU/内蔵GPU(Intel Graphics)/NPUのどれかに割り振ることができる。今回は内蔵GPUとNPUに割り振った際の時間を比較した。学習モデルはプラグイン導入時に選択されるデフォルトモデルとし、演算精度はINT8、生成する音楽は30秒とした。
AI専用のNPUだからさぞ高速……と思いきや、全部内蔵GPUに割り振ったほうが短時間で生成できるという結果に。Core Ultra 200SシリーズのNPUはMeteor Lakeと同じ“NPU 3”であり、パフォーマンスにおいてもCopilot+の要件を満たすには至らない。とりあえず使えるレベルの性能しかないのだ。
そもそもエンスージアスト向けのCPUに貧弱なNPUが要るのか? という議論もあるが、Meteor LakeやLunar Lake搭載のノートPCがなくても、Core Ultra 200Sシリーズを使えばNPUを使ったアプリの開発や動作確認ができる、というのは非常に大きな意味がある。インテルはOpenVINOの開発に相当のリソースを割いており、Core Ultra 200Sシリーズへの搭載は将来への種蒔きのようなものだと筆者は考えている。
ワットパフォーマンスは優秀だが
ゲームのフレームレートは微妙
以上でCore Ultra 200Sシリーズの検証はひとまず終了だ。今回は締め切りギリギリになってパフォーマンスにインパクトを与える情報(電源プランやAPOについて)が出る、パーツ納期のせいでメモリーモジュールを全環境で統一できなかったなど、完璧なパウンド・フォー・パウンドの比較にはならなかったのは残念だ。しかしBIOSの出来(DTTがないなど)や全体的な動作の雰囲気から、もう少し熟成を待たなければしっかりとした検証にならないな、という感じだった。
こうした言いわけはさておくと、今回のCore Ultra 200Sシリーズの性能は、消費電力やシングルスレッド性能(CINEBENCH 2024)などに光る部分はあったが、肝心のゲームにおけるパフォーマンスはパッとしない。SMTや電力無制限といった今まで性能を稼いでいた手法を封じられた割にはよくやっていると言えなくもないが、ならば価格はもう少し下がってくれないと、満足感が得られない(そしてZ890マザーボードは全体的に高価だ)。
今後Core Ultra 200SシリーズのパフォーマンスがWindowsやBIOSのチューニングで是正される事を期待したい。そのたびに筆者はまた検証を重ねていくことだろう。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります