第782回
Lunar LakeはNPUの動作周波数がアップし性能は2倍、ピーク性能は4倍に インテル CPUロードマップ
前回はLunar Lakeに搭載されるGPUで話が終わってしまったので、今週はコンピュート・タイルで残るNPUの話となる。
Myriad XベースのVPUを改良したNPUを搭載
Lunar Lakeに搭載されるNPUは、Meteor Lakeに搭載されたMyriad Xベースのエンジンのさらに改良型となる。Meteor Lake世代のNPUの話は連載740回で紹介したが、基本はインテルが2016年に買収したMovidiusのMyriadシリーズVPUとなる。
このMyriadシリーズはインテル買収前から製品が出荷されており、インテルはこの第3世代に相当するMyriad XベースのVPUを改良したうえで、エンジン2つ搭載することで11.5TOPSの処理性能を実現している。要するにエンジン1つあたり5.75TOPSという計算だ。ちなみにこの11.5TOPSの数字の根拠がこちらである。
ではそのLunar Lakeに搭載されたNPU 4の構成は? というのが下の画像だ。エンジンの数が2→6で3倍に強化された格好となる。
NCE(Neural Compute Engine)はNPU 3の世代で導入されたものである。もともとのMyriad XはVPU、つまり映像を入力するとAIを利用して処理を行ない、その結果を返すような仕組みになっていたわけだが、NPU 3世代ではVPUを利用しなくてもISPが搭載されているので、ISPを使えばよい。
このため画像処理関連の機能は全部落とされ、その代わりに画像処理以外のネットワークも動作させられる、汎用的なAI処理が可能な仕組みに改められた。これがNCEになるのだが、現状でNCEは同時に1つのネットワークしか扱えない。
したがって、Meteor Lakeでは1つのNCEの下のMACユニットを倍増させるのではなく、1つのNCEはMyriad Xと同規模のMACユニットに留め、その代わりにNCEを2つ搭載するかたちになっている。
これにより、同時に2つのネットワークを並行して処理できるし、1つだけでよければ2つのNCEで処理を分担するようなことも可能になるわけだ。Lunar LakeのNPU 4ではNCEが6つになった、ということは要するに最大で6種類のネットワークが同時に実行可能だし、あるいは2つ/3つのネットワークを同時に実行することも可能である。
ただ現時点では、こうした複数のネットワークの実行時に、QoS的な処理が可能かどうかは明らかではない。例えばA/B/Cの3種類のネットワークがあったとして、A:B:C=2:2:2というように均等に割り振ることしかできないのか、それとも例えばA:B:C=4:1:1や3:2:1といった具合に、処理能力に重みを付ける形で分散させられるのかまでは現状定かではない。このあたりの割り振りはNPUというよりもCPU側処理の作業という気もするので、あるいは将来的には可能になるのかもしれないが。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります