Prý Geekbench umí už testovat i NPU nebo AI. Tak bych to chtěl vyzkoušet a zajímá mě, ale vůbec metodika testování a co to vůbec testuje a co to testuje, a zda to i běží na počítačích bez AI v nějakém emulaci něco jako softwarový 3D rendering.
Uvítal bych i nějaký článek který uvede to problematiky testování/výkonových parametrů a způsobů testování.
Měří to inferenci ? Je pravda, že NPU slouží jen k inferenci a k ničemu jinému se nedají použít? Dá se NPU nasimulovat přes GPU nebo procesorem? Jaké to bude mít nevýhody?
Používá to nějaký wrapper zLUDA (nvidia->any), nebo openvino, ROCM atd.
Běží to fallbackem na procesoru?
Dokáže to benchmarkknout llammap.cpp?
Má to nějaké systémové požadavky jako přítomnost x GB (V)RAM nebo přítomnost GPU jedné preferované značky?
*JE u integrovaných grafik je pravda, že generativní AI bude plus mínus stejně rychlá na iGPU a CPU? Argument je ,že bottleneck je integrovaná RAM.