OpenCL je generické API pro CPU i GPU. Na CPU smysl nemá, to už je lepší psát přímo, například AVX512 výkon zvyšuje brutálně, zvlášť když se použije ICC. GPU může být u některých úloh značně rychlejší, ale má-li vlastní RAM, je třeba počítat s latencí (podle rychlosti směrnice). Obecně je většinou nejlepší použít prostě nějakou knihovnu, která je optimalizovaná a použije nejrychlejší implementaci podle dostupné technologie (AVX2/512 apod.).