Protože?
Když to spočítá za jednotku času více výpočtů, tak se ten výpočetní výkon prostě zvedl.
Ono se opravdu nedá jednoduše říct, že se výpočetní výkon zvedl. Je tam pár věci, které jdou proti sobě.
Sice roste počet instrukcí, které je procesor teoreticky schopný vykonat, ale není vůbec sranda toho dosáhnout. Ukrmit efektivně superskalární zpipelinovaný procesor je docela kumšt.
Ty větší registry ve spoustě případů ani nevyužijeme, protože se pracuje s čísly co se v pohodě vlezou i do 32b (floaty neřeším, ty jely jinudy už v 16b dobách). Máme těch registrů i víc, ale je to za cenu větších instrukcí. V kombinaci s dvojnásobně velkými ukazateli to znamená daleko větší tlak na propustnost paměti, která roste podstatně pomaleji než rychlost procesorů.
Počet instrukcí je hrubě matoucí číslo. Ty instrukce se můžou efektivně zpipelinovat tak, že i výpočet s podstatně více instrukcemi může trvat +- stejně nebo dokonce kratší dobu.
Ve výsledku se bez profilování neobejdeme.