Na amazonu na tohle používáme ec2-p3, občas se spotově použije 24xlarge (asi 800 Kč na hodinu) na velké trénování. Prakticky ale věšina modelů vzniká na dvousocketových xeonech, protože to je k dispozici a ne vždy je tolik dat, aby ten rozdíl byl tak obrovský a nešlo přes noc počkat.
Paradoxně se ukazuje, že pro domácí potřeby vypadá nejvhodněji počítač od apple s m1/m2 procesorem, už to tady vývojáři kolem mě mají a reálně používají, sice to je pořád pomalejší než na xeon serverech, ale pro většinu potřeb to je dobře použitelné, hlavně na ty začátky.
Pokud s tím začínáš, tak nemusíš pracovat s terebajkty vstupních dat, ale s něčím menším a můžeš na některé úkony použít již natrénovaný model, nepotřebuješ inkrementálně trénovat každý den a můžeš si občas pár hodin počkat.