Jaký stroj na inferenci AI?

PCnity

  • *****
  • 710
    • Zobrazit profil
    • E-mail
Re:Jaký stroj na inferenci AI?
« Odpověď #15 kdy: Dnes v 15:31:19 »

Zde tvrdi (a asi je videt i skrze prilozene vypisy), ze je to Gen5x4x2

Takze RDMA to v objemu 200Gb/s opravdu da, takze jeden port vytizit fakt jde.

Dik za objasnenie, to posledne x2 mi chybalo v obraze.


ja.

  • ****
  • 385
    • Zobrazit profil
    • E-mail
Re:Jaký stroj na inferenci AI?
« Odpověď #16 kdy: Dnes v 15:40:22 »
Z pohladu AMD je to notebookovy (a minipc) APU (HP ZBook Ultra G1a). Asi sa neratalo s potrebou viac liniek.

Liniek je relativne dost, ale bifurbikovanych. Nema ziadne 16x, kopec z nich je minutych na USB (je to SoC, USB je sucastou). Narychlo vygooglene rozdelenie liniek: https://tpucdn.com/cpu-specs/images/connectivity/amd-mobile-fp8-strix.png

Re:Jaký stroj na inferenci AI?
« Odpověď #17 kdy: Dnes v 21:07:59 »
a6b:
Do 16GB VRAM se vejde jazykový model o velikost asi 12GB, podle kvantizace (4-8 bit) 20B-10B parametrů. Odpověď se bude vypisovat velmi rychle. Pokud část poběží v RAM, bude to dost pomalé. Záleží na přenosové rychlosti paměti.



tak tech 70k uz se blizi 100k za dgx spark, jdu hledat jak jsou vykonove porovnatelne.

Podle různých testů jsou srovnatelně výkonné.

Koukněte sem:
https://www.youtube.com/watch?v=Pww8rIzr1pg


Tady ten člověk testuje spoustu věcí, můžete se inspirovat:
https://www.youtube.com/@DigitalSpaceport/videos

a6b

  • ***
  • 191
    • Zobrazit profil
    • E-mail
Re:Jaký stroj na inferenci AI?
« Odpověď #18 kdy: Dnes v 21:18:03 »
a6b:
Do 16GB VRAM se vejde jazykový model o velikost asi 12GB, podle kvantizace (4-8 bit) 20B-10B parametrů. Odpověď se bude vypisovat velmi rychle. Pokud část poběží v RAM, bude to dost pomalé. Záleží na přenosové rychlosti paměti.



tak tech 70k uz se blizi 100k za dgx spark, jdu hledat jak jsou vykonove porovnatelne.

Podle různých testů jsou srovnatelně výkonné.

Koukněte sem:
https://www.youtube.com/watch?v=Pww8rIzr1pg


Tady ten člověk testuje spoustu věcí, můžete se inspirovat:
https://www.youtube.com/@DigitalSpaceport/videos

asi pujdu do te grafarny rtx 5080 s 16gb a vrazim to domaciho stolniho kompu.
taky chcu pouzivat cuda.

po dlouhe dobe je nejaka pekna designova vec jako dgx spark od jine firmy nez apple, ale ty prachy jsou uz moc.

Re:Jaký stroj na inferenci AI?
« Odpověď #19 kdy: Dnes v 21:48:50 »
Dejte si pozor na velikost karty, aby se vešla do skříně a zkontrolujte si, jestli máte dostatečně výkonný napájecí zdroj.


a6b

  • ***
  • 191
    • Zobrazit profil
    • E-mail
Re:Jaký stroj na inferenci AI?
« Odpověď #20 kdy: Dnes v 21:53:35 »
Dejte si pozor na velikost karty, aby se vešla do skříně a zkontrolujte si, jestli máte dostatečně výkonný napájecí zdroj.

jo to jo, dik za pripomenuti, my uz jsme drive kupovali obludnou skrin a zbytecne predimenzovany zdroj, takze
to asi bude fungovat.