Fórum Root.cz
Hlavní témata => Hardware => Téma založeno: Honza1Ubuntu 09. 04. 2017, 20:29:08
-
Zdravim
Tak jsem parkrat uvazoval nad otazkou, co je nejvyhodnejsi pouzit pro vypocetni vykon (matematicke modelovani, numericke reseni, zpracovani dat, vizualizace, zpracovani obrazovych dat) k pomeru jak porizovaci cena, tak spotreba elektriny. Vzhledem k povaze zadani je paralelizace ulohy na co nejvic jader naprostou nutnosti.
1. klasicke CPU. Maximum u beznych CPU je 8 jader-16 vlaken. Vypocetni vykon desitky-stovky GFLOPS. Kdyz se ale spocte cena porizovaci a spotreba energie na 1 GFLOP, tak dobry pomer to neni.
2. GPU (CUDA). GPU maji mnoho jader (nejnovejsi okolo 3800, s fregvenci prez 1 GHZ). Vypocetni vykon je nekolik TFLOPS, spotreba energie a porizovaci cena na 1 GFLOP je lepsi nez u CPU. Pro vypocty na GPU je nutnost jineho programovaciho postupu.
3. Smarphone, ARM procesory. Vykon nic moc, ale pomer spotreba energie-vypocetni vykon je lepsi. Naopak prizovaci cena vs. vykon je drazsi. A otazkou je, jak zaizeni zvlada plnou zatez nonstop. A taky otazkou je, jak tam dostat Linux. Vyhodna je mobilita a odolnost vuci pohybu, narozdil od HDD.
4. Bitcoin miner - pri vykonu 5 THASH/s a spotrebe 1200 W je pomer spotreba-vykon velmi dobry, napodobne s porizovaci cenou. Ale vypocetni jednotka ma uplne jinou sadu instrukci, takze kdovi, jestli by sla pouzit, jako PC-server s Linuxem. Spis ne.
5. PS4 - vypocetni vykon GPU jeskutecne obrovsky, lepsi nez dosti silne PC. Pomer spotreba-vykon i cena-vykon je vyhodny. Ale otazkou je, jestli by tam vubec sel dostat Linux jakozto operacni system, a jestl by bylo mozne vyuziti jako PC-Server.
Napada vas neco jineho ?
-
a co chceš počítat?
-
Asi CUDA.
-
4. Bitcoin miner - pri vykonu 5 THASH/s a spotrebe 1200 W je pomer spotreba-vykon velmi dobry, napodobne s porizovaci cenou. Ale vypocetni jednotka ma uplne jinou sadu instrukci, takze kdovi, jestli by sla pouzit, jako PC-server s Linuxem. Spis ne.
Dnešné minery sú všetko ASIC (https://cs.wikipedia.org/wiki/Z%C3%A1kaznick%C3%BD_integrovan%C3%BD_obvod) - čip je jednoúčelový, navrhnutý na počítanie hashov danej kryptomeny. Možno by šlo zohnať nejaký starší FPGA (https://cs.wikipedia.org/wiki/Programovateln%C3%A9_hradlov%C3%A9_pole) a preprogramovať ho, ale ten určite nebude mať výkon v THash/s.
IMHO zo všetkých týchto možností je CUDA najschodnejšia.
-
PS4 má low-end grafiku, takže to zase tak dobré nebude. Je to zabalený NB.
-
Pokud budeš počítat s floating point (asi ano), tak bude u *coin minerů celkem problém. ARM by mohlo jít, ale asi ne formě smartphonů. Třeba desky hardkernel odroid?
Jinak asi také doporučím CUDA, nebude to sice cool hackeřina, ale bude to rozumé.
-
a co chceš počítat?
Numericke modelovani, operace floating point. Mam vlastni napsane programy ve Fortranu i Octave, i vim o pokrocilejsich, jako napr. WRF, GCM. Tady bude problem floating point.
Dalsi odvetvi je vytvareni panorama z velkeho mnozstvi fotografii, hledani zmeny v zornem poli. Dale pak zpracovani videa (vytvareni ze segvence obrazku, konvert formatu).
Treti vec je parsing velkeho mnozstvi textu, html.
-
Zdravim
Tak jsem parkrat uvazoval nad otazkou, co je nejvyhodnejsi pouzit pro vypocetni vykon (matematicke modelovani, numericke reseni, zpracovani dat, vizualizace, zpracovani obrazovych dat) k pomeru jak porizovaci cena, tak spotreba elektriny. Vzhledem k povaze zadani je paralelizace ulohy na co nejvic jader naprostou nutnosti.
1. klasicke CPU. Maximum u beznych CPU je 8 jader-16 vlaken. Vypocetni vykon desitky-stovky GFLOPS. Kdyz se ale spocte cena porizovaci a spotreba energie na 1 GFLOP, tak dobry pomer to neni.
2. GPU (CUDA). GPU maji mnoho jader (nejnovejsi okolo 3800, s fregvenci prez 1 GHZ). Vypocetni vykon je nekolik TFLOPS, spotreba energie a porizovaci cena na 1 GFLOP je lepsi nez u CPU. Pro vypocty na GPU je nutnost jineho programovaciho postupu.
3. Smarphone, ARM procesory. Vykon nic moc, ale pomer spotreba energie-vypocetni vykon je lepsi. Naopak prizovaci cena vs. vykon je drazsi. A otazkou je, jak zaizeni zvlada plnou zatez nonstop. A taky otazkou je, jak tam dostat Linux. Vyhodna je mobilita a odolnost vuci pohybu, narozdil od HDD.
4. Bitcoin miner - pri vykonu 5 THASH/s a spotrebe 1200 W je pomer spotreba-vykon velmi dobry, napodobne s porizovaci cenou. Ale vypocetni jednotka ma uplne jinou sadu instrukci, takze kdovi, jestli by sla pouzit, jako PC-server s Linuxem. Spis ne.
5. PS4 - vypocetni vykon GPU jeskutecne obrovsky, lepsi nez dosti silne PC. Pomer spotreba-vykon i cena-vykon je vyhodny. Ale otazkou je, jestli by tam vubec sel dostat Linux jakozto operacni system, a jestl by bylo mozne vyuziti jako PC-Server.
Napada vas neco jineho ?
Podle toho, na co přesně. Relativně levný s hodně jádry je nový Ryzen, ale má zkriplené AVX. Výpočetně dobré jsou jinak Xeony pro HPC s AVX512. Jinak ale asi fakt nějaké dobré GPU a napsat to v OpenCL, člověk to píše prakticky v C a třeba na Radeonech to vymáčkne vysoký výkon.
-
6. TPU https://fossbytes.com/googles-home-made-ai-processor-is-30x-faster-than-cpus-and-gpus/
-
Pořád je to takové dost obecné ohledně toho, co chceš počítat.
Dokážeš si hotspoty ručně zvektorizovat? → CPU s dobrými vektory (začíná se objevovat AVX512)
Je tam dobrý datový paralelismus a umí to tvé knihovny nebo si to napíšeš sám? → CUDA
Je tam dobrý paralelismus větších celků? → Xeoon Phi
FPGA, TPU a spol. jsou bohužel už příliš specializované, pro běžné výpočty to asi nepůjde použít/naprogramovat rozumně efektivně.
Bitcoin ASIC je pak úplně mimo, protože to umí jen a pouze double-SHA-256, a to s posledními optimalizacemi (ASICBoost a spol.) ještě k tomu jenom přes konkrétní bloky přesně tak, jak jsou v Merkle stromu.
-
Na FP odjakživa DSP. Třeba C667.
http://www.ti.com/lsds/ti/processors/dsp/c6000_dsp/c66x/overview.page
8x float point DSP@1,4GHz, Linux
Jenom je otázka, kde s tím sehnat železo, pokud si je nechceš sám stavět...
-
Na FP odjakživa DSP. Třeba C667.
http://www.ti.com/lsds/ti/processors/dsp/c6000_dsp/c66x/overview.page
8x float point DSP@1,4GHz, Linux
Jenom je otázka, kde s tím sehnat železo, pokud si je nechceš sám stavět...
Píší tam, že to má mj. i PCIe. Měla by tedy být někde k mání i osazená deska s tímto rozhraním jako zásuvný modul do PC.
-
Na to bych moc nesázel. Je otázka, jestli to umí fungovat jako endpoint a druhá otázka je ohledně Linuxu, jestli s tím počítá. Pamatuju se, jak jsme ještě na jádře 2.4 nebo 2.6. rozcházeli USB Device, protože HW řadič sice byl, ale jádro se neumělo chovat jako device...
Každopádně i jako autonomní deska na gigové LANce by to krásně počítalo...
Jenom je fakt otázka, co tazatel tím počítáním myslel. Objem dat, jestli to chce real time, nebo do týdne,...