Aké mini PC pre lokálny ChatOllama webserver?

My name: · « **kdy:** 17. 09. 2024, 08:37:56 »

Aké _mini_ PC pre lokálny ollama chat webserver aby zvládal veľké modely (16+ GB) s rýchlosťou aspoň 20 t/s ? Dá sa to vôbec bez dedikovanej grafiky? Či počkať na AMD AI procáky?

Reklama

ogdru6jahad · « **Odpověď #1 kdy:** 17. 09. 2024, 09:25:19 »

https://hostkey.com/documentation/technical/gpu/ollama/

ogdru6jahad · « **Odpověď #2 kdy:** 17. 09. 2024, 09:25:55 »

To ensure acceptable performance, the size of the model should be at least two times smaller than the amount of RAM available on the server and ⅔ of the available video memory on the GPU. For example, a model of size 8GB requires 16GB of RAM and 12GB of video memory on the GPU.

_Tomáš_ · « **Odpověď #3 kdy:** 17. 09. 2024, 10:38:25 »

ač se ti to nebude líbit, znám jediné řešení https://www.apple.com/cz/mac-mini/, cca 50 - 60 tis za 32 GB GPU RAM.

Tady máš nějaké měření na 7B modelu https://github.com/ggerganov/llama.cpp/discussions/4167.

Neznám v současné době efektivnější řešení (práce / cena / výkon) na lokální chat aplikace. Sami to ve spoustě instancí používáme a máme to součástí i demo clusteru, s kterým chodíme za zákazníky přímo.

Doma jsem zkoušel postavit mini pc nad Quadro RTX A4000, ale ta karta je dost velká na mini pc, 200W zdroj také na velikosti nepřidá, nutné chlazení, cena pak atakuje 40 tis a přitom to je asi jen 2x výkonnější než ten mini pc a s 16GB video paměti jsem s některými modely na doraz.

Jin Rys · « **Odpověď #4 kdy:** 18. 09. 2024, 10:10:17 »

V tabulce https://llm.aidatatools.com/results-linux.php lze najít výsledky pro Ryzen 9 7940HS v kombinaci s různými modely. Pro 7b modely je throughput cca 30-40.

Pokud je to dostatečný výkon, tak mini-pc s tímto procesorem je např. Āsome Max Studio. Recenze https://www.zive.cz/clanky/velky-vykon-v-malem-tele-recenze-mini-pc-max-studio-od-ceske-znacky-asome/sc-3-a-224215/default.aspx , web prodejce https://www.asome.cz/kategorie/pocitace/
Nejspíš totožný model je na Aliexpressu pod názvem minisforum um790 pro.

Reklama

Maor · « **Odpověď #5 kdy:** 18. 09. 2024, 10:29:39 »

Ještě existuje Jetson AGX Orin, ale má to pomalejší paměť než jabko a neni to zrovna levný
Výkon zde:
https://www.jetson-ai-lab.com/benchmarks.html

Aké mini PC pre lokálny ChatOllama webserver?

My name:

Aké mini PC pre lokálny ChatOllama webserver?

Reklama

ogdru6jahad

Re:Aké mini PC pre lokálny ChatOllama webserver?

ogdru6jahad

Re:Aké mini PC pre lokálny ChatOllama webserver?

_Tomáš_

Re:Aké mini PC pre lokálny ChatOllama webserver?

Jin Rys

Re:Aké mini PC pre lokálny ChatOllama webserver?

Reklama

Maor

Re:Aké mini PC pre lokálny ChatOllama webserver?