Lokální AI modely pro citlivá data

_Jenda

  • *****
  • 1 671
    • Zobrazit profil
    • https://jenda.hrach.eu/
    • E-mail
Re:Lokální AI modely pro citlivá data
« Odpověď #15 kdy: 06. 06. 2026, 08:52:26 »
Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou) LLM" border="0
To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).


noob

Re:Lokální AI modely pro citlivá data
« Odpověď #16 kdy: 06. 06. 2026, 23:05:58 »
To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Snažím se nechodit u modelů pod 4bit kvantizaci a nechávat místo pro 3GB kontextu. Nejmenší Qwen 3.6 IQ4_XS má 19GB a to už prostě nevychází :(

I když teď někde vychvalovali TurboQuant od Google, že umí solidně i 3bit, tak bych to mohl zkusit.

RDa

  • *****
  • 3 243
    • Zobrazit profil
    • E-mail
Re:Lokální AI modely pro citlivá data
« Odpověď #17 kdy: 07. 06. 2026, 01:00:23 »
Z vlastní zkušenosti s Mac mini M4 / 24GB RAM, vyhrazeným pouze na hrátky s LLM:
- i starší RTX 3070 je několikanásobně rychlejší než M4  (ale taky žere 10x tolik elektřiny)

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)

Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

noob

Re:Lokální AI modely pro citlivá data
« Odpověď #18 kdy: 07. 06. 2026, 16:58:57 »
A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)
Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

Hmm, pěkný tip. Intel Arc Pro B70 32 GB ... u nás v obchodech cca 25k Kč bez DPH. Rychlé je to dost. Dokonce ECC RAM. Časem se dá přidat další karta a provozovat 64GB. Otázka zní jaká bude podpora - ovladače, potřeba extra knihovny pro ollama atd.

Re:Lokální AI modely pro citlivá data
« Odpověď #19 kdy: 07. 06. 2026, 20:24:15 »
Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou) LLM" border="0

Je to pochopiteľná mýľka, lebo je nemecké pečivo, ktoré sa volá purzel (druh koblihy) a kotrmelec sa povie purzelbaum. Rozumiem, že je to nesprávne ale tuším, odkiaľ na to prišiel.


Re:Lokální AI modely pro citlivá data
« Odpověď #20 kdy: Dnes v 08:40:12 »
Tiez pokukavam po tom aky setup si zariadit na lokalne AI, resp s aktualnym setupom ako z neho dostat co najviac, kedze "free ride" pomaly ale isto konci a tie ucty za AI poletia do minimalne stoviek eur za mesiac, nie ako teraz ze si vystacim s 20€ planom u claude-u (vid napriklad github copilot zmeny za posledny mesiac).

Dost sa (by som povedal) propaguje 128GB unifikovanej pamete ako maju napriklad DSG Spark, Mac Studio (niektore z nich / pripadne ine modely), AMD Strix Halo. Lenze ako dobre vieme, cim lepsi model, tim viac pamete treba (a aj cip co to pocita, nie je to len o pameti).

Moja otazka/myslienka nad ktorou premyslam je: kde sa zastavia HW parametre aby sme mali taky ten "dlhodoby sweat spot"?

Pretoze ked sa pozriem napriklad na multiplier u github copilota, kolko si uctuju za jednotlive modely, tak tie najnovsie najschopnejsie modely mavaju multiplier 27 (opus 4.6+) az po 57 (GPT 5.5). Najlepsie free modely sa hovori ze su pozadu zhruba pol roka za najlepsimi platenymi modelmi. Pravdaze tiez s adekvatnymi HW poziadavkamy, ak si niekto mysli ze bude prevadzkovat najlepsie modely na thinkpade s 16GB ram a Intel i5- tretej generacie, tak ma smolika. Pretoze najnovsi deepseek V4 pro (ten vacsi model s 1.6T parametrami, ten mensi sa vola flash a ma 284B parametrov) vraj potrebuje 8x H200 grafiky (kazda jedna stoji 30k+ eur) na svoj beh, co je proste nerealisticke pre bezneho cloveka mat doma.

Preco to spominam? Ide mi o to, aby si clovek nekupil za X tisic eur krabicku, ktora mu o rok/dva, nebude schopna utiahnut ani "bezne dobre modely" - nehovorim o top tier modeloch ako napriklad deepseek v4 pro, ale napriklad o ich 70B modely ktory si dnes vystaci so 128GB, pripadne od inych firiem. Aby proste o rok dva nemali ludia doma na stole drahu krabicku a pokukovali po novej drah(s)ej krabicke.

Aky je vas nazor na toto? Sme uz HW zastabilizovany? Budu sa nove modely zlepsovat pri udrzani aktualnych HW poziadaviek alebo to poleti vyssie?

Re:Lokální AI modely pro citlivá data
« Odpověď #21 kdy: Dnes v 08:49:55 »
Nechtěl jsem s tím obtěžovat ale nakonec mi to stejně nedá: k čemu vlastně potřebujete soukromé lokální modely? Neřekl bych ani popel, kdyby šlo o investici řekněme do 200 USD ale k čemu vám soukromě jinak budou? Chápu, že pokud se někdo IT živí jako klasický živnostník, je to jeho pracovní nástroj. Chápu totéž z téhož důvodu ve firmě libovolné velikosti. Ale pokud je člověk zaměstnanec, AI je prostě pracovní nástroj, který očekávám od zaměstnavatele.

Samozřejmě ne, že by se nehodila pro soukromé projekty. Ale kupovat kvůli tomu grafiku za čtyřicet tisíc a stroj za dalších třicet (a to ještě s velkým štěstím), to bych asi musel hodně nevědět co s penězi. Navíc i kdybych chtěl, vzhledem k rozvoji NPU jednotek a obecně specializovaných ASIC je kupovat drahý hardware pokud neexistuje bezprostředně ekonomický obhajitelný důvod poněkud předčasné. A fakt se ptám ze zájmu, nikomu to ani neberu ani to není žádný hate.

LeosB

Re:Lokální AI modely pro citlivá data
« Odpověď #22 kdy: Dnes v 10:20:33 »
Tiez pokukavam po tom aky setup si zariadit na lokalne AI, resp s aktualnym setupom ako z neho dostat co najviac, kedze "free ride" pomaly ale isto konci a tie ucty za AI poletia do minimalne stoviek eur za mesiac, nie ako teraz ze si vystacim s 20€ planom u claude-u (vid napriklad github copilot zmeny za posledny mesiac).

Free ride zatím nekončí všude - tohle mám vyzkoušené a funguje to velmi dobře (připadá mi že výrazně lépe než podobně levný DeepSeek V4 Pro): https://platform.xiaomimimo.com/docs/en-US/news/v2.5-price-update

Dokud budou k dispozici nabídky za takhle nízké ceny (a je mi jedno že na tom poskytovatelé nejspíš prodělávají) tak je rozumné investici do vlastního hardware odložit, protože díky rychlosti vývoje bude za ty samé peníze v budoucnu k dispozici lepší hardware.

RDa

  • *****
  • 3 243
    • Zobrazit profil
    • E-mail
Re:Lokální AI modely pro citlivá data
« Odpověď #23 kdy: Dnes v 12:17:48 »
Nechtěl jsem s tím obtěžovat ale nakonec mi to stejně nedá: k čemu vlastně potřebujete soukromé lokální modely? Neřekl bych ani popel, kdyby šlo o investici řekněme do 200 USD ale k čemu vám soukromě jinak budou? Chápu, že pokud se někdo IT živí jako klasický živnostník, je to jeho pracovní nástroj. Chápu totéž z téhož důvodu ve firmě libovolné velikosti. Ale pokud je člověk zaměstnanec, AI je prostě pracovní nástroj, který očekávám od zaměstnavatele.

Samozřejmě ne, že by se nehodila pro soukromé projekty. Ale kupovat kvůli tomu grafiku za čtyřicet tisíc a stroj za dalších třicet (a to ještě s velkým štěstím), to bych asi musel hodně nevědět co s penězi. Navíc i kdybych chtěl, vzhledem k rozvoji NPU jednotek a obecně specializovaných ASIC je kupovat drahý hardware pokud neexistuje bezprostředně ekonomický obhajitelný důvod poněkud předčasné. A fakt se ptám ze zájmu, nikomu to ani neberu ani to není žádný hate.

Treba u me - vyzkousel jsem to u kamose - jo, vypada to pouzitelne, ale je tu ALE - nechci byt zavisly na rozmaru dodavatele sluzby, zda to pojede / nepojede, nechci byt zavisly na cenove fluktuaci - kazdy vime ze se zdanliva nizka cena muze rychle promitnout v znacny zavazek - a nechci byt nekoho otrokem (abych nahanel sve zakazky jen proto, abych uzivil vycuraneho dodavatele.. viz problem adobe subscriptions). A pak je treti bod - citliva data nemuzou opustit vlastni infrastrukturu - mate podepsane NDA, tak tomu musite vyhovet. Dale je zde znacna neduvera ve vytezovani poskytnutych dat - proc bych mel prispivat k uniku vlastnich znalosti ktere sluzba preda konkurenci ?

Tech jednorazovych 40-80K vas opravdu trapi, kdyz je rozumny obrat na hlavu 2-3 mega?

A i kdyby melo jit pouze o hobby - vemte si kolik lidi vlastni M-kove BMW.. pritom v zivote nebyli na zadne soutezi ucastnikem. Proste to lidi bavi - coz je jenom dobre - touhla a zvedavost nas dela necim vice, nez stroji.

Karmelos

  • *****
  • 1 342
    • Zobrazit profil
    • E-mail
Re:Lokální AI modely pro citlivá data
« Odpověď #24 kdy: Dnes v 16:48:16 »
Nechtěl jsem s tím obtěžovat ale nakonec mi to stejně nedá: k čemu vlastně potřebujete soukromé lokální modely? Neřekl bych ani popel, kdyby šlo o investici řekněme do 200 USD ale k čemu vám soukromě jinak budou? Chápu, že pokud se někdo IT živí jako klasický živnostník, je to jeho pracovní nástroj. Chápu totéž z téhož důvodu ve firmě libovolné velikosti. Ale pokud je člověk zaměstnanec, AI je prostě pracovní nástroj, který očekávám od zaměstnavatele.

Samozřejmě ne, že by se nehodila pro soukromé projekty. Ale kupovat kvůli tomu grafiku za čtyřicet tisíc a stroj za dalších třicet (a to ještě s velkým štěstím), to bych asi musel hodně nevědět co s penězi. Navíc i kdybych chtěl, vzhledem k rozvoji NPU jednotek a obecně specializovaných ASIC je kupovat drahý hardware pokud neexistuje bezprostředně ekonomický obhajitelný důvod poněkud předčasné. A fakt se ptám ze zájmu, nikomu to ani neberu ani to není žádný hate.

Tak jako cokoliv co nahraješ do nějakého modelu na netu je někam uloženo. O tom jak moc informací je z toho balíku použito dál a k čemu se už moc (nic) neví. Dobrovolně nahrávat svoje soukromé konverzace, osobní data, soukromé fotky svoje, svých blízkých bůchvíkam, aby se v tom mohl hrabat kdokoliv, nebo generovat z toho cokoliv třeba mi osobně nepříjde jako nejlepší nápad.
Gréta je nejlepší.

Zopper

  • *****
  • 1 014
    • Zobrazit profil
Re:Lokální AI modely pro citlivá data
« Odpověď #25 kdy: Dnes v 18:15:55 »
Ale kupovat kvůli tomu grafiku za čtyřicet tisíc a stroj za dalších třicet (a to ještě s velkým štěstím), to bych asi musel hodně nevědět co s penězi.
Například to může být dual-use: Ten stroj bych stejně kupoval kvůli hrám, ale můžu si na tom líp pouštět i AI (těch 70k není ani omylem něco, o čem by člověk tady neslyšel). Nebo to nechci jen používat, ale i trénovat, a fakt nechci nahrávat svoje trénovací, krásně anotovaná data, do nějakého cloudu. Nebo chci experimentovat.

Tak jako cokoliv co nahraješ do nějakého modelu na netu je někam uloženo. O tom jak moc informací je z toho balíku použito dál a k čemu se už moc (nic) neví.
FYI, korporáty fungují (i s AI) zhruba na principu "data jsou na těch cloud serverech zaširovaná klíčema, které jsou na našich vlastních serverech, odemyká se to jen do paměti, a ten (AI) poskytovatel mává hromadou papírů s certifikací a zaručují se, že nemají možnost se k tomu skrz své procesy dostat." Prostor ke špehování by se tam našel, ale vědomě v téhle situaci lhát většina firem nechce, nebo aspoň ne moc. U nás koncáků je ale situace dost jiná.