Lokální AI modely pro citlivá data

_Jenda · « **Odpověď #15 kdy:** 06. 06. 2026, 08:52:26 »

Citace: noob 05. 06. 2026, 20:15:01

Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou)

To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Reklama

noob · « **Odpověď #16 kdy:** 06. 06. 2026, 23:05:58 »

Citace: _Jenda 06. 06. 2026, 08:52:26

To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Snažím se nechodit u modelů pod 4bit kvantizaci a nechávat místo pro 3GB kontextu. Nejmenší Qwen 3.6 IQ4_XS má 19GB a to už prostě nevychází

I když teď někde vychvalovali TurboQuant od Google, že umí solidně i 3bit, tak bych to mohl zkusit.

RDa · « **Odpověď #17 kdy:** 07. 06. 2026, 01:00:23 »

Citace: noob 05. 06. 2026, 12:59:42

Z vlastní zkušenosti s Mac mini M4 / 24GB RAM, vyhrazeným pouze na hrátky s LLM:
- i starší RTX 3070 je několikanásobně rychlejší než M4 (ale taky žere 10x tolik elektřiny)

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)

Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

noob · « **Odpověď #18 kdy:** 07. 06. 2026, 16:58:57 »

Citace: RDa 07. 06. 2026, 01:00:23

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)
Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

Hmm, pěkný tip. Intel Arc Pro B70 32 GB ... u nás v obchodech cca 25k Kč bez DPH. Rychlé je to dost. Dokonce ECC RAM. Časem se dá přidat další karta a provozovat 64GB. Otázka zní jaká bude podpora - ovladače, potřeba extra knihovny pro ollama atd.

balkovic · « **Odpověď #19 kdy:** 07. 06. 2026, 20:24:15 »

Citace: noob 05. 06. 2026, 20:15:01

Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou)

Je to pochopiteľná mýľka, lebo je nemecké pečivo, ktoré sa volá purzel (druh koblihy) a kotrmelec sa povie purzelbaum. Rozumiem, že je to nesprávne ale tuším, odkiaľ na to prišiel.

Reklama

kanoe22 · « **Odpověď #20 kdy:** **Dnes** v 08:40:12 »

Tiez pokukavam po tom aky setup si zariadit na lokalne AI, resp s aktualnym setupom ako z neho dostat co najviac, kedze "free ride" pomaly ale isto konci a tie ucty za AI poletia do minimalne stoviek eur za mesiac, nie ako teraz ze si vystacim s 20€ planom u claude-u (vid napriklad github copilot zmeny za posledny mesiac).

Dost sa (by som povedal) propaguje 128GB unifikovanej pamete ako maju napriklad DSG Spark, Mac Studio (niektore z nich / pripadne ine modely), AMD Strix Halo. Lenze ako dobre vieme, cim lepsi model, tim viac pamete treba (a aj cip co to pocita, nie je to len o pameti).

Moja otazka/myslienka nad ktorou premyslam je: kde sa zastavia HW parametre aby sme mali taky ten "dlhodoby sweat spot"?

Pretoze ked sa pozriem napriklad na multiplier u github copilota, kolko si uctuju za jednotlive modely, tak tie najnovsie najschopnejsie modely mavaju multiplier 27 (opus 4.6+) az po 57 (GPT 5.5). Najlepsie free modely sa hovori ze su pozadu zhruba pol roka za najlepsimi platenymi modelmi. Pravdaze tiez s adekvatnymi HW poziadavkamy, ak si niekto mysli ze bude prevadzkovat najlepsie modely na thinkpade s 16GB ram a Intel i5- tretej generacie, tak ma smolika. Pretoze najnovsi deepseek V4 pro (ten vacsi model s 1.6T parametrami, ten mensi sa vola flash a ma 284B parametrov) vraj potrebuje 8x H200 grafiky (kazda jedna stoji 30k+ eur) na svoj beh, co je proste nerealisticke pre bezneho cloveka mat doma.

Preco to spominam? Ide mi o to, aby si clovek nekupil za X tisic eur krabicku, ktora mu o rok/dva, nebude schopna utiahnut ani "bezne dobre modely" - nehovorim o top tier modeloch ako napriklad deepseek v4 pro, ale napriklad o ich 70B modely ktory si dnes vystaci so 128GB, pripadne od inych firiem. Aby proste o rok dva nemali ludia doma na stole drahu krabicku a pokukovali po novej drah(s)ej krabicke.

Aky je vas nazor na toto? Sme uz HW zastabilizovany? Budu sa nove modely zlepsovat pri udrzani aktualnych HW poziadaviek alebo to poleti vyssie?

Lokální AI modely pro citlivá data

_Jenda

Re:Lokální AI modely pro citlivá data

Reklama

noob

Re:Lokální AI modely pro citlivá data

RDa

Re:Lokální AI modely pro citlivá data

noob

Re:Lokální AI modely pro citlivá data

balkovic

Re:Lokální AI modely pro citlivá data

Reklama

kanoe22

Re:Lokální AI modely pro citlivá data