Poslední příspěvky

Stran: [1] 2 3 ... 10

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od kanoe22 kdy Dnes v 08:40:12 »

Tiez pokukavam po tom aky setup si zariadit na lokalne AI, resp s aktualnym setupom ako z neho dostat co najviac, kedze "free ride" pomaly ale isto konci a tie ucty za AI poletia do minimalne stoviek eur za mesiac, nie ako teraz ze si vystacim s 20€ planom u claude-u (vid napriklad github copilot zmeny za posledny mesiac).

Dost sa (by som povedal) propaguje 128GB unifikovanej pamete ako maju napriklad DSG Spark, Mac Studio (niektore z nich / pripadne ine modely), AMD Strix Halo. Lenze ako dobre vieme, cim lepsi model, tim viac pamete treba (a aj cip co to pocita, nie je to len o pameti).

Moja otazka/myslienka nad ktorou premyslam je: kde sa zastavia HW parametre aby sme mali taky ten "dlhodoby sweat spot"?

Pretoze ked sa pozriem napriklad na multiplier u github copilota, kolko si uctuju za jednotlive modely, tak tie najnovsie najschopnejsie modely mavaju multiplier 27 (opus 4.6+) az po 57 (GPT 5.5). Najlepsie free modely sa hovori ze su pozadu zhruba pol roka za najlepsimi platenymi modelmi. Pravdaze tiez s adekvatnymi HW poziadavkamy, ak si niekto mysli ze bude prevadzkovat najlepsie modely na thinkpade s 16GB ram a Intel i5- tretej generacie, tak ma smolika. Pretoze najnovsi deepseek V4 pro (ten vacsi model s 1.6T parametrami, ten mensi sa vola flash a ma 284B parametrov) vraj potrebuje 8x H200 grafiky (kazda jedna stoji 30k+ eur) na svoj beh, co je proste nerealisticke pre bezneho cloveka mat doma.

Preco to spominam? Ide mi o to, aby si clovek nekupil za X tisic eur krabicku, ktora mu o rok/dva, nebude schopna utiahnut ani "bezne dobre modely" - nehovorim o top tier modeloch ako napriklad deepseek v4 pro, ale napriklad o ich 70B modely ktory si dnes vystaci so 128GB, pripadne od inych firiem. Aby proste o rok dva nemali ludia doma na stole drahu krabicku a pokukovali po novej drah(s)ej krabicke.

Aky je vas nazor na toto? Sme uz HW zastabilizovany? Budu sa nove modely zlepsovat pri udrzani aktualnych HW poziadaviek alebo to poleti vyssie?

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od balkovic kdy 07. 06. 2026, 20:24:15 »

Citace: noob 05. 06. 2026, 20:15:01

Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou)

Je to pochopiteľná mýľka, lebo je nemecké pečivo, ktoré sa volá purzel (druh koblihy) a kotrmelec sa povie purzelbaum. Rozumiem, že je to nesprávne ale tuším, odkiaľ na to prišiel.

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od noob kdy 07. 06. 2026, 16:58:57 »

Citace: RDa 07. 06. 2026, 01:00:23

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)
Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

Hmm, pěkný tip. Intel Arc Pro B70 32 GB ... u nás v obchodech cca 25k Kč bez DPH. Rychlé je to dost. Dokonce ECC RAM. Časem se dá přidat další karta a provozovat 64GB. Otázka zní jaká bude podpora - ovladače, potřeba extra knihovny pro ollama atd.

Bazar / Re:Prodám QNAP TS-832PXU

« Poslední příspěvek od David Lanc kdy 07. 06. 2026, 11:58:49 »

Prodáno

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od RDa kdy 07. 06. 2026, 01:00:23 »

Citace: noob 05. 06. 2026, 12:59:42

Z vlastní zkušenosti s Mac mini M4 / 24GB RAM, vyhrazeným pouze na hrátky s LLM:
- i starší RTX 3070 je několikanásobně rychlejší než M4 (ale taky žere 10x tolik elektřiny)

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)

Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od noob kdy 06. 06. 2026, 23:05:58 »

Citace: _Jenda 06. 06. 2026, 08:52:26

To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Snažím se nechodit u modelů pod 4bit kvantizaci a nechávat místo pro 3GB kontextu. Nejmenší Qwen 3.6 IQ4_XS má 19GB a to už prostě nevychází

I když teď někde vychvalovali TurboQuant od Google, že umí solidně i 3bit, tak bych to mohl zkusit.

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od _Jenda kdy 06. 06. 2026, 08:52:26 »

Citace: noob 05. 06. 2026, 20:15:01

Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou)

To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

/dev/null / Re:JIVA's DOSBox Toolset

« Poslední příspěvek od Martin Koleček kdy 05. 06. 2026, 22:10:19 »

sestavil jsem program prohlížeče datových souborů. Program IRENA je připravený https://github.com/tigerhareram/DOS-Tigerhareram
Program zobrazuje tlačítka v dolní části které korespondují s datovými soubory ve složkové a souborové struktuře (ta je pevně daná). Stisk tlačítka enter nahraje asset na obrazovku.
Program pracuje se soubory txt 80x25 znaků (výstup z programu WORLD) , zobrazuje soubor map (výstup z programu editmap.exe ) a obrázkové assety *.gra (výstup z programu editgra.exe)

pokud máte více grafických souborů gra , textové soubory s ASCII artem , a sestavili jste obrázky pro pozadí hry mapu , v tomto programu je můžete všechny prezentovat na jednom místě.
Na co je to dobré ? když neovládáte jazyk pascal můžete pořád kreslit grafiku a dělat ascii art. Balíček IRENA program a datové soubory pak můžete ukázat nějakému developerovi jako zdroj grafických a textových assetů pro hru.

Naplnit IRENU tak aby všechny soubory něco obsahovaly znamená nakreslit asi 320 gra souborů a napsat asi 120 txt stránek nebo nakreslit nějaké ascii arty. Souborů map je 20.
Má to tak být něco jako jeden tlustší sešit nebo nějaká knížka kde má být všechna vaše grafická práce na jednom místě.

Tak jak je program IRENA nahraný obsahuje první soubory s nějakými ukázkami, můžete se podívat pod dosboxem.

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od noob kdy 05. 06. 2026, 20:15:01 »

Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou)

Software / Re:Lokální AI modely pro citlivá data

« Poslední příspěvek od boardshepherd kdy 05. 06. 2026, 14:57:36 »

Citace: Ink 04. 06. 2026, 08:47:19

A není pak lepší nechat ten velký LLM vytvořit nějaký skript a pak ho jen opakovaně spouštět?

Ja napriklad použivvam lokalny LLM na získavanie inofmácií z faktúr. Veľa faktúr k nám chodí ešte na papieri a sú skenované. Tiež máme veľa roznych dodávateľov - roznych typov faktúr, takže použitie custom scriptov je zložité a nespolahlivé. Teraz fakútry ktoré ku nám chodia (okrem tých z XML prílohami) idú všetky cez LLM a automatikcy sa nahrávajú do systému, kde sú následne ešte skotrolované pracovníkom. Chybovosť je pod 5% a dokonca to nemá problém ani z ručne vypísaným faktúrami od drobných živnostníkov.

Najlepšie s mi zatiaľ osvecčili modely gemma4:26B alebo qwen3.6:35b. Beží to na AMD Ryzen AI Max+ 395 s 128GB RAM. Spracovanie jednej faktúry trvá medzi 30 - 60 sekund, čo nie je najrýchlejšie, ale pre moje účely to úplne stačí.

Stran: [1] 2 3 ... 10