Lokální AI modely pro citlivá data

_Jenda · « **Odpověď #15 kdy:** 06. 06. 2026, 08:52:26 »

Citace: noob 05. 06. 2026, 20:15:01

Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou)

To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Reklama

noob · « **Odpověď #16 kdy:** 06. 06. 2026, 23:05:58 »

Citace: _Jenda 06. 06. 2026, 08:52:26

To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Snažím se nechodit u modelů pod 4bit kvantizaci a nechávat místo pro 3GB kontextu. Nejmenší Qwen 3.6 IQ4_XS má 19GB a to už prostě nevychází

I když teď někde vychvalovali TurboQuant od Google, že umí solidně i 3bit, tak bych to mohl zkusit.

RDa · « **Odpověď #17 kdy:** **Dnes** v 01:00:23 »

Citace: noob 05. 06. 2026, 12:59:42

Z vlastní zkušenosti s Mac mini M4 / 24GB RAM, vyhrazeným pouze na hrátky s LLM:
- i starší RTX 3070 je několikanásobně rychlejší než M4 (ale taky žere 10x tolik elektřiny)

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)

Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ

Lokální AI modely pro citlivá data

_Jenda

Re:Lokální AI modely pro citlivá data

Reklama

noob

Re:Lokální AI modely pro citlivá data

RDa

Re:Lokální AI modely pro citlivá data