Lokální AI modely pro citlivá data

_Jenda

  • *****
  • 1 671
    • Zobrazit profil
    • https://jenda.hrach.eu/
    • E-mail
Re:Lokální AI modely pro citlivá data
« Odpověď #15 kdy: 06. 06. 2026, 08:52:26 »
Pro pobavení - jak přemýšlí lokální model qwen 2.5-coder (jinak celkem solidní, ale zjevně má trochu problém s češtinou) LLM" border="0
To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).


noob

Re:Lokální AI modely pro citlivá data
« Odpověď #16 kdy: 06. 06. 2026, 23:05:58 »
To je skoro 2 roky starý model, ne? Je pro to nějaký důvod? (už je Qwen 3.6, obdobných velikostí).

Snažím se nechodit u modelů pod 4bit kvantizaci a nechávat místo pro 3GB kontextu. Nejmenší Qwen 3.6 IQ4_XS má 19GB a to už prostě nevychází :(

I když teď někde vychvalovali TurboQuant od Google, že umí solidně i 3bit, tak bych to mohl zkusit.

RDa

  • *****
  • 3 242
    • Zobrazit profil
    • E-mail
Re:Lokální AI modely pro citlivá data
« Odpověď #17 kdy: Dnes v 01:00:23 »
Z vlastní zkušenosti s Mac mini M4 / 24GB RAM, vyhrazeným pouze na hrátky s LLM:
- i starší RTX 3070 je několikanásobně rychlejší než M4  (ale taky žere 10x tolik elektřiny)

A co treba aktualni Intel B70 (32GB, cca 20 tis) ?
Je to vykonove cca jako RTX PRO 4000 (24GB, cca 40-48 tis)

Viz testy zde: https://www.youtube.com/watch?v=RcIWhm16ouQ