1
Hardware / Re:Hardware pro provoz lokálního LLM
« kdy: 06. 12. 2025, 13:13:18 »
Pokud model používá MoE (Mixture of Experts), tak běží o dost rychleji než ten, který to nepoužívá. Je docela rychlý i když běží pouze pomocí CPU+RAM, ale je větší, takže to chce více paměti RAM nebo VRAM nebo oboje dohromady.
Jazykové modely se dají stáhnout ze stránek huggingface.co, můžete si tam vybrat různé verze.
Jazykové modely se dají stáhnout ze stránek huggingface.co, můžete si tam vybrat různé verze.