Fórum Root.cz
Hlavní témata => Server => Téma založeno: metalmaus 05. 01. 2023, 14:10:58
-
Ahoj,
mam Proxmox 7.2-11 a na jednom nodu VMs (32 jader) si navzájem ovlivňují CPU. Celkem má hypervizor/node 104 (2x2x26) jader Xeon(R) Gold 5320 CPU @ 2.20GHz a na node mam 3x VM.
Když běží 2, tak CPU na nich je v pohodě na 30%. Když spustím 3, tak se CPU zvedne na 90-100% na všech. Na výběru VM nezáleží.
Zkoušel jsem izolovat CPU hypervizoru pomocí taskset --cpu-list --all-tasks --pid 64-95 $(< /run/qemu-server/XXX.pid)
, ale nepomáhá to.
Netušíte někdo, čím to může být? Já myslel, že by se to nemělo dít, ale jsem dost začátečník a s proxmoxem pracuju jen 3 roky.
-
Me to v KVM ukazuje taky blbe a na pocatku jsem se prihlasoval do VM ze co mi zere cpu.. a pak jsem dohledal ze za to muze frequency scaling na hostu v kombinaci s dynamicky pridelovanim cpu do guestu - proste guest si mysli ze i v idle natrefil na hranici co zelezo da, ale netusi ze mu bude dalsi prostor pridelen, az bude treba.
Se podivej jak se ti meni frekvence jader pri 2 vs 3 VM.
-
Problém je, že mi na těch virtuálních strojích běží apiikace, která provádí výpočty na CPU a u ní se to zvýšené zatížení CPU projevuje :(
Na frekvence jader kouknu, dík.
-
Nepomohlo by nastavit u VM CPU "Type" na "host"? Jen takový výstřel od boku. Defaultně je tam tuším kvm něco kvůli kompatibilitě při migrací mezi různými stroji (s různými CPU).
-
Ma to tedy 2x Xeon nebo 4x? Ten popis neni jednoznacny.
Urcite bych vypnul dynamicke/usporne nastavovani frekvence v biosu.
-
2 x fyzický XEON
-
Me to v KVM ukazuje taky blbe a na pocatku jsem se prihlasoval do VM ze co mi zere cpu.. a pak jsem dohledal ze za to muze frequency scaling na hostu v kombinaci s dynamicky pridelovanim cpu do guestu - proste guest si mysli ze i v idle natrefil na hranici co zelezo da, ale netusi ze mu bude dalsi prostor pridelen, az bude treba.
Se podivej jak se ti meni frekvence jader pri 2 vs 3 VM.
Frekvence se nemění lscpu | grep MHz
-
Nepomohlo by nastavit u VM CPU "Type" na "host"? Jen takový výstřel od boku. Defaultně je tam tuším kvm něco kvůli kompatibilitě při migrací mezi různými stroji (s různými CPU).
host nepomohlo, ale díky
-
Vyzkoušej vypnout HT a přiděl jen počet jader co budeš mít - 2. Třeba to pomůže.
-
nemas tam nahodou zaply halt_polling ?
https://www.kernel.org/doc/html/latest/virt/kvm/halt-polling.html
-
2 x fyzický XEON
Takze to shrneme.
Na tech VM se delaji vypocty vyzadujici cpu.
Mame tu 2x26 fyzickych jader, 2x26 htt jader. Tzn 52 fyzickych, 52 htt.
2 bezici VM kazda 30% cpu zatizeni = 64 jader
3 bezici VM kazda 90+% cpu zatizeni = 96 jader
Ani by mne neprekvapilo, ze v takovehle kombinaci by tam byly vysoke cpu steal/context switche, cili poddimenzovany HW ci predimenzovane VM konfigurace.
-
nemas tam nahodou zaply halt_polling ?
https://www.kernel.org/doc/html/latest/virt/kvm/halt-polling.html
Zkusil jsem vypnout a nic
echo "options kvm halt_poll_ns=0" | tee --append /etc/modprobe.d/qemu-system-x86.conf
cat /etc/modprobe.d/qemu-system-x86.conf
options kvm halt_poll_ns=0
cat /sys/module/kvm/parameters/halt_poll_ns
0
-
Tak teď to vypadá, že aplikaci ovlivňuje počet RAM modulů. mbw ukazuje, že se snižuje rychlost. Je rozdíl mít v jednom serveru 12x 8GB modulů a v druhém 2x 32 GB. Jsem asi lama.
-
Asi bych doporucil procist: https://pve.proxmox.com/pve-docs/chapter-qm.html
od "CPU Type" az po "NUMA" (vcetne). Predpokladam, ze mate vypnuty Ballooning.
Dal se podivejte jak pridelujete procesory do VM, tohle napovi: https://forum.proxmox.com/threads/sockets-vs-cores-vs-threads-vs-vcpu-vs-cpu-units.110868/
Na konci tohoto dotazu: https://www.reddit.com/r/Proxmox/comments/v8brzd/help_neededcpu_pinning_for_proxmox_72/
dal hodny clovek celkem uzitecne shrnuti/skripty: https://github.com/ayufan/pve-helpers
Prijde mi, ze vam tam bojuji dve veci proti sobe a nemuze se to dohodnout.
-
Dobrý den,
pokud Vám na hypervizoru běží numad zkuste vypnout - systemctl stop numad.service.
Máte velká VMs - hodně CPU a předpokládám i hodně RAM a pak se to navzájem pere, protože se to snaží přesouvat proces na CPU a jeho lokální RAM.
-
Dobrý den,
pokud Vám na hypervizoru běží numad zkuste vypnout - systemctl stop numad.service.
Máte velká VMs - hodně CPU a předpokládám i hodně RAM a pak se to navzájem pere, protože se to snaží přesouvat proces na CPU a jeho lokální RAM.
numad.service tam neběží.