Fórum Root.cz

Hlavní témata => Server => Téma založeno: f 15. 01. 2019, 12:05:28

Název: Optimální server load
Přispěvatel: f 15. 01. 2019, 12:05:28
Ahoj, 

otazka na adminov serverov. aky max. server load je pre vas este unosny? resp. to este neriesite ako nieco problematicke z kratkodobeho hladiska (t.j. nejake narazy/spicky a pod cca do 3-6 hodin). Ak sa nemylim, tak "idealny maximalny" load je cca 1 per core.  Mne to teraz kolise (viacmenej dlhodobo) medzi 2-3 a nezda sa mi, ze by to bolo nejake spomalene.

Aby sme si rozumeli:
load 1 na 1 core mashine je to iste ako load 4 na 4 jadrach, alebo load 8 na 8 jadroach
jadro je to, co zobrazuje top/htop ako CPU[0..X]
Název: Re:"Optimalny" Max. server load
Přispěvatel: Jan Forman 15. 01. 2019, 12:12:19
Pokud to jde 0.7 na core, víc být samozřejmě může, ale latence začne stoupat => což nechci.
Název: Re:Optimální server load
Přispěvatel: Ondra Satai Nekola 15. 01. 2019, 12:18:01
m.j. zalezi na tom, co je to za server. Resis spis propustnost nebo latence?
Název: Re:Optimální server load
Přispěvatel: KuntHistorik 15. 01. 2019, 12:27:01
a nebo výkon počítačový na jednotku spotřeby a nebo jednotku energie
Název: Re:Optimální server load
Přispěvatel: f 15. 01. 2019, 12:31:02
pravdu povediac neriesim ani priepustnost ani latenciu. pri uvedenych hodnotach mi to pride este stale "good-enough". trochu som googlil a vacsinou sa pise okolo max load 1, preto sa pytam tu, ako su na tom realni admini:)



Název: Re:Optimální server load
Přispěvatel: Miroslav Šilhavý 15. 01. 2019, 13:16:26
Na položenou otázku nelze odpovědět.

Pro samotný početní výkon, případně efektivitu výpočtů na Wh je ideální mít load cca počet jader + 20 % (tj. neustále je ve frontě "co dělat" a CPU nemá žádný idle).

Pro nízkou latenci - tam už je nutné přemýšlet o typu zátěže, jestli se o CPU bije jasná převaha vláken, nebo naopak počet vláken odpovídá počtu CPU. V prvním případě je potřeba nejprve řešit scheduler, v druhé řadě zajistit aby byl load o cca 10 % nižší, než je počet CPU. Ve druhém případě je potřeba větší rezerva, 20 - 30 %.

Posledním případem jsou úlohy náročné na I/O operace. V takovém případě může být load 0,01, protože CPU nemá co dělat, neboť čeká na data z disku.

Takže otázka, tak, jak byla položena, je nezodpověditelná.
Název: Re:Optimální server load
Přispěvatel: BrainLess 15. 01. 2019, 13:38:11
Kdyby load ukazoval pouze zatez CPU bylo by to asi spatne, jenze "load" je jen "vzorecek" co zohlednuje ruzne parametry. Takze rikat ze load 1.5 je ok a 1.6 uz neni je blbost. Zalezi na konkretnim typu zateze.
Název: Re:Optimální server load
Přispěvatel: Miroslav Šilhavý 15. 01. 2019, 13:42:33
Kdyby load ukazoval pouze zatez CPU bylo by to asi spatne, jenze "load" je jen "vzorecek" co zohlednuje ruzne parametry. Takze rikat ze load 1.5 je ok a 1.6 uz neni je blbost. Zalezi na konkretnim typu zateze.

Load je opravdu ukazatel pouze CPU loadu. Je to poměr počtu CPU k počtu běžících vláken a času.
Pokud je load < než počet CPU, pak je procesor v idle (a to může být i v důsledku čekání na I/O operace).
Název: Re:Optimální server load
Přispěvatel: Trupik 15. 01. 2019, 15:02:54
Kdyby load ukazoval pouze zatez CPU bylo by to asi spatne, jenze "load" je jen "vzorecek" co zohlednuje ruzne parametry. Takze rikat ze load 1.5 je ok a 1.6 uz neni je blbost. Zalezi na konkretnim typu zateze.

Load je opravdu ukazatel pouze CPU loadu. Je to poměr počtu CPU k počtu běžících vláken a času.
Pokud je load < než počet CPU, pak je procesor v idle (a to může být i v důsledku čekání na I/O operace).
Čakanie na I/O sa do loadu neráta len v UNIXoch, v LINUXe naopak áno:
Citace
Most UNIX systems count only processes in the running (on CPU) or runnable (waiting for CPU) states. However, Linux also includes processes in uninterruptible sleep states (usually waiting for disk activity), which can lead to markedly different results if many processes remain blocked in I/O due to a busy or stalled I/O system.
Název: Re:Optimální server load
Přispěvatel: f 15. 01. 2019, 15:11:55
pani, dakujem za odpovede, ale riesite to privelmi akademicky. asi je to aj moja chyba, neupresnil som, ze nehladam nejake zlate pravidlo ako rozlozit zataz na serveri, ale ide mi len o zatazenie web servera kde bezi jednoduchy web v PHP + databaza, resp. ci to zatazenie  (load 2-3) znamena, ze server je poddimenzovany, alebo je to este v poho. cakal som odpovede v zmysle ako pise honza forman, za co mu dakujem:)

P.S. sypem si popol na hlavu, nabuduce sa budem pytat jasnejsie.

zdar
Název: Re:Optimální server load
Přispěvatel: samalama 15. 01. 2019, 15:47:28
najradsej mam takych chytrakov ako je OP. sice tomu nerozumie, ale ma otazku a caka konkretnu odpoved. a ked sa mu niekto snazi vysvetlit, ze odpoved nie je len biela alebo cierna, tak sa zase roby chytrim, ze to nie je to, co on ocakava ako odpoved.

aby si to pochopil na priklade: mam tu serverm s kvm virtualizaciou, ktory ma load cca 8 - vytazene su cpu. a mam tu storage server, ktory ma tiez load 8, ale ten je sposobeny IO operaciami na diskoch, cpu sa flaka. takze uz chapes...?

btw, silhavy to je reinkarnovany jirsak...?
Název: Re:Optimální server load
Přispěvatel: Vilith 15. 01. 2019, 16:02:29
Mel jsem mailserver s postfixem, load 50,  a bylo to OK
Název: Re:Optimální server load
Přispěvatel: Ondrej Nemecek 15. 01. 2019, 17:02:47
Odpovědí nejsou moc akademické. Load sám o sobě nestačí k zhodnocení stavu serveru - potřebujete znát vytížení CPU jader, porovnat  vytížení CPU v userspace a kernelspace a znát intenzitu IO operací, případně zaplnění RAM. Podle toho pak můžete zhodnotit jak „zdravá“ je momentální zátěž serveru.

Anebo se na to vykašlete a sledujete jen odezvu a propustnost služby (např. webu) a pokud ta vyhovuje požadavkům, tak už víc neřešíte. Optimální přístup to ale není.
Název: Re:Optimální server load
Přispěvatel: phpmistr 15. 01. 2019, 17:15:37
pravdu povediac neriesim ani priepustnost ani latenciu. pri uvedenych hodnotach mi to pride este stale "good-enough". trochu som googlil a vacsinou sa pise okolo max load 1, preto sa pytam tu, ako su na tom realni admini:)
Slovenština s angličtinou ... to je faktu super.
Název: Re:Optimální server load
Přispěvatel: f 15. 01. 2019, 17:19:40
Slovenština s angličtinou ... to je faktu super.

a cestina s anglictinou(latincinou) uz je koser?:)
Název: Re:Optimální server load
Přispěvatel: Trupik 15. 01. 2019, 17:48:29
Aby sme sa vrátili do praxe, tak my napríklad v monitoringu máme, že ak loadavg15 prekročí počet jadier CPU, tak sa vytvára incident a treba ho riešiť. Pre loadavg5 je táto hranica počet jadier × 2, a pre loadavg1 počet jadier × 4. Tzn. krátkodobo to môže mať load vyšší než počet jadier, ale dlhodobo nie. Ale nie sú to zďaleka jediné metriky, ktoré sa sledujú a eskalujú po prekročení hodnôt.
Název: Re:Optimální server load
Přispěvatel: f 15. 01. 2019, 18:16:32
Aby sme sa vrátili do praxe, tak my napríklad v monitoringu máme, že ak loadavg15 prekročí počet jadier CPU, tak sa vytvára incident a treba ho riešiť. Pre loadavg5 je táto hranica počet jadier × 2, a pre loadavg1 počet jadier × 4. Tzn. krátkodobo to môže mať load vyšší než počet jadier, ale dlhodobo nie. Ale nie sú to zďaleka jediné metriky, ktoré sa sledujú a eskalujú po prekročení hodnôt.

dik za odpoved. poradil by si (alebo niekto iny) mi prosim este nejaky manual/guide/knihu, kde by som ziskal sirsi nahlad na problematiku monitoringu a vytazenosti linuxoveho servera? drviva vacsina odpovedi v tomto vlakne je k veci a pomaha mi zorientovat sa v problematike, ale nerad by som drazdil tych par frikulinov...
Název: Re:Optimální server load
Přispěvatel: Homeatcloud 30. 01. 2019, 10:47:38
Nejlépe stravitelná kniha, co mám v knihovničce k teorii:
Daniel A. Menascé, Virgilio A.F. Almeida, Lawrence W. Dowdy: Performance by Design: Computer Capacity Planning by Example.

Co se týče praxe, tak doporučuju nasadit nějaký monitoring, co sleduje v intervalech kratších než 5 min, např. collectd s intervalem 30s. Pustit si pluginy na sledování CPU, load, disk utilization, Apache stats a MySQL, či co používáte za serverový software, a korelovat grafy se stížnostmi uživatelů a pak si občas dosadit hodnoty do vzorečků z teorie. Tak jsem se vyučil na experta na performance engineering já.

K tomu load average a vlivu na latenci je kapitola a vzoreček v mé druhé nejoblíbenější knize (sorry za ošklivý odkaz):
https://books.google.cz/books?id=VkLy93Mu8_oC&pg=PA16&lpg=PA16&dq=stretch+factor+performance&source=bl&ots=1rXlymNVZC&sig=ACfU3U0wgCxhlHX0vTfXz1n4tSpzMobHXw&hl=cs&sa=X&ved=2ahUKEwibp6uonJXgAhVKzoUKHX_CBPkQ6AEwBnoECAMQAQ#v=onepage&q=stretch%20factor%20performance&f=false

Vyplývá z toho, že load, který jsi ochoten tolerovat, záleží na tvém SLO (service level objective) na latenci aplikace.