Optimální server load

Trupik

Re:Optimální server load
« Odpověď #15 kdy: 15. 01. 2019, 17:48:29 »
Aby sme sa vrátili do praxe, tak my napríklad v monitoringu máme, že ak loadavg15 prekročí počet jadier CPU, tak sa vytvára incident a treba ho riešiť. Pre loadavg5 je táto hranica počet jadier × 2, a pre loadavg1 počet jadier × 4. Tzn. krátkodobo to môže mať load vyšší než počet jadier, ale dlhodobo nie. Ale nie sú to zďaleka jediné metriky, ktoré sa sledujú a eskalujú po prekročení hodnôt.


f

Re:Optimální server load
« Odpověď #16 kdy: 15. 01. 2019, 18:16:32 »
Aby sme sa vrátili do praxe, tak my napríklad v monitoringu máme, že ak loadavg15 prekročí počet jadier CPU, tak sa vytvára incident a treba ho riešiť. Pre loadavg5 je táto hranica počet jadier × 2, a pre loadavg1 počet jadier × 4. Tzn. krátkodobo to môže mať load vyšší než počet jadier, ale dlhodobo nie. Ale nie sú to zďaleka jediné metriky, ktoré sa sledujú a eskalujú po prekročení hodnôt.

dik za odpoved. poradil by si (alebo niekto iny) mi prosim este nejaky manual/guide/knihu, kde by som ziskal sirsi nahlad na problematiku monitoringu a vytazenosti linuxoveho servera? drviva vacsina odpovedi v tomto vlakne je k veci a pomaha mi zorientovat sa v problematike, ale nerad by som drazdil tych par frikulinov...

Re:Optimální server load
« Odpověď #17 kdy: 30. 01. 2019, 10:47:38 »
Nejlépe stravitelná kniha, co mám v knihovničce k teorii:
Daniel A. Menascé, Virgilio A.F. Almeida, Lawrence W. Dowdy: Performance by Design: Computer Capacity Planning by Example.

Co se týče praxe, tak doporučuju nasadit nějaký monitoring, co sleduje v intervalech kratších než 5 min, např. collectd s intervalem 30s. Pustit si pluginy na sledování CPU, load, disk utilization, Apache stats a MySQL, či co používáte za serverový software, a korelovat grafy se stížnostmi uživatelů a pak si občas dosadit hodnoty do vzorečků z teorie. Tak jsem se vyučil na experta na performance engineering já.

K tomu load average a vlivu na latenci je kapitola a vzoreček v mé druhé nejoblíbenější knize (sorry za ošklivý odkaz):
https://books.google.cz/books?id=VkLy93Mu8_oC&pg=PA16&lpg=PA16&dq=stretch+factor+performance&source=bl&ots=1rXlymNVZC&sig=ACfU3U0wgCxhlHX0vTfXz1n4tSpzMobHXw&hl=cs&sa=X&ved=2ahUKEwibp6uonJXgAhVKzoUKHX_CBPkQ6AEwBnoECAMQAQ#v=onepage&q=stretch%20factor%20performance&f=false

Vyplývá z toho, že load, který jsi ochoten tolerovat, záleží na tvém SLO (service level objective) na latenci aplikace.
« Poslední změna: 30. 01. 2019, 10:50:56 od Homeatcloud »