Dost chvaleny mi prisel nagios jez je napriklad v reseni ispadmin . Co vy na nej ?
Nagios je výborný v tom, že jakmile pochopíš princip, dělá přesně to, co dělat má, a dá se docela dobře ohýbat. Je to ale starší soft, na kterém je poznat, že byl navržený pro jednodušší monitoring ve stylu běží/neběží. Pokročilejší věci buď nejdou vůbec, nebo jsou trochu dobastlené. Konfigurace je hodně košatá, ale ona by ani moc jinak udělat nešla - pro každý prvek je prostě potřeba nastavit checky, alerty, pracovní dobu... Jak už zaznělo, určitě je potřeba používat templates a pokud se konfigurace nepíše ručně, ale generuje (právě tím saltem, puppetem...), tak je to pohoda. Asi lepší než původní Nagios jsou klony - Icinga, Centreon.
K těm pokročilejším věcem, co jsou trochu problém: distribuované nasazení je dobastlené a má různé nepříjemnosti. A mně osobně jako největší limitace přijde, že přímo sám check nejenom zjišťuje hodnotu ("reakční doba http serveru je 0.1s"), ale i vyhodnocuje ("všechno pod 0.5 je ok") - z toho pak plyne třeba to, že se dost krkolomně dělá jakákoli korelace mezi hodnotami, stupidní příklad: na SNMP OID X.Y.Z si přečti stav toneru a poděl ho hodnotou z OID A.B.C, čímž dostaneš plnost toneru v procentech a ta má být nad 30. Tohle jde udělat jenom v rámci jednoho checku, nejde to udělat jako dvě samostatné hodnoty. To je podle mě zásadní návrhová chyba, měli udělat sondy zvlášť a vyhodnocovací engine zvlášť.