Dobrý den,
chystám se na nový monitorovací server. Dohled teď nějakou dobu neprovozuju, z dřívějších dob (cca -8 let) mám zkušenost s Nagios na monitoring dostupností v kombinaci s CACTI na grafování trendů. Vzhledem k mé delší absenci v této oblasti bych rád prodiskutoval aktuální stav systémů a možností, než se vrhnu do budování systému dle původní architektury. Přece jen už je to pár let a vývoj jde dopředu a nemusím procházet všechny slepé uličky. :-)
Požadavky:
1. Provoz na Linuxu, ideálně volná licence. Určitě ne licencování založené na počtu monitorovaných systémů.
2. Chtěl bych monitorovat dostupnost hostů, služeb, definici závislostí prvků na sobě. Testy spouštěné z monitorovacího serveru vůči monitorovaným cílům, případně SNMP, agent na monitorovaném systému.
3. Monitoring trendů, tedy grafování. Zde předpokládám SNMP, agent.
4. Pokud bych uměl sbírat na jedno místo logy, nějaké vyhodnocování, alerty, nástroje pro prohledávání, bylo by to fajn, ale není nutné.
5. Víceuživatelský přístup, role s oprávněními jak z hlediska možnosti prohlížení / konfigurace tak přístupu ke skupinám prostředků. Přiřazování monitorovaných hostů do skupin ručně, ne dle typu. Konfigurace stačí povolená pro lidi s globálním přístupem, osoby s přístupem k omezenému počtu monitorovaných systémů stačí jen čtení.
6. Reporting výpadků, mail, případně SMS. Možnost konfigurace komu reportovat dle skupin, případně časů. Potlačení opakovaného reportu po nějakou dobu.
7. Ideálně webové rozhraní. Další může být jako bonus.
8. Monitorované systémy budou routery, switche, servery, služby na serverech. (Linux, Windows, switche a routery různí výrobci HW).
9. Možnost definovat komplexnější služby složené z jednotlivých hostů / služeb je bonus, není nutné.
10. Něco, co nebude moc složité. Jak pro běžného uživatele, tak pro nastavení. Jak prvotní, tak v rámci údržby a aby to nevyžadovalo někoho, kdo to bude na půl úvazku oprašovat. Stejně tak by to nemělo mít přehnané požadavky na HW.
Architektura by byla taková, že by v centru byl umístěný server s monitorovacím SW a ten by pak monitoroval služby a hosty přes internet a další přes site2site VPN do lokalit. VPN by zařizoval FW předřazený tomu serveru, takže to by neřešil.
Počet monitorovaných hostů/služeb bude v řádu vyšších stovek, max. menších jednotek tisíců.
Jak jsem uvedl výše, zkušenost mám s CACTI a Nagios. Nagios mi plně vyhovoval, co tam bylo krkolomnější byla konfigurace přes textové soubory. Kdyby se standardní konfigurační věci (přidání hosta, smazání hosta, uživatele) daly klikat, bylo by to lepší, mohl bych do správy zapojit více lidí. V tomto se mi líbila Cacti, která měla nastavení přes webové rozhraní. U ní býval trochu problém při větším množství monitorovaných systémů proces sbírání dat, který pak trval delší dobu (což nějaké řešení mělo). Také reprezentace dat z dnešního hlediska asi nebyla úplně moderní.
Co jsem koukal, tak Nagios je zatím stále uváděn mezi top produkty. Cacti také stále žije. Je cesta kombinace těchto produktů stále správná, nebo jdou trendy spíš jinam? Je tu Icinga, fork z Nagiosu, narazil jsem na celkem dobře hodnocený Zabbix. Chci něco hostovaného na vlastním HW, nemám zájem o žádnou cloudovou službu.
Jaké jsou Vaše zkušenosti a doporučení?
Díky
Štěpán