Odporucil by som implementaciu cez OpenTelemetry (OTEL)
https://opentelemetry.io standard. V heterogennej sieti budu mat rozne zariadenia roznu podporu cez rozne nastroje, co sa da vyuzit a cez OTEL kolektor to zjednotit. Napr. niektore zariadenie budu posielat metriky cez Prometheus, niektore cez Telegraf avsak vsetky to budu posielat na OTEL kolektor. Tam si vytvori metric pipeline, ktora to bude exportovat do zvoleneho ciela (zvycajne time series DB - TSDB). Napriklad mas velky rozpocet tak do plateneho Dynatrace. Po case budes nespokojny tak iba zapnes dalsi exporter, napr. InfluxDB a vybavene.
Obmedzenie je ze OTEL collector musi podporovat dany nastroj, je ich celkom dost
https://github.com/open-telemetry/opentelemetry-collector-contrib/tree/main/receiver a zaroven na zvoleny ciel musis mat exporter
https://github.com/open-telemetry/opentelemetry-collector-contrib/tree/main/exporter . Pre zaznam: OTEL protokol pre metriky je stabilny, avsak implementacia v OTEL kolektore je este stale oficialne experimentalna
https://opentelemetry.io/status/ - OTEL preferoval implementaciu tracingu najprv, teraz sa robi intezivne na metrikach a logy budu posledne.
OTEL bude prostrednik, ktory ti dovoli pouzivat viacer nastroje na zber metrik avsak zaroven ich vsetky ulozis na jedno miesto (TSDB). V najhorsom pripade si budes musiet napisat sam vlastny receiver/exporter pre OTEL kolektor ak dany nastroj/OTEL nie su podporovane. Je to iba tranformacia legacy protokolu na OTEL protokol (OTLP). Taky Zabbix (zatial) alebo check_mk, nagios, icinga asi nemaju este OTEL podporu. Naviac OTEL koncept moze byt pouzity aj pre aplikacny monitoring/tracing, co moze byt dalsi zdroj metrik.
Zvolenu TSDB mozes vyuzit na alerting. Niektore TSDB maju svoje buzzwordy ako machine learning, artifcial inteligence, anomaly detection, tak tieto mozu vhodne doplnat staticke thresholdy.
OTEL ziskava na popularite a velky vyrobcovia ho priamo implementuju - napr. Elasticsearch potreboval niekedy svoj exporter avsak teraz uz ma OTLP podporu, takze nic specialne nie je potrebne. AWS dokonca ma svoj "klon" kolektora oficialne podporovany. Takze namiesto sustredenia sa na jeden tool, by som postavil OTEL infrastrukturu, ktora bude pripravena na buducnost, t.j. budes moct pouzivat viacere nastroje a posielat ich metriky do viacerych TSDB - aj takych ktore este neexistuju avsak budu a budu podporovat OTEL.