Doporučte monitoring pro začátečníka

amay5267 · « **Odpověď #15 kdy:** 30. 08. 2025, 22:29:46 »

Citace: kopevi2 30. 08. 2025, 17:33:07

Citace: M Z 30. 08. 2025, 13:30:58
Asi trochu pozdě, ale možná by jsi se mohl podívat na https://checkmk.com/
Je to takový Nagios na steroidech. Monitoruji tím stovky serverů, tiskáren a switchů už asi 10 let, zatím jsem nenašel nic lepšího.
Pozdě ještě není, pořád se rozhoupávám co zvolit a jak to udělat. Nagios jsem kdysi viděl, líbilo se mi, jak to pěkně kreslilo návaznosti prvků, ale pro mě to byla vyšší dívčí (tímto zdravím Ricarda a Wira z Pod-o-lee :-) ). A znáte nějaký monitorink, kde bych si rovnou rozkliknul např. ssh konzoli, nebo bych mohl schraňovat konfiguráky (např. na ten wireguard)?

https://www.netxms.org/documentation/adminguide/ssh-monitoring.html

Reklama

kopevi2 · « **Odpověď #16 kdy:** 31. 08. 2025, 19:45:17 »

Citace: amay5267 30. 08. 2025, 22:29:46

...
https://www.netxms.org/documentation/adminguide/ssh-monitoring.html

Díky moc, asi zkusím to netxms, protože se mi líbí, jak to pěkně jde všechno rozřadit a navíc to umí MQTT, což by bylo super na určitý čidla, který nechci sypat do Home assistanta.

František Ryšánek · « **Odpověď #17 kdy:** 01. 09. 2025, 09:41:48 »

Tyjo, netxms má poměrně detailní datový model:

https://netxms.org/documentation/userguide/basic-concepts.html

Hmm... ! :-)

LivingLegend · « **Odpověď #18 kdy:** 01. 09. 2025, 16:02:30 »

Citace: kopevi2 23. 08. 2025, 19:32:33

Zdravím,
chtěl bych se zeptat na vhodný monitoring. Chtěl bych monitorovat cca 10 strojů (NASky, tiskárna Brother, různé jednodeskové počítače-debian, routery-openwrt). Zařízení mám mezi sebou spojené VPN tunely wireguard. Zkoušel jsem Cacti, ale moc mi tam nejde to SNMP na tiskárny.
Mohli byste mi doporučit vhodný monitorovací systém (poměr výkon/jednoduchost). Na mail-in-a-box mám munin, šlo by to použít i na to?
Chtěl bych zaznamenávat rychlost sítě, využití disků, teploty, pokusy na přihlášení na ssh, případně další věci, ideálně, aby tam šlo i dobastlit sbírání dat z čidel (vlhkost apod, cron na php skript). Upozornění např. na email. Konfigurace ideálně v texťáku.
Děkuji za případné tipy a nasměřování.

Já bych sáhnul po Zabbixu – a to ne proto, že s ním dělám, ale prostě proto, že dává smysl. Na Proxmoxu to rozběháš klidně na dvou virtuálkách (jedna na frontend + Zabbix, druhá na PostgreSQL s TimescaleDB nebo jak se to teď jmenuje). Není to žádná věda. Spousta věcí, co chceš, už je hotová v šablonách. A navíc existuje jednoduchá integrace do Home Assistantu. Myslím, že na to má dokonce video i Dmitrij (tvář Zabbixu na YouTube).

Druhá varianta je Grafana s Mimirem (proč si hrát Prometheem, když si ho Grafana sama forknula).

Tohle jsou jinak dvě nejčastější řešení, na která narazíš v korporátech – třeba v Alze nebo O2. Takže to má i profesní přesah.

kopevi2 · « **Odpověď #19 kdy:** 01. 09. 2025, 17:30:24 »

Citace: LivingLegend 01. 09. 2025, 16:02:30

......
Já bych sáhnul po Zabbixu – a to ne proto, že s ním dělám, ale prostě proto, že dává smysl. Na Proxmoxu to rozběháš klidně na dvou virtuálkách (jedna na frontend + Zabbix, druhá na PostgreSQL s TimescaleDB nebo jak se to teď jmenuje). Není to žádná věda. Spousta věcí, co chceš, už je hotová v šablonách. A navíc existuje jednoduchá integrace do Home Assistantu. Myslím, že na to má dokonce video i Dmitrij (tvář Zabbixu na YouTube).

.....

Dík za poposunutí, a šlo by to udělat tak, že bych si udělal virtuálku v ní měl to SQL a taky v dockeru ten Zabbix (tzn. ušetřil bych jeden virtualni stroj)? To Wyse má jen 4 jádra, a mám volno jen na dvě virtuálky, na jedný už jedu právě ten HA... Pardon, že se takhle blbě ptám, ale jsem fakt začátečník/nadšenec, někde to na mě troubilo, že databáze se v dockeru neukládá, tak bych úplně nechtěl přijít o data, i když o nic nejde, ale taky nechci zabít pár hodin tím, že budu dělat něco, co nemůže fungovat, kvůli mému špatnému rozhodnutí...

Reklama

michaelscz · « **Odpověď #20 kdy:** 01. 09. 2025, 22:32:12 »

Observium
https://hub.docker.com/r/uberchuckie/observium

Kód: [Vybrat]

services:
  app:
    image: uberchuckie/observium
    container_name: observium
    environment:
      - TZ=Europe/Prague
    volumes:
      - observium-config:/config
      - observium-logs:/opt/observium/logs
      - observium-rrd:/opt/observium/rrd
    ports:
      - "8668:8668"
      - "514:514/udp"
    restart: unless-stopped
    healthcheck:
      test: ["CMD", "nmap", "-p", "8668", "localhost", "|",  "grep", "open", "&&", "exit", "0", "||", "exit", "1" ]

volumes:
      observium-config:
      observium-logs:
      observium-rrd:

LivingLegend · « **Odpověď #21 kdy:** 02. 09. 2025, 09:07:38 »

Citace: kopevi2 01. 09. 2025, 17:30:24

Dík za poposunutí, a šlo by to udělat tak, že bych si udělal virtuálku v ní měl to SQL a taky v dockeru ten Zabbix (tzn. ušetřil bych jeden virtualni stroj)? To Wyse má jen 4 jádra, a mám volno jen na dvě virtuálky, na jedný už jedu právě ten HA... Pardon, že se takhle blbě ptám, ale jsem fakt začátečník/nadšenec, někde to na mě troubilo, že databáze se v dockeru neukládá, tak bych úplně nechtěl přijít o data, i když o nic nejde, ale taky nechci zabít pár hodin tím, že budu dělat něco, co nemůže fungovat, kvůli mému špatnému rozhodnutí...

Tak ono je Zabbixu celkem jedno, kde tu databázi máš – klidně to můžeš mít i celé na jednom serveru. Jen zkušenost je taková, že je lepší to mít oddělené. Ve finále to klidně může běžet celé v kontejnerech

Jen to ale není doporučeno pro produkční prostředí.

https://www.zabbix.com/container_images
https://www.youtube.com/watch?v=csZwhQcJmxQ&ab_channel=Zabbix
https://www.zabbix.com/documentation/current/en/manual/installation/containers

A jinak určitě PSQL s TimescaleDB. To je teď nejvíce podporovaná varianta.

kopevi2 · « **Odpověď #22 kdy:** 02. 09. 2025, 12:06:02 »

Děkuji všem, o víkendu teda zkusím ten zabbix a vedle toho ten netxms, pak to porovnám, co mi bude vyhovovat nejvíce. Dle vašich doporučení jsem si našel ten yt kanál o zabbixu a je to tam popsáno přesně polopaticky, takže to snad nebude na dny/hodiny laborování :-).

amay5267 · « **Odpověď #23 kdy:** 02. 09. 2025, 15:50:26 »

Citace: kopevi2 02. 09. 2025, 12:06:02

Děkuji všem, o víkendu teda zkusím ten zabbix a vedle toho ten netxms, pak to porovnám, co mi bude vyhovovat nejvíce. Dle vašich doporučení jsem si našel ten yt kanál o zabbixu a je to tam popsáno přesně polopaticky, takže to snad nebude na dny/hodiny laborování :-).

Playlist super tutorialov pre zaciatocnikov na NetXMS od Tomasa Kirnaka:

https://www.youtube.com/playlist?list=PLt3aE2eGS5P9L72H82S83MrKx2uz5x8gv

amay5267 · « **Odpověď #24 kdy:** 06. 10. 2025, 10:58:29 »

Super vec je oficialny NetXMS client pre mobilne zariadenia Android:

https://play.google.com/store/apps/details?id=org.netxms.android

xsouku04 · « **Odpověď #25 kdy:** 15. 10. 2025, 14:40:06 »

My to často děláme tak, že pokud se zachytí nějaký stav, který by neměl existovat, pošleme si zprávu na Telegram do k tomu zřízené skupiny. Tu skupinu může odebírat více lidí a výhoda je, že je tam i historie problémů. Pak si stačí pohlídat, že se zpráva pošle jen při změně stavu a máte kompletní historii.

Zpráva se pak odešle volání obyčejného URL třeba přes wget.

Kód: [Vybrat]

https://api.telegram.org/bot<BOT_TOKEN>/sendMessage?chat_id=<CHAT_ID>&text=<b>Bold message</b>&parse_mode=HTML
Předem si musím registrovat id nového bota a přidat je do skupiny a zjistit id skupiny.

https://chatgpt.com/share/68ef95ae-a05c-8002-bb04-68336a75ca4b

Specializované systémy, které mají sloužit jen pro monitoring jsem nepochopil. Jsou složité a nic moc navíc to nepřinese.

Zopper · « **Odpověď #26 kdy:** 15. 10. 2025, 18:08:52 »

Citace: xsouku04 15. 10. 2025, 14:40:06

My to často děláme tak, že pokud se zachytí nějaký stav, který by neměl existovat, pošleme si zprávu na Telegram do k tomu zřízené skupiny.
...
Specializované systémy, které mají sloužit jen pro monitoring jsem nepochopil. Jsou složité a nic moc navíc to nepřinese.

Tohle funguje v malém týmu a situaci, kde se těch problémů moc neděje a může si tam člověk tyhle custom věci snadno dodělat. Pokud by ten kanál mělo monitorovat sto lidí, a chodilo tam furt něco, tak to začnou všichni ignorovat. Takže se musí rozdělit role a scope (developera v týmu X možná zajímá, že jeho služba má problém, ale fakt nepotřebuje vědět, že na serveru týmu Y umřel disk), různé priority problémů, je potřeba udržet jednotnost monitoringu v rámci projektu, do toho se přidají požadavky na certifikaci...

A to je zatím jen detekce stavů pro alerty. Já ale chci vidět, co třeba dělá nová změna mojí služby s počtem spojení na databázi. Ale abych to mohl posoudit, potřebuji vidět i kolik chodí požadavků na tu službu, nestačí si jen grepnout něco v terminálu. Obzvlášť, když ani nemám do produkčního prostředí přístup na shell.

Nebo pokud jde o nějakou službu/server od někoho jiného - asi bude mít nějaký endpoint co bude produkovat metriky pro Prometheus, ale těžko do něj budu dělat binární patche, abych si tam přidal http call. Nedej bože, když to ani neběží na mém železe. To se pak najednou nějaké monitorovací systémy, kde se to všechno sbírá dohromady, začnou pořádně hodit.

Doporučte monitoring pro začátečníka

amay5267

Re:Doporučte monitoring pro začátečníka

Reklama

kopevi2

Re:Doporučte monitoring pro začátečníka

František Ryšánek

Re:Doporučte monitoring pro začátečníka

LivingLegend

Re:Doporučte monitoring pro začátečníka

kopevi2

Re:Doporučte monitoring pro začátečníka

Reklama

michaelscz

Re:Doporučte monitoring pro začátečníka

LivingLegend

Re:Doporučte monitoring pro začátečníka

kopevi2

Re:Doporučte monitoring pro začátečníka

amay5267

Re:Doporučte monitoring pro začátečníka

amay5267

Re:Doporučte monitoring pro začátečníka

xsouku04

Re:Doporučte monitoring pro začátečníka

Zopper

Re:Doporučte monitoring pro začátečníka