Simples Monitoring für kleine VMs gesucht

DerRené · 11. September 2018

Nun wird es für mich auch mal Zeit eine Frage zu stellen.

Ich bin auf der Suche nach nach einer Möglichkeit, winzige Server (z.B: Raspberry), sowie kleine VMs (1 bis 2 Kerne, 0,5 bis 4 GB RAM) automatisch zu monitoren. Hier im Forum bin ich vereinzelt schon auf die eine oder andere Lösung gestoßen (beispielsweise collectd + Graphite), aber es blieb eher nur bei einer Benennung, statt einer ausführlicheren persönlichen Beschreibung.

Ich denke, dass für meinen Einsatzzweck Systeme wie nagios oder icinga einfach oversized sind. Im Grunde wäre ich sogar nur an sehr wenigen Systemdaten interessiert (CPU, RAM, Diskspace, ggf. ein oder zwei Systemdienste) mit möglicher Alarmierung per Mail. Besser noch mit Anbindung eigener Notification-Scripte. Derzeit lasse ich ein simples Python-Script laufen, das bestimmte Ports prüft und bei Nichterreichbarkeit mir eine Telegram-Nachricht zukommen lässt Simpel, aber funktional.

Edit: Ideal wäre also ein Server, der Daten über die anderen kleinen (Nodes) sammelt und zur Verfügung stellt, ggf. Alarme sendet.

Kennt jemand zufällig solch ein leichtgewichtiges Monitoring-System mit Alarmierung bei Grenzwertüberschreitungen oder generellen Nichterreichbarkeiten bestimmter Ports?

Voraussetzung wäre also selfhosted und minimaler Ressourcenverbrauch (einige VMs sind wirklich noch kleiner als ein Raspberry ).

Achja, ein Großteil der Systeme laufen auf Debian-Basis.

Bin über eure Ideen und Anregungen sehr dankbar.

Gruß

René

alhazred · 11. September 2018

Wenn du keine historischen Daten brauchst, schaue dir Netdata an. da kannst du auch ggf. die Daten in einem Backend ablegen.

KB19 · 11. September 2018

Ich verwende selbst bei sehr kleinen Systemen Munin. Dank muninlite sogar auf OpenWrt/LEDE Routern mit nur 32 MB Ram, 4 MB Flash und einer CPU im unteren 3-stelligen MHz-Bereich. Muninlite ist ein simples Bashscript und lässt sich leicht an die eigenen Bedürfnisse anpassen. Bei den normalen Systemen halt ein normaler Munin-Node, der läuft auch auf Systemen mit wenig Ram gut.

Für meinen Anwendungsfall ist es praktisch, weil es einfach nebenbei mitläuft. Wenn man noch keinen Munin-Master-Server hat, ist es natürlich genauso übertrieben, den extra dafür aufzusetzen. Wirklich ressourcensparend ist der Masterserver nämlich auch nicht…

Caspar · 12. September 2018

Moin,

ich setzte da auf Check_MK.

Es erfüllt all meine Ansprüche :

- Daten ordentlich ablesbar

- Grafisch ersichtlich aber nicht ein wildes buntes geblinke
- Alarmierungen bis ins kleinste kofigurierbar

- Ressourcenarm

- Kleine / handliche Agents die simple zu pflegen sind

- Plugins (Falls der Standardumfang nicht reicht)

Der Einstieg war ein wenig "tricky" aber das ist er, meiner Meinung nach, bei jedem halbwegs vernünftigen Monitoring, aber bei weitem nicht so Umständlich wie bei Nagios.

Ich kann damit alle Dienste die auf unterschiedlichsten Servern laufen überwachen und werde, wenn es denn so gewünscht ist, asap informiert wenn ein Wert sich entsprechend ändert.

Was auch nicht ganz unwichtig war für mich, es ist kostenfrei nutzbar.

perryflynn · 12. September 2018

check_Mk ist aber definitiv nicht Leichtgewichtig.

Caspar · 12. September 2018

Moin perryflynn,

na ja, der Server auf dem es Läuft ist doch schon mehr als gelangweilt.

Aber vermutlich ist das eine Frage womit man das dann vergleicht.

Es handelt sich dabei um meine Eindrücke/Empfindungen und ich finde es Ressourcenschonend

DerRené · 12. September 2018

Prima, genau darum ging es mir, einen Erfahrungsaustausch und persönliche Erfahrungswerte sammeln. Damit kann ich, und ggf. auch andere die sich damit beschäftigen wollen, etwas anfangen.

Sind doch schon mal einige Kandidaten bei, die ich mir nun genauer ansehen werde. Vielen Dank. Und vielleicht verirrt sich noch der eine oder andere Vorschlag hier her.

Vielen Dank schon mal!

Gruß

René

geekmonkey · 12. September 2018

Ich hab nen TIG Stack auf nem VPS laufen, also Telegraf, InfluxDB und Grafana.

Einrichtung dauert keine 10min, Ressourcenverbrauch hält sich in Grenzen. Läuft hinter nem nginx Reverse Proxy.

Auf alle anderen vServer oder root Servern läuft nur Telegraf.

Telegraf greift also die ganzen Metrics ab, sendet sie an die zentrale InfluxDB und Grafana wertet alles grafisch schön auf.

Zusätzlich bietet Grafana bzw. die Firma dahinter kostenlos 1Mio Tracks/Monat an. Damit checke ich z.B. ob der Mailserver online ist, ob die SSL Verbindung des Webservers läuft etc.

Wenn du nicht gerade für jeden Check 7,8 Probs über den Globus verteilst nutzt, bekommst damit relativ viel abgedeckt.

Sonst läuft auf dem VPS eigentlich nix, wobei ich aktuell mit dem Gedanken spiele via acme.sh die Zertifikate für all meine Domains darüber verwalten zu lassen.