Simples Monitoring für kleine VMs gesucht

  • Nun wird es für mich auch mal Zeit eine Frage zu stellen. ;)


    Ich bin auf der Suche nach nach einer Möglichkeit, winzige Server (z.B: Raspberry), sowie kleine VMs (1 bis 2 Kerne, 0,5 bis 4 GB RAM) automatisch zu monitoren. Hier im Forum bin ich vereinzelt schon auf die eine oder andere Lösung gestoßen (beispielsweise collectd + Graphite), aber es blieb eher nur bei einer Benennung, statt einer ausführlicheren persönlichen Beschreibung.


    Ich denke, dass für meinen Einsatzzweck Systeme wie nagios oder icinga einfach oversized sind. Im Grunde wäre ich sogar nur an sehr wenigen Systemdaten interessiert (CPU, RAM, Diskspace, ggf. ein oder zwei Systemdienste) mit möglicher Alarmierung per Mail. Besser noch mit Anbindung eigener Notification-Scripte. Derzeit lasse ich ein simples Python-Script laufen, das bestimmte Ports prüft und bei Nichterreichbarkeit mir eine Telegram-Nachricht zukommen lässt ^^ Simpel, aber funktional.


    Edit: Ideal wäre also ein Server, der Daten über die anderen kleinen (Nodes) sammelt und zur Verfügung stellt, ggf. Alarme sendet.


    Kennt jemand zufällig solch ein leichtgewichtiges Monitoring-System mit Alarmierung bei Grenzwertüberschreitungen oder generellen Nichterreichbarkeiten bestimmter Ports?

    Voraussetzung wäre also selfhosted und minimaler Ressourcenverbrauch (einige VMs sind wirklich noch kleiner als ein Raspberry :S).


    Achja, ein Großteil der Systeme laufen auf Debian-Basis.


    Bin über eure Ideen und Anregungen sehr dankbar.


    Gruß

    René

  • Ich verwende selbst bei sehr kleinen Systemen Munin. Dank muninlite sogar auf OpenWrt/LEDE Routern mit nur 32 MB Ram, 4 MB Flash und einer CPU im unteren 3-stelligen MHz-Bereich. Muninlite ist ein simples Bashscript und lässt sich leicht an die eigenen Bedürfnisse anpassen. Bei den normalen Systemen halt ein normaler Munin-Node, der läuft auch auf Systemen mit wenig Ram gut.


    Für meinen Anwendungsfall ist es praktisch, weil es einfach nebenbei mitläuft. Wenn man noch keinen Munin-Master-Server hat, ist es natürlich genauso übertrieben, den extra dafür aufzusetzen. Wirklich ressourcensparend ist der Masterserver nämlich auch nicht…

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Moin,


    ich setzte da auf Check_MK.

    Es erfüllt all meine Ansprüche :

    - Daten ordentlich ablesbar

    - Grafisch ersichtlich aber nicht ein wildes buntes geblinke :)
    - Alarmierungen bis ins kleinste kofigurierbar

    - Ressourcenarm

    - Kleine / handliche Agents die simple zu pflegen sind

    - Plugins (Falls der Standardumfang nicht reicht)


    Der Einstieg war ein wenig "tricky" aber das ist er, meiner Meinung nach, bei jedem halbwegs vernünftigen Monitoring, aber bei weitem nicht so Umständlich wie bei Nagios.


    Ich kann damit alle Dienste die auf unterschiedlichsten Servern laufen überwachen und werde, wenn es denn so gewünscht ist, asap informiert wenn ein Wert sich entsprechend ändert.


    Was auch nicht ganz unwichtig war für mich, es ist kostenfrei nutzbar.

  • Moin perryflynn,


    na ja, der Server auf dem es Läuft ist doch schon mehr als gelangweilt.

    Aber vermutlich ist das eine Frage womit man das dann vergleicht.

    Es handelt sich dabei um meine Eindrücke/Empfindungen und ich finde es Ressourcenschonend :)

  • Prima, genau darum ging es mir, einen Erfahrungsaustausch und persönliche Erfahrungswerte sammeln. Damit kann ich, und ggf. auch andere die sich damit beschäftigen wollen, etwas anfangen. :thumbup:


    Sind doch schon mal einige Kandidaten bei, die ich mir nun genauer ansehen werde. Vielen Dank. Und vielleicht verirrt sich noch der eine oder andere Vorschlag hier her. ;)


    Vielen Dank schon mal!


    Gruß

    René

  • Ich hab nen TIG Stack auf nem VPS laufen, also Telegraf, InfluxDB und Grafana.


    Einrichtung dauert keine 10min, Ressourcenverbrauch hält sich in Grenzen. Läuft hinter nem nginx Reverse Proxy.


    Auf alle anderen vServer oder root Servern läuft nur Telegraf.


    Telegraf greift also die ganzen Metrics ab, sendet sie an die zentrale InfluxDB und Grafana wertet alles grafisch schön auf.


    Zusätzlich bietet Grafana bzw. die Firma dahinter kostenlos 1Mio Tracks/Monat an. Damit checke ich z.B. ob der Mailserver online ist, ob die SSL Verbindung des Webservers läuft etc.


    Wenn du nicht gerade für jeden Check 7,8 Probs über den Globus verteilst nutzt, bekommst damit relativ viel abgedeckt.


    Sonst läuft auf dem VPS eigentlich nix, wobei ich aktuell mit dem Gedanken spiele via acme.sh die Zertifikate für all meine Domains darüber verwalten zu lassen.

    Meine Produkte: definitiv zu viele, RS, VPS, Domains, Webhosting, ...