Hallo @all,
aktuell beschäftigt mich wieder mal das Thema Monitoring...
Aktuell nutze ich ein TIG-Stack (Telegraf, InfluxDB, Grafana) und bin eigentlich zufrieden damit.
Einzige Mankos:
Die Alert-Möglichkeiten von Grafana sind begrenzt und können nicht immer an meine Bedürfnisse angepasst werden.
Single point of failure da es zentral läuft. (Soweit ich nachgelesen habe kann man das auch nicht einfach ändern).
Metrics werden gepusht.
Als Alternative habe ich gerade Prometheus im Auge.
Die Vorteile die ich sehe:
Telegraf hat die Möglichkeit einen Endpoint für Prometheus zu machen somit müsste ich nicht viel ändern.
Grafana Dashboards können weiterverwendet werden.
Prometheus kann leicht im HA betrieben werden. (Einfach 2 idente Setups starten und die Alertmanager verbinden)
Der Alertmanger kann soweit ich das jetzt gesehen habe doch um einiges mehr als Grafana.
Metrics werden gepullt.
Jetzt würde ich gerne wissen wie euer Monitoring aufgebaut ist und bzw. welche Software ihr dafür einsetzt?
Vielen Dank und liebe Grüße,
Nano