hat wer schon nen Ticket aufgemacht? Ich denke eines sollte reichen, oder?
Bevor nun alle ein Ticket aufmachen übernehm ich das mal.
hat wer schon nen Ticket aufgemacht? Ich denke eines sollte reichen, oder?
Bevor nun alle ein Ticket aufmachen übernehm ich das mal.
Jo, sicher [NC#2018071110000049]
EDIT: Huch, jetzt haben wir geekmonkey zu dritt geantwortet auf eine obsolete Frage.
oh übersehen, sitze gerade in der Uni ?
Edit: aber ich bin ein Fan des Wortes obsolet ?
Display More
Ich habe bei meinen 4 netcup-Servern genau das gleiche Verhaltensmuster:
Am 9. Juli springt der Graph auf ca. - 32.0 m
Keine Ahnung, was das ist. Die Server sind sehr unterschiedlich ausgelastet, aber die Statistik ist identisch. Das ist laut munin im letzten Jahr noch nie passiert.
Grad gesehen, dass netdata mir das auch berichtet hat. Für die 4 Maschinen um 10:34, 10:37, 11:10 und 11:11 (CEST). Beispiel:
Quotenet_drops.eth0Display More
Chart
inbound packets dropped = 20 packets
interface inbound dropped packets in the last 10 minutes
Alarm
eth0
Family
WARNING
Severity
Mon Jul 9 10:34:41 CEST 2018
Time
Bin gespannt, was der Support sagt.
Der Support möchte wissen, ob das auch im Rettungssystem nachvollzogen werden kann (ich tippe mal auf ja). Ich kann das erst nach Feierabend prüfen, hat von euch evtl. jemand gerade Zeit, das auf einem betroffenen Server zu testen? Falls ja, bitte das Ergebnis und den Server-Name an mich durchgeben (PN) oder selbst an den Support mailen mit Verweis auf mein Ticket [NC#2018071110000049].
Der Support möchte wissen, ob das auch im Rettungssystem nachvollzogen werden kann (ich tippe mal auf ja). Ich kann das erst nach Feierabend prüfen, hat von euch evtl. jemand gerade Zeit, das auf einem betroffenen Server zu testen? Falls ja, bitte das Ergebnis und den Server-Name an mich durchgeben (PN) oder selbst an den Support mailen mit Verweis auf mein Ticket [NC#2018071110000049].
Vielleicht reicht der Verweis auf diesen Thread... Bei mehreren Kunden und Dutzenden Servern gleichzeitig, dürfte sich diese Nachfrage vielleicht erübrigen
Meine Intiale Anfrage beim Support bezog sich bereits direkt auf diesen Thread.
Habe es nun schnell am Tablet getestet und ja es ist auch im Rettungssystem der Fall.
Die Ursache für die Drops wurde vom Support ermittelt und behoben, es werden nun keine weiteren Pakete mehr verworfen.
Keine Angabe der Ursache? Schade.
Hätte ich auch gerne gewusst, wie die Ursache war?
Naja, ein gutes hats, ... ich hab heute morgen aus diesem Anlass mal auf allen meinen Servern munin-nodes installiert zum zentral beobachten - haha
Naja, ein gutes hats, ... ich hab heute morgen aus diesem Anlass mal auf allen meinen Servern munin-nodes installiert zum zentral beobachten - haha
Ich kann als alternative übrigens einen Collectd empfehlen, der die Daten in eine InfluxDB schreibt und Gafana als Frontend zur Visualisierung empfehlen. Ich glaube perryflynn hatte dazu auch schon mal einen Blog Eintrag geschrieben.
Zur eigentlichen Problematik: Wir konnten die Ursache beheben. Es kam im Rahmen einer Erweiterung unseres Monitorings vereinzelt zu fehlerhaften Paketen im Netzwerk, die dann in diese Drops resultierten.
Wir haben gestern eine Anpassung ausgerollt. Seitdem dürften keine Drops mehr feststellbar sein.
Ich glaube perryflynn hatte dazu auch schon mal einen Blog Eintrag geschrieben.
Hat er. Allerdings habe ich die Datenerfassung mit Shell selbst gescripted. Collectd habe ich mir noch nicht weiter angeschaut. InfluxDB hingegen nutze ich auch für meine Sensoren die draußen und drinnen so verbaut sind. Funktioniert super.
werde es mir mal angucken. Danke für den Tipp!
Zwei meiner Server verzeichnen seit Februar wieder verworfene eingehende Pakete:
if_err_eth0-pinpoint=1581390828,1582392725.pngif_err_eth0-pinpoint=1582372217,1583131841.png
Auf meinen zwei weiteren Servern ist das nachdem ich sie gestern aktualisiert und neu gebootet habe ebenfalls der Fall.
[netcup] Kai S. Habt ihr wieder was am Monitoring gebastelt?
Same here. Hab um 19:23:14 (Ortszeit) den Server aus/angeschaltet um KVM Updates zu machen.
Seit dem relativ exakt 1 Drop / 30 Sekunden.
Werde dazu ein Ticket aufmachen und auf diesen Thread verweisen, daher:
Hallo und liebe grüße an die Person die dieses Ticket bearbeitet xD
Seit kurz vor 12 Uhr am 26.08. ist wieder Ruhe und es kommen keine Pakete mehr herein, die fallen gelassen werden - so zeigt es übereinstimmend meine Überwachung für 3 Server. Lediglich im nclabs-Umfeld ist die Situation unverändert und es werden weiterhin Pakete gedropped.
Hallo zusammen,
danke für eure Hinweise.
Wir konnten dies beheben. Der Sachverhalt sollte nun überall gelöst sein (auch bei nclabs).
Top, vielen Dank!
(nclabs ist seit Freitag mittag auch wieder sauber, danke!)