Packet Loss / vServer (Root) nicht mehr erreichbar

  • Hallo zusammen,


    ich habe aktuell ein komisches Problem mit meinen RS 500 SAS G7SEa1 12M und VPS 1000 G7SEa1 12M.


    Seit vorgestern zeigt mir mein Monitoring mehrfache Nicht-Erreichbarkeiten meines RS 500 SAS (der VPS 1000 ist bisher noch nicht im Monitoring, werde ich aber nachholen) für ein paar Minuten. Am 28.11 mehrfach zw. 5:40-5:48, 7:22-7:30, 9:12-9:20, 11:08-11:14 Uhr und heute zw. 3:37-3:55, 6:53-6:55, 14:17-14:25 Uhr. Gerade (~15:45 Uhr) war ich auf beiden Servern per SSH verbunden und hatte einen Timeout, gleichzeitig testweise auf dem Teamspeak-Server, welcher auf einem der Systeme läuft rausgeflogen. Komischerweise scheinen die Abbrüche nur via IPv4 zu passieren, andere User (alle, welche mit IPv6 verbinden) hatten zumindest im Teamspeak keinen disconnect.



    Ich hatte vorhin bereits den Support kontaktiert, da war aber die SSH-Verbindung noch nicht abgebrochen und ich dachte, der zweite Server (VPS 1000) wäre nicht betroffen.


    Nun könnte es natürlich an irgendeinem Anbieter oder Peering liegen, mein Anschluss liegt im Belwue (AS443) und ich habe aus dem Netz von Versatel (AS8881) eine Traceroute gemacht, die folgendermaßen aussieht:



    Von zu Hause siehts folgendermaßen aus:



    Jetzt frage ich mich doch, was machen Core-Backbone bzw. IP's von dem Anbieter mit dem roten H in meiner Traceroute? IPv4-Peering Problem?


    Ich hatte ja wie bereits beschrieben mit dem Support-Kontakt, würde jedoch gerne von der Community mal das Feedback abwarten, ob dies jemand anderes auch schon festgestellt hat.


    Meine beiden Server liegen in 37.120.160.0/19 bzw. 37.221.192.0/21. Konfigurationen wurden in den letzten Tagen nicht geändert, weshalb ich davon ausgehe, dass ich nichts kaputt gemacht habe, bzw. ich bei der Einrichtung von beiden Servern Fehler gemacht haben müsste, welcher sich jetzt erst auswirkt...


    Grüße

  • Hay,


    aha - ich hatte schon Panik, was jetzt schon wieder sei, als um ~15:47 meine Telefone nicht mehr über meine Asterisk (gehostet auf einem RS8000 G7) zu erreichen waren.


    Nach einem ausdrücklichen Reconnect waren sie wieder da. Sieht so aus, als ob es eine nennenswerte Beeinträchtigung gewesen war.


    CU, Peter

    Peter Kleemann // https://www.pkleemann.de // +49 621 1806222-0 // Kann Programme, Internet, Netzwerke und Telefon.

  • Guten Tag,



    es gab leider eine nicht erwartete Änderung im Routing. Dank mehrfach redundanter Anbindung hat sich dieses in Form des "Rucklers" bemerkbar gemacht.


    Wir bitten für die Störung um Entschuldigung.



    Mit freundlichen Grüßen


    Felix Preuß

  • Ich wurde von 15:47 Uhr bis 16:22 Uhr mit abwechselnd gelb / grünen Lämpchen, am Arbeitsplatz begleitet, was daran liegt, dass das nc-interne Monitoring bereits anschlägt, wenn ping >1ms. Das trat offensichtlich sehr oft auf.

    Noch "besser" finde ich aber DUPLICATES FOUND! , was mir heute zum ersten mal unter die Augen kommt, aus dieser Meldung für den Ping-Check:

    Code
    ***** Icinga  *****
    Notification Type: PROBLEM
    Date/Time: 2017-11-29 16:22:43 +0100
    
    Additional Info: PING WARNING - DUPLICATES FOUND! Packet loss = 0%, RTA = 0.42 ms

    Diese trat auch mehrfach auf verschiedenen Systemen auf.

    Aber wie gesagt sieht aktuell wieder alles OK aus.

  • Nachdem hier für mich noch etwas Hoffnung aufkam, hatte ich gerade wieder einen 5-10minütigen Ausfall. Traceroute vom Server selbst per VNC zeigt 80-90% Packet Loss (im problematischen Zeitraum kam aber kein Paket durch, die anderen Pakete kamen vorher und nachher an).


    Das Rettungssystem bootet nun schon seit 10 Minuten... Ich gehe dann wohl mal von einem Host-Problem oder ähnlichem aus. Mal schauen, ob der Support das jetzt auch so sieht...