Ubuntu Server für Minuten nicht erreichbar

  • Hallo,


    ich habe andere threads mit ähnlichen Thema hier verfolgt - aber sie scheinen nicht auf meinen Fall zu passen. Mein vServer ist von außen für mehrere Sekunden, manchmal sogar Minuten, nicht

    erreichbar, weder per HTTP noch per IMAP, noch per SSH. Die Serverauslastung ist gering, RAM ist vorhanden, geswappt wird nicht, in den Logs steht nichts Auffälliges. Allerdings kommt man über die SCP Konsole noch an ihn heran.

    Das Problem taucht in 24 h etwa 5 mal auf - meistens nachts (MXToolBox-Monitoring). Starte ich dauerhaft von meinem PC ein MTR zu dem Server tauchen die Probleme gar nicht mehr auf. Deswegen sieht es für mich so aus als ginge irgendetwas in einen Energiesparmodus. IP-Adressen habe ich nur eine. Es handelt sich um Ubuntu Server 16.04,



  • Also irgendwie funktioniert die Netzwerkeinstellung nur so halb:


    /etc/network/interfaces:

  • ifup --verbose ens3

  • hm ok. Dein Problem liegt wohl an den IPv6 Einstellung.

    Laut Netcup Wiki muss der Server einmal ausgeschaltet werden, damit die Änderung wirkt.

    (Im Webinterface PowerOff - kein Restart/Shutdown via Shell)


    Hast du das schon gemacht?

  • All lights are green:

    Was habe ich gemacht:


    Code
    sudo ifup --ignore-errors ens3
    Neustart

    Dabei habe ich festgestellt, dass es da im Ordner /etc/network/if-up.d eine Datei ubuntu-fan gibt; auch dieses script antwortete mit einem Fehler; ich habe diese Dateien aus den Ordnern if-down.d, if-up.d entfernt.

  • Hm, das eigentliche Problem ist noch immer nicht gelöst: alle paar Stunden ist der Rechner für ein paar Minuten isoliert; er ist ein Munin-Server; er versucht alle 5 Minuten Daten von seinem node abzurufen - auch ihn erreicht er nicht während so eines Blackouts. Der Node ist ein anderer vserver auf einem anderen Host und nur gw01.netcup.net ist dazwischen. Ansonsten ist nicht auffälliges zu entdecken. Vielleicht könnte man sich das doch mal jemand vom Support aus Sicht von gw01.netcup.net angucken? Der Letzte Ausfall war heute gegen 22:40; der davor gegen 10:04.

    Hat noch jemand einen Tip was ich weiter untersuchen könnte?

  • Ich habe in letzter Zeit auch massive Probleme, siehe https://forum.netcup.de/admini…A4ndige-netzwerkprobleme/


    Dabei lief der Server lange Zeit einwandfrei, habe ihn auch als Spieleserver benutzt und es gab nie Ausfälle. Wie bei dir sind reichlich Ressourcen vorhanden, IPv6 habe ich allerdings nicht konfiguriert und meine Debian Jessie Installation startet explizit ohne IPv6 Unterstützung. Vom Support habe ich nur die Info bekommen, ich soll das Ganze aus dem Rescue System nachstellen, was natürlich nur mit Downtime des Servers verbunden ist und da der Fehler nur sporadisch auftritt, muss ich die Diagnose lange Zeit laufen lassen.

  • Hallo,


    habe das seit gestern das gleiche Problem. Nutze einen Server als Monitoring und der schlägt öfter Alarm:


    22:20 Uhr, 22:55 Uhr, 23:06 Uhr, 0:27Uhr, 1:17 Uhr, 1:51 Uhr, 3:42 Uhr, 5:06 Uhr, 6:12 Uhr


    Ich lasse jetzt auf den Server (noch im Normal-Mode) MTR laufen. Als Gegen-Server einen weiteren bei Netcup. Mal sehen was passiert.

  • Gestern Abend gegen 22:30 ist es bei mir das letzte Mal aufgetreten; danach habe ich über Nacht einen MTR von dem anderen vServer zum Problemkandidaten laufen lassen und währenddessen trat kein weiteres Problem auf. Ohne den laufenden MTR wäre es wieder 4 bis 6 mal zu Verbindungsabbrüchen gekommen. Nachts treten sie häufiger auf als tagsüber.


    snip.jpg

  • Heute Nacht (8.6). traten die Probleme zweimal auf: gegen 1:14 und 5:44 (+-3min). Evtl tritt das Problem auch öfter auf - wird nur nicht erkannt. Es sieht so aus als würde manchmal irgendeine Komponente zu langsam antworten.

  • Hmm, bei mir heute Nacht 0:30 bis 0:32, 4:05 bis 4:08 und 6:33 bis 6:33 (also nur ein paar Sekunden). Auffällig ist, es betraf nur die zwei IPs aus dem 46.38.231.xxx Range. Meine 37.120.189.xxx IP war von den Ausfällen nicht betroffen.

  • 2017/06/08 05:45:04 [FATAL] Socket read from web.domain.de failed. Terminating process. at /usr/share/perl5/Munin/Master/UpdateWorker.pm line 254.


    2017/06/08 05:45:04 [ERROR] Munin::Master::UpdateWorker<domain.de;web.domain.de> died with '[FATAL] Socket read from web.domain.de failed. Terminating process. at /usr/share/perl5/Munin/Master/UpdateWorker.pm line 254.


    Betroffen ist bei mir die IP 37.120.173.xxx, NICHT betroffen ist 37.120.169.xxx