Ubuntu Server nach einiger Zeit nicht mehr erreichbar

  • Guten Abend zusammen,

    ich habe einen Ubuntu 16.04 vServer, auf welchem ein Mailserver sowie ein WebServer laufen. Jetzt habe ich das Problem, dass nach einiger Zeit (immer unterschiedlich) der Server alle offenen Verbindungen schließt und dann weder per ssh, web aufruf oder sonstwie zu erreichen ist, der Email Server ist dann auch down. Ein Neustaret behebt das Problem für kueze Zeit (1h-4h) bis es wieder auftritt. Ich finde leider nicht wirklich die passenden logs, welche mir weiterhelfen könnten, das Problem zu identifizieren...

  • Moin,


    vielleicht sind die Ressourcen des Servers einfach "verbraucht"?

    Oder werden "verbraucht" durch fehlkonfiguration oder ungewünschte Prozesse?


    Kannst du nach einem Neustart Veränderungen sehen in z.b. top im Laufe der Zeit?

  • Könnte man mal deine /etc/network/interfaces sehen? IP Adressen kannst du ja ggf. wegzensieren.

    Klaro, allerdings sehe ich da keine IPs:

    Was ich noch dazu sagen muss, ich habe zwei ips von Netcup welche auf den Server geroutet sind

  • Hmmm, der Server hat aktuell nur noch 450MB freien RAM Speicher. Ob es wohl daran liegt

  • Klaro, allerdings sehe ich da keine IPs:

    Schau mal in /etc/network/interfaces.d/


    Zudem wären ein paar mehr Informationen vom Vorteil:

    • welche Hardware (VPS /RS)?
    • seit wann tritt das Problem auf?
    • wurde in letzter Zeit was am Server verändert: Software, Konfigurationen, Routing etc.?
    • Gibt es Auffälligkeiten in den Logs, gerade zu den Zeiten wo das Problem auftritt?
    • Wird eine Firewall genutzt und wenn ja wie ist diese konfiguriert?


    Du könntest auch mal ein traceroute vom und zum Server machen.

  • Schau mal in /etc/network/interfaces.d/

  • Ich muss leider sagen, dass das Problem immernoch existiert....

    Heute muss der Server wirder irgendwann über Nacht abgestürtzt worden sein, da eine Email welche um 8 Uhr morgens verschickt werden sollte nicht angekommen ist. Was ich aber nicht verstehe, der Server ist laut netcup trotzdem online und auch logs werden weiterhin erstellt, obwohl der server nicht erreichbar ist. um 10:56 habe ich den Server neu gestartet, hier eiin Teil derLogs (https://pastebin.com/bkXAb4yc).


    Hat jemand evtl noch eine Idee? Ansonsten werde ich den Server wohl neu aufsetzen, auch wenn ich dazu wenig Lust habe

  • Das ist zu wenig Log. Du vermutest nachts einen Absturz und das Log fängt erst quasi dann ab, als du im SCP auf harten Reset geklickt hast.


    Funktionierte dann noch die VNC Konsole via SCP?

    "Security is like an onion - the more you dig in the more you want to cry"

  • Moin,


    hast du denn etwas geändert und wenn was?

    Hier ist ja nur die Rede von.... werde ich beobachten.....


    Der Logauszug den du auf pastebin gepostet hast, sagt nichts aus.


    Wenn du siehst das der RAM "Verbrauch" immer mehr steigt, dann solltest du auch sehen können welche Anwendung das ist und ob das überhaupt das Problem ist.

  • Ich habe einen Prozess, welcher ziemlich viel Ram verbraucht hatte gestoppt, ich habe jetzt 1,5 G available.

    Ich habe nochmal frühere logs hochgeladen (https://pastebin.com/KA6ReJHk) Ich kann da aber nichts erkennen


    Die VNC Konsole scheint erreichbar, allerdings ist mein Passwort zu lang, ich habe immer timeouts beim eingeben bekommen. Ich habe es mal etwas verkürtzt und werde mal beim nächsten mal schauen, ob ich reinkomme

  • wie siehts denn jetzt mit dem Speicherverbrauch aus? Was sagt "top"? Ich sehe, da läuft PHP... welche Konfiguraiton? Apache und/oder nginx?! Du müsstest schon noch ein paar mehr Informationen angeben, damit wir dir auch helfen können, ohne die Glaskugel bemühen zu müssen.


    Hattest Du schon oft ein Linux-System im Rechenzentrum?

  • Die VNC Konsole scheint erreichbar, allerdings ist mein Passwort zu lang, ich habe immer timeouts beim eingeben bekommen.


    Dann hast du auf dem Server ein Last-Problem. Das müsste man auch im SCP unter Auslastung sehen können.

    "Security is like an onion - the more you dig in the more you want to cry"

  • Dann hast du auf dem Server ein Last-Problem. Das müsste man auch im SCP unter Auslastung sehen können.

    Nein, das ist ein Timeout, weil ich ein langes Kennwort habe und zu lange Brauche es einzutippen (Sonderzeichen, zahlen, Groß-Kleinschreibung). Ich habe eine load average von 0.1 - 0.4.


    wie siehts denn jetzt mit dem Speicherverbrauch aus? Was sagt "top"? Ich sehe, da läuft PHP... welche Konfiguraiton? Apache und/oder nginx?! Du müsstest schon noch ein paar mehr Informationen angeben, damit wir dir auch helfen können, ohne die Glaskugel bemühen zu müssen.


    Hattest Du schon oft ein Linux-System im Rechenzentrum?

    Ich habe schon länger Linux Server, ist nicht mein erster. Ich habe Nginx ud php 7.0. Dazu einen Mailcow Mailserver. Dazu sind zwei IPs auf den Server geroutet, wovon eine für den mailserver ist und die andere für den Email Server. Die PHP Conf sowie Nginx Conf sind eigentlich standard, außer, dass ich Nginx an eine IP gebunden habe.

  • Ich habe schon länger Linux Server, ist nicht mein erster. Ich habe Nginx ud php 7.0. Dazu einen Mailcow Mailserver. Dazu sind zwei IPs auf den Server geroutet, wovon eine für den mailserver ist und die andere für den Email Server. Die PHP Conf sowie Nginx Conf sind eigentlich standard, außer, dass ich Nginx an eine IP gebunden habe.

    was sagt den top? Kannst du das bitte einmal vollständig hier reinstellen, damit wir nicht immer raten müssen...

    Nutzt Du docker?

  • rspamd kommt woher? Ich kann ich noch erinnern dass wir damals auch immer ein wenig Ärger mit den SPAM-Prüfungen hatten, weil es einfach so viele Child-Prozesse gab, bis der Server irgendwann den Geist aufgab...


    Derzeit sieht der Server bzw. die Dienste aber unaufällig aus... du hast ja derzeit etwa 65% memory in use was ganz ok ist. Sind die Anzahl rspamd's denn limitiert?

  • Dein Swap ist defekt.

    fast ;) Swap wurde einfach nicht aktiviert bzw. ist jetzt deaktiviert... kann man so machen. Aber Du hast recht, es macht Sinn, da vielleicht noch ein wenig Swap space vorzuhalten. Wobei bei einem Memory-Leak der dann auch voll werden würde ;)