VPS aus unerfindlichen Gründen down - warum?

  • Hallo allerseits,


    einer meiner VPS Instanzen ist vor 2 Tagen down gegangen. Ich musste sie heut morgen neu starten.

    Jetzt wäre es natürlich schön, wenn man heraus bekommt warum das passiert ist.

    Netcup sagt, dass das Wirtssystem seit 55 Tagen on ist, was ich ihnen durchaus glaube.


    Meine syslog ist zumindest für mich nicht aufschlussreich...


    Auch die Ressourcenauslastung zeigt keinerlei Ungereimtheiten...


    Das witzige ist, dass der Dienst, den ich drauf laufen hab auf einem identischen VPS auch noch läuft und dort nicht down gegangen ist...


    Habt ihr eine Ahnung was ich noch nachschauen kann woran das gelegen hat?

  • Ein unvermittelter Abbruch im Log klingt nach "Erzwungen abschalten" aus, im SCP Protokoll ist nicht aufgeführt?

    Im SCP Protokoll stehen genau 2 Dinge:


    neues Image wurde installiert (im März)
    und Server wurde neu gestartet (heute morgen)


    mir ist es völlig schleierhaft was hier passiert ist...

  • Das letzte was nach syslog passierte, war

    Code
    May 16 10:47:01 v22018035818363324 CRON[2562]: (root) CMD (/sbin/fstrim / >/dev/null 2>&1)

    Du wirst aber aufgrund >/dev/null 2>&1 nie herausfinden, ob und wie dies für das Problem verantwortlich ist. Wer schon Fehlermeldungen unterdrückt, sollte wenigstens Fehler ordentlich abfangen.

  • Vielleicht Option Autostart aktivieren im SCP nicht aktiviert und der Host wurde durchgestartet (wartungsbedingt)

  • Vielleicht Option Autostart aktivieren im SCP nicht aktiviert und der Host wurde durchgestartet (wartungsbedingt)

    nope - also wenn das grüne Häkchen bedeutet, dass Autostart AN ist, dann ist es nicht der Fall...

    manchmal steht man echt wie nen Esel vorm Berg und kann nur "muh" machen...

  • Das letzte was nach syslog passierte, war

    Code
    May 16 10:47:01 v22018035818363324 CRON[2562]: (root) CMD (/sbin/fstrim / >/dev/null 2>&1)

    Du wirst aber aufgrund >/dev/null 2>&1 nie herausfinden, ob und wie dies für das Problem verantwortlich ist. Wer schon Fehlermeldungen unterdrückt, sollte wenigstens Fehler ordentlich abfangen.

    Nun das scheint so "Standard" zu sein, denn ich hab nie etwas willentlich unterdrückt. Könntest du mir behilflich sein, da dran was zu ändern (link o.ä.) damit mir das nicht wieder passiert.

  • Gibt es in anderen Logfiles noch Einträge nachdem fstrim gestartet wurde?


    Was meinst du mit down gegangen eigentlich? War die Maschine ausgeschaltet oder hat die mit einer Fehlermeldung in der Konsole gehangen?

    "Security is like an onion - the more you dig in the more you want to cry"

  • Gibt es in anderen Logfiles noch Einträge nachdem fstrim gestartet wurde?


    Was meinst du mit down gegangen eigentlich? War die Maschine ausgeschaltet oder hat die mit einer Fehlermeldung in der Konsole gehangen?

    Die Maschine war "einfach aus". Keinerlei offensichtliche Fehlermeldung o.ä.
    Im SCP einfach gestartet und dann lief alles wie vorher...

    Ich steh bissl aufm Schlauch was fstrim ist... aber egal... es bleibt hoffentlich bei dem einem Mal...

  • Nun das scheint so "Standard" zu sein, denn ich hab nie etwas willentlich unterdrückt. Könntest du mir behilflich sein, da dran was zu ändern (link o.ä.) damit mir das nicht wieder passiert.

    Es gibt mehrere Wege:

    1. Wenn Du den Output nicht unterdrückst, schickt cron den Output per Mail.
    2. Du kannst den Output in eine Logdatei schreiben oder durch logger an syslog übergeben.
    3. Du kannst einen watchdog laufen lassen, damit das System bei Problemen sofort neu startet.
    4. Du solltest das System überwachen, damit damit Du bei solchen Situationen künftig sofort Bescheid weißt.

    Nicht alles davon funktioniert bei jeder Fehlerursache. Daher kannst Du diese Maßnahmen gerne auch kombinieren.