VPS mit Proxmox startet sich neu / crasht?

  • Hallo zusammen!


    Soweit ich weiß betreiben hier einige Leute Proxmox auf ihren Servern und mit LXC Containern sollte das soweit ich weiß auch kein Problem darstellen. Leider habe ich heute bemerkt, dass der Host (ein VPS 1337 mit 2 Kernen, 8GB RAM, 160GB SSD) gefühlt random neustartet und somit auch die Container nicht mehr erreichbar sind.


    Das Problem hatte ich letzte Woche auch, aber da dachte ich tatsächlich noch, ich hätte vielleicht nur im falschen Terminal den Reboot Befehl eingegeben. Heute stand ich aber garantiert unter der Dusche zu dem Zeitpunkt ^^ Das Log zeigt nur das hier an, nicht wirklich vielaussagend:


    Laut Log kam das ganze aus dem nichts, da die Stunde zuvor nichts passiert ist außer normalen Systemnachrichten. Im SCP ist die Uptime auch nicht zurückgesetzt worden und es gab auch keine Email seitens Netcup. Proxmox ist auf der aktuellsten Version des Community Repos. Das System ist nicht ansatzweise ausgelastet.


    Hat jemand etwas ähnliches beobachten können? Gibt es noch speziellere weitere Logs, die ich anschauen könnte? Bei Google finde ich nur Leute, die etwas ähnliches hatten, aber nie eine Lösung gefunden haben.

  • Es ist ein PVE 8.


    An den Thread konnte ich mich noch erinnern und hatte ihn nochmal überflogen. Da am Ende alle zufrieden waren, habe ich gehofft, dass man zumindest das als Fehlerursache ausschließen kann und mit Containern relativ sicher ist :/

  • Wieso der Umweg über Proxmox zu LXC und nicht Docker/Podman? Ein Container sollte nicht wie eine VM verwendet werden.

    RS Ostern L OST22 (~RS "3000" G9.5) (8C,24GB,960GB) | RS Cyber Quack (1C,2GB,40GB)

  • Es ist ein PVE 8.

    Seit gut 17 Tagen habe ich auch auf meinem RS 4000 G 9.5 Proxmox 8 ohne ungewollte Neustarts laufen.

    Mal sehen, wann dieses System wieder abschmiert. Denn den Test hat bei mir erst ein System bestanden, wenn es ohne Probleme mindestens 60 Tage am Stück durchlief.


    Bei Mitbewerber habe ich solche oder auch ähnliche Probleme bezüglich Proxmox 7 und 8 auf deren vServer noch nicht gehabt.

  • Wieso der Umweg über Proxmox zu LXC und nicht Docker/Podman? Ein Container sollte nicht wie eine VM verwendet werden.

    Weil mir Proxmox sehr gut gefällt und ich eben VM-artige Container benutzen kann und will, die aber einen winzigen Ressourcenverbrauch haben. Die eingebaute Backup Funktion ist einfach zu bedienen, funktioniert gut und legt die Backups direkt Zuhause auf meinem NAS ab, welches beim Host eingebunden ist. Ich kann Snapshots anlegen zum testen von Funktionen/Upgrades und viele weitere Sachen, die mir eben sehr gut zusagen.


    Seit gut 17 Tagen habe ich auch auf meinem RS 4000 G 9.5 Proxmox 8 ohne ungewollte Neustarts laufen.

    Leider habe ich keinen RS zum testen und meine anderen VPS aus anderen Generationen haben nicht die benötigten Ressourcen, um das ganze damit testweise laufen zu lassen.

    Solche Fehler sind immer frustrierend, wenn sie nur so selten auftauchen und man sie nicht erzwungen reproduzieren kann ^^

  • Evtl. hilft es temporär den Kernel zu wechseln - also den Stock Debian Kernel oder was selbst kompiliertes.

    Es gibt wohl auch neue optionale Kernel von Proxmox (apt cache einmal befragen).


    Ansonsten mit Verweis auf den alten Thread an den Support eskalieren und [netcup] Lars S. anpingen.

    Ggf. auf einen neuen Host verschieben lassen.

  • Interessanterweise hat mein Host kurz nach meinen Nachrichten neue Updates gefunden (was für ein Timing), unter anderem der Kernel. Sind zwar dementsprechend nur kleine Versionssprünge, aber es waren überraschend viele Module. Ich werde das ganze mal damit beobachten und dann gegebenenfalls andere Kernel probieren :)

  • Falls du kein nested-virt durch nectup bekommen hast, dann würde ich mal den Support fragen. Die TLDR war damals, dass es mit nested-virt CPU flag zu CPU stalls gekommen ist, und ohne zu harten reboots. Ursache lag bei Netcup und Kernel-Flags im Host.

  • Ich hatte jetzt eine Woche Urlaub und der Host läuft seit meiner letzten Nachricht. Ich bin am beten, dass es sich tatsächlich mit den letzten Updates erledigt haben könnte. Zumindest wäre das mein Wunschdenken ^^ Mal die nächsten Tage weiter beobachten.

  • Du hast Urlaub und schon läufts stabil. Korrelation oder Kausalität? ;)

    Ohne Mist, ich war gestern Abend am spielen mit 2 Freunden und plötzlich haben wir die Verbindung verloren und mein erster Gedanke war sofort "NÄ, als ob es jetzt abschmiert, wenn ich wieder mitspiele!".


    Zum Glück waren es aber nur kurze Verbindungsprobleme von und zu Netcup, vermutlich. Es war 5 Minuten lang alles zäh und alles Netcup mäßige hatte Timeouts für mich, aber dann hat es sich gefangen :)

  • Seit gut 17 Tagen habe ich auch auf meinem RS 4000 G 9.5 Proxmox 8 ohne ungewollte Neustarts laufen.

    Mal sehen, wann dieses System wieder abschmiert. Denn den Test hat bei mir erst ein System bestanden, wenn es ohne Probleme mindestens 60 Tage am Stück durchlief.


    Bei Mitbewerber habe ich solche oder auch ähnliche Probleme bezüglich Proxmox 7 und 8 auf deren vServer noch nicht gehabt.

    Ich hatte jetzt eine Woche Urlaub und der Host läuft seit meiner letzten Nachricht. Ich bin am beten, dass es sich tatsächlich mit den letzten Updates erledigt haben könnte. Zumindest wäre das mein Wunschdenken ^^ Mal die nächsten Tage weiter beobachten.

    Nach 20 Tagen sind während des kontrollierten Updates mir einmal ein RS 4000 mit Proxmox 8.X und einmal ein RS 4000 mit Proxmox 7.X unkontrolliert und auch ungewollt neu gestartet, so dass danach auch Beide nicht mehr neu gestartet werden konnten, da eventuell schon zu viele Systemdaten aktualisiert und das Update auf jeweiligen vServer (RS 4000 9.5) nicht komplett abgeschlossen werden konnte.


    Bei Beiden, so wie es im Rettungssystem aussah, konnten dessen Daten auf jeweiliger virtueller Platte auch nicht mehr gelesen werden.


    Da mir der Aufwand dann doch zu hoch wurde, die Daten auf beiden virtuellen Platten zu retten, habe ich Diese dann einfach durch die Funktion im Servercontrollpanel komplett gelöscht, da ich über das Rettungssystem die virtuellen Platten nicht mal mehr formatieren konnte.


    Bei Mitbewerber laufen diese beiden Proxmox Versionen auch auf vServer ohne Probleme und sogar deutlich mehr als nur 20 Tage am Stück.

  • Bei LXC haben die Guests doch keinen eigenen Kernel oder nicht? Da wird doch der Hostkernel mit genutzt?

    Danke für die Klarstellung, dass es um LXC geht. Ein Freund von mir hat gestern beim Update seines Proxmox (nicht auf netcup-Systemen) einen LXC-Container „geschossen“ (hier: bootete nicht mehr) und das Problem dann über einen anderen Kernel gelöst. Möglicherweise war vor dem Start des Containers auch nur ein Modul nicht geladen. Keine Ahnung.

  • Wer Proxmox verwenden will, hole sich echtes Metall oder setze sich mit den unvermeidlichen, hier beschriebenen Konsequenzen auseinander.


    Wer LXC Container verwendet, sollte lieber VMs verwenden, da diese dem eigentlichen Sinn von Containerisierung widersprechen. Man sollte sich lieber in der Zeit, die man für die Problemlösung auf Proxmox braucht, in Docker/Podman einarbeiten.

    RS Ostern L OST22 (~RS "3000" G9.5) (8C,24GB,960GB) | RS Cyber Quack (1C,2GB,40GB)

    Edited once, last by TBT ().

    Sad 1
  • Wer LXC Container verwendet, sollte lieber VMs verwenden, da diese dem eigentlichen Sinn von Containerisierung widersprechen.

    Nee, da stimme ich nicht zu. Es gibt App-Container, System-Container und VMs. Alle haben gewisse Vor- und Nachteile, und LXD/LXC hat da durchaus seine Berechtigung.

  • Nee, da stimme ich nicht zu. Es gibt App-Container, System-Container und VMs. Alle haben gewisse Vor- und Nachteile, und LXD/LXC hat da durchaus seine Berechtigung.

    +1 von mir. Es gibt Anwendungsfälle, da will man keine komplette VM für laufen haben aber mit Docker etc. ist es auch nicht gut umsetzbar.