VM resettet sich

  • Ich habe genau das selbe Problem. Mein vServer startet je nach Lust und Laune einfach neu und kann keine Logs zu den Absturz finden.

    Proxmox läuft mit dem selben Kernel wie beim Threadersteller. Mit 6 LXC Containern die kaum Last verursachen.


    Habe den VPS Funny Bunny.

  • Hallo zusammen,


    ich habe das Problem ebenfalls bei einem "RS 2000 G9", den ich neulich mit Debian voll-verschlüsselt neu mit Proxmox installiert habe.
    Der Server läuft ca. 1-2 Tage und wird dann zufällig neu gestartet. Es erscheint dann die Passworteingabe für die LUKS-Verschlüsselung.


    Weder im kernel.log noch syslog sind Einträge zu finden.
    Im NetCup Logfile gibt es ebenfalls keine Einträge, es scheint als wäre der Server die ganze Zeit gelaufen.


    Auf einem 2. "RS Ostern M OST21" ist ebenfalls Proxmox installiert (jedoch ohne Verschlüsselung). Hier läuft das System seit 14 Tagen ohne Unterbrechung.


    LG,

    Michael

  • Ich habe das Gefühl das es gehäuft bei bestimmten Nodes auftriitt wo VPS Gäste laufen.

    Mein alter RS1000 G9 hat keine Probleme. Selbes Setup wie bei meinem bereits storniertem VPS der immer abgeschmiert ist.

    Bin mittlerweile wieder auf die guten alten G8 Kisten mit Intel Prozessor. Die machen keine Probleme.

  • Ggf. ist das Problem nicht neu. Mit einer älteren Proxmox Version auf einer älteren Generation KVM Server war einer meiner Server in unregelmäßigen Abständen am Neustarten. Ich hatte es damals mit ungewöhnlich hoher Last in Verbindung vermutet. An die genauen Umstände kann ich mich nicht mehr erinnern, das Problem hatte sich irgendwann erledigt, möglich von meiner Seite aus sind rein Updates, aber auch ein Wechsel auf eine folgende Proxmox Major Version oder ein Wechsel auf einen anderen KVM Server - also leider ziemlich unspezifisch.

    Folgenden Beitrag verstehe ich in Ergänzung zum obigen, vorherigen. Also nicht alleinstehend:

    LUKS scheint ein gutes Indiz zu sein, war bei mir auch involviert.

  • Ich muss den Thread wieder nach oben holen. Wie schaut es bei den Betroffenen aus? - Was habt Ihr als Problemlösung gemacht?


    Seit der Installation habe ich ebenfalls regelmäßige Abstürze - sehr ärgerlich :(


    Netcup Server: VPS 1000 G9 WSV21

    Setup Proxmox LUKS & ZFS


    Danke für die Info

    Grüße maiestro

  • Kann das Programm bei bedarf zur Verfügung stellen. Hatte es nicht OS gemacht da ich nicht weiß wie erlaubt die CCP Geschichte ist - wenngleich die sauberste Lösung. (Nein die API bietet dir keine Möglichkeit, nicht mal zum killen der Instanz)

  • Nein die API bietet dir keine Möglichkeit, nicht mal zum killen der Instanz

    Welche API? Beim SCP Webservice? Ganz sicher? :/


    https://www.netcup-wiki.de/wiki/Netcup_SCP_Webservice


    Ich habe das vor einiger Zeit bei einem anderen Problem genau so gemacht: https://gist.github.com/killer…7f30a9a8f#file-reboot-php

    • Zuerst mehrmals ein vServerACPIShutdown.
    • Wenn das in Timeout läuft folgt ein vServerPoweroff. ("Strom abschalten")
    • Danach ein ganz normales vServerStart.

    Ich wüsste jetzt wirklich nicht, was das SCP dabei anders machen würde…

  • Und ich muss damit halt die API Schnittstelle nicht einschalten, was ich nicht so gerne wollte.

    Muss vielleicht auch dazu sagen dass es bei mir das Problem mit Soft-Lockup der CPU durch Proxmox + G9 + AMD-V flag ist.

  • Den garantierten Neustart finde ich jetzt auch nicht schlecht, ist ja quasi das Gleiche in Grün.

    Nur mit dem Unterschied, dass der (afaik) den ACPI-Befehl für den Shutdown nur einmal sendet. Das wollte ich bei meinem Szenario aus diversen Gründen nicht riskieren. Deshalb etwas mehr Code drum herum :)

  • Und was mir gerade einfällt: Falls ihr es braucht biete ich auch hosting bei mir dafür an euren Kram neu zu starten. Frisst ja nix, eher euer Vertrauen ;) Habe hier einfach zum Glück noch privat meine Kiste alter Generation, mit der ich das abfedern kann.

  • Die neue Proxmox Version 7 auf Basis von Debian 11 (Bullseye) [noch nicht released] ist draußen und vor kurzem hat ja das Dateisystem des G9 Servers die Hufe hochgerissen. Ich halte euch auf dem Laufenden. Kernel 5.11

  • Immerhin sollt das Problem ja eigentlich seit Q1 2021 gelöst sein..

    Weiß ich nix von, weißt du da etwa mehr?


    Zumindest läuft der Server seit 48h einwandfrei.



    Bei dir ist die gesamte Festplatte abgeraucht ?

    Nein, beim Umzug wegen Hardwaredefekt kam ZFS nicht mehr auf sich klar. ext4 und xfs Partitionen waren nicht betroffen.

    zfs hat seine Metadaten nicht mehr gefunden, damit war die Partition unbrauchbar.


    Jemand auf dem gleichen Host hat dabei wohl auch sein btrfs geschrottet. Wer weiß.