VM resettet sich

  • Ich habe nun ein VPS 1000 G9 mit Proxmox 7 und ZFS (nennt mich verrückt, ist ja erstmal nur ein test) am laufen zum Test wie stabil das alles ist und um mal die ganzen Funktionen im SCP auszuprobieren.

    Wenn das jetzt ein paar Tage stabil läuft werde ich meine bisherigen Systeme hierher migrieren.


    Wenn Proxmox und LXC nicht läuft steht immer noch die Alternative im Raum das ganze auf mehrere VPS zu verteilen. Müsste ich zwar etwas umbauen und natürlich wäre es auch teurer aber nicht so teuer wie alleine die IP Adressen beim meinem. bisherigen Provider. Der hat die Preise Richtung Mond korrigiert.

    Ging zwar keiner mehr darauf ein, aber ich hab trotzdem noch das Verlangen hier der Vollständigkeit halber ein Update zu schreiben. Vielleicht such ich das ja mal selbst.

    Bei mir läuft seit 2 Wochen auch wieder alles einwandfrei.

    Ich würde gerne noch wissen, was seitens Netcup geändert wurde und warum das über ein Jahr bis zur Umsetzung gedauert hat [netcup] Claudia H.

    Bei mir läuft es auch schon seit Tagen ohne Reboot auf nem VPS 3000 G9. Einige LXC Container am laufen, davon zwei mit eigener IPv4 Adresse. Alles super. Kann also nicht meckern (psst sogar noch mit ZFS).


    Jetzt muss ich mir nur noch Gedanken ums Backup machen. Hatte vorher einen NAS Speicher beim Provider angemietet. Könnte hier ja jetzt auch so einen S-Server anmieten. Wobei ich auch einfach die Backups zu mir kopieren könnte. Das interessiert hier aber eher nicht. Aber Proxmox mit LXC ohne nested virtualization läuft auf jeden Fall bisher sehr gut.

  • Jetzt muss ich mir nur noch Gedanken ums Backup machen. Hatte vorher einen NAS Speicher beim Provider angemietet. Könnte hier ja jetzt auch so einen S-Server anmieten. Wobei ich auch einfach die Backups zu mir kopieren könnte. Das interessiert hier aber eher nicht. Aber Proxmox mit LXC ohne nested virtualization läuft auf jeden Fall bisher sehr gut.

    Ein Grund warum ich nicht mehr von Proxmox weg möchte ist der Proxmox Backup Server, der arbeitet auch absolut sauber mit Qemu Block Bitmaps und auch bei lxc werden saubere Snapshots exportiert - mit Bereinigung, Retention, inkrementellen Blöcken etc.

    Verschlüsselung noch auf der Quellmaschine selbst.


    Die Kritikpunkte, die ich hatte, werden Release für Release ungefragt beseitigt. (QoL Improvements)


    https://www.proxmox.com/de/proxmox-backup-server


    Hatte ich zuerst auf einem VPS 200 mit NFS Storage, die Datenmenge ist mittlerweile etwas größer, weshalb ich einen VPS Ibiza gesucht habe - mit dem Backup Server bin ich aber zu einem anderen Provider gegangen.

    • Offizieller Beitrag

    Bei mir läuft seit 2 Wochen auch wieder alles einwandfrei.

    Ich würde gerne noch wissen, was seitens Netcup geändert wurde und warum das über ein Jahr bis zur Umsetzung gedauert hat [netcup] Claudia H.

    Hallo zusammen,


    ich antworte einmal für Claudia.


    Dank eurer zahlreichen Eingaben, war es uns möglich, das Problem gesammelt zu betrachten und Ähnlichkeiten abzuleiten. Die Probleme erschienen bisher als Einzelfälle, ohne offensichtlich erkennbare Korrelation. Es konnte jedoch im Rahmen von gründlichen Analysen, die durch die erfolgte Datensammlung möglich wurden, festgestellt werden, dass eine von uns genutzte Option des Linux-Kernels für die Instabilitäten verantwortlich war. Ich bitte um Verständnis dafür, dass ich hier nicht ins Detail gehen kann, da die genaue Konfiguration der Kernel unserer Hostsysteme natürlich integraler Bestandteil unserer Betriebsgeheimnisse im Bezug auf unsere VPS und Root-Server ist.


    In jedem Fall freue ich mich, dass die Probleme nun verschwunden sind. Es wurde viel Zeit in die Analyse und Lösung dieses Sachverhalts gesteckt und es ist toll, dass wir unsere Produkte mit eurer Hilfe weiter optimieren konnten. Vielen Dank an euch alle für die Hilfe.

  • Hi [netcup] Lars S., wurde dieses Problem/die Kerneloption auf allen euren Hostsystemen gefixt oder sollte ich mich dazu nochmal explizit beim Support melden, damit es auch ggf. noch für unsere Hostsysteme gefixt wird? Hintergrund: Bevor ich dazu kam unsere Daten zusammenzutragen, wurde hier schon kommuniziert, dass das Problem behoben sei und zeitweise sah es in der Tat so aus, als würde dies auch für unsere Server gelten. Nur beobachten wir in den letzten Tagen leider wieder das gleiche Verhalten wie zuvor beschrieben: Vollständige Freezes unserer Server unabhängig von Services/Software und Last. (https://forum.netcup.de/admini…resettet-sich/#post170537)


    Viele Grüße und Danke

    • Offizieller Beitrag

    Hallo heretic,


    hast du die betroffenen Server einmal komplett ausgeschaltet und dann über das SCP wieder eingeschaltet? Erst dadurch wird die Lösung aktiv.

  • [netcup] Lars S.


    Auf unserem RS 8000 G9 a1 besteht weiterhin das Problem, dass mit einem Kernel neuer >= 5.8 alle Proxmox-VMs 100% Last haben. Version 5.4-5.7 (also vor dem Kernel-Patch für AMD-V) läuft alles wunderbar. Ich bin daher gezwungen, den 5.4er Kernel mit der alten Proxmox-Version weiterzuführen.


    Wir haben haben das Problem nahezu jedes Quartal an Netcup gemeldet, aber es wurde nie wirklich an einer Lösung des Problems gearbeitet. Netcup verwendet höchstwahrscheinlich einen angepassten 54.er Kernel. Nach Rücksprache mit dem Entwickler des Kernel-Patches ist die einzige Möglichkeit, den Host auf Kernel >= 5.8 zu upgraden. Ich denke, dies ist aus Stabilitäts- und Geheimhaltungsgründen seitens Netcup aber wohl nicht möglich.


    Da wir uns nun schon seit zwei Jahren mit dem Problem auseinandersetzen, denke ich leider, dass wir den Vertrag nicht noch einmal verlängern werden. LXC und Podman/Docker laufen jedoch einwandfrei.

  • So wie du es hier beschreibst, riecht es für mich eher so, als hätte man dir das Flag nested Virtualisierung zwar optisch und kostenpflichtig durchgereicht, da man auf dem Host ja dieses Flag nur per Schalter bei einem nicht selber kompiliertem Kernel nur setzen muß, aber vergessen auf dem Host den Kernel mit dieser Eigenschaft nested virtualisierung erneut zu kompilieren, da Netcup bekanntlich seine Kernel aufgrund der besseren Performance selber kompiliert.

    Denn versucht man auf einem regulären RS eine VM ohne dieses Flag nested Virtualisierung zu starten, verhält es sich genauso, wie du es hier beschrieben hast.

  • So wie du es hier beschreibst, riecht es für mich eher so, als hätte man dir das Flag nested Virtualisierung zwar optisch und kostenpflichtig durchgereicht, da man auf dem Host ja dieses Flag nur per Schalter bei einem nicht selber kompiliertem Kernel nur setzen muß, aber vergessen auf dem Host den Kernel mit dieser Eigenschaft nested virtualisierung erneut zu kompilieren, da Netcup bekanntlich seine Kernel aufgrund der besseren Performance selber kompiliert.

    Denn versucht man auf einem regulären RS eine VM ohne dieses Flag nested Virtualisierung zu starten, verhält es sich genauso, wie du es hier beschrieben hast.

    Es funktioniert ja mit einem 5.4er Kernel, daher wird es ebendort aktiviert sein (auch im Netcup-Kernel, der AFAIK auch 5.4 ist).


    Ich habe mit dem Kernel-Entwickler ausführlich darüber diskutiert. Er schrieb: bis Version 5.8 war die Virtualisierung für AMD-Prozessoren total kaputt und es war reiner Zufall, wenn es funktionierte. Ab 5.8 ist es repariert, der Host-Kernel muss es jedoch auch unterstützen. Das geht natürlich nicht, da 5.4 älter und ein praktisch Backport unmöglich ist.


    Es ist für mich natürlich vollkommen klar, dass man von einem Massenhoster, wie Netcup, nicht erwarten kann. dass sie ihre Server auf moderne LTS-Kernels updaten. Und vertragsrechtlich würden wir vermutlich auch nicht gegen Netcup angehen können, weil die VM ja unter Kernel 5.4 funktioniert. Vorallem, da es sich bei Kernel 5.4 ja um LTS mit Unterstützung für die nächste sechs Jahre handelt.


    Nachteilig ist auch, dass sämtliche Errorlogs zu dem Problem NICHT bei mir im Gastsystem landen, sondern nur in den Kernel-Logs vom Host (also von Netcup). Somit kann ich meinen Worten kaum Gewicht verleihen. "Das Haus gewinnt".

  • Es ist für mich natürlich vollkommen klar, dass man von einem Massenhoster, wie Netcup, nicht erwarten kann. dass sie ihre Server auf moderne LTS-Kernels updaten.

    Wer mit Proxmox eigene Virtualisierung betreiben will, nimmt echtes Blech. Die Produkte von Netcup sind nicht für Deinen beabsichtigten Einsatzzweck geeignet. Nested Virtualization ist Käse. Ende des Themas.

    RS Ostern L OST22 (~RS "3000" G9.5) (8C,24GB,960GB) | RS Cyber Quack (1C,2GB,40GB)

    Gefällt mir 3 Verwirrend 1
  • Und du bist genau wer/was, dass du darüber entscheiden darfst?

    Ein „Profi“ :p


    TBT hat aber Recht. Nested KVM ist fürn Arsch (und nicht im guten Sinn). Probier es halt aus.

    Meine Minecraft-Plugins auf SpigotMC (Open Source): www.spigotmc.org/members/mfnalex.175238/#resources

    Discord: discord.jeff-media.com

    Gefällt mir 1
  • Es gibt trotz der hier vorherrschenden Meinung sinnvolle Anwendungsfälle für nested virtualization, z. B. das Bauen von VM images in CI-Runnern.

    Klar, das wollte ich auch gar nicht bestreiten. Es ist halt nur so dass man nach der 30. Kernel panic keinen Bock mehr auf nested KVM hat und daher lieber direkt Blech mietet, falls man proxmox o.ä. nutzen möchte :)

    Meine Minecraft-Plugins auf SpigotMC (Open Source): www.spigotmc.org/members/mfnalex.175238/#resources

    Discord: discord.jeff-media.com

    Einmal editiert, zuletzt von mfnalex ()

    Gefällt mir 3
  • Die Originale Webseite von Proxmox empfiehlt das nur zu Testzwecken in den Systemanforderungen.

    Für Testzwecke

    Minimum Hardware (nur für Testzwecke)

    • CPU: 64bit (Intel EMT64 oder AMD64)
    • Intel VT/AMD-V-fähige CPU/Mainboard (für KVM Full Virtualization Unterstützung)
    • Mindestens 1 GB RAM
    • Festplatte
    • Eine Netzwerkkarte

    Testzwecke mit Desktop-Virtualisierung

    Proxmox VE kann als Gast auf allen gängigen Desktop-Virtualisierungs-Lösungen installiert werden, solange Sie "Nested Virtualization" erlauben.