Servermigration leider nicht so smooth, wie sie sein sollte

  • Grüß Euch zusammen,


    ich dachte, ich mache mal ein Thema auf und beschreibe meine erste Root-Server Migration innerhalb der Netcup-Welt. Vorausgeschickt: ich bin Netcup-Fan, da Preis/Leistung unschlagbar ist und die Server wunderbar schnell und stabil laufen. Ich habe Server (Baremetal & Cloud) bei einigen Hostern, daher beschreibe ich nur meine Erfahrung mit NC.

    Zu einer Einsetzbarkeit in Produktivumgebungen braucht es allerdings etwas mehr als nur eine schnelle und stabile Laufzeitumgebung, nämlich auch, dass die Migrationsvektoren verlässlich, berechenbar und fehlerfrei funktionieren. Damit spreche ich nun auch nicht die Puristen an, die ihre Migration per DD durchführen und zur Partitionierung alle Befehle im Schlaf beherrschen. Dies tun viele hier im Forum, mir geht es aber um die Mechanismen, die genau dafür da sind und funktionieren müssen. Auch möchte ich keine Diskussion entfachen über Failover und Redundanz - ist alles da, darum geht es aber nicht.

    Ziel: RS2000 auf größeren RS migrieren.


    Plan:

    - Produktiven Server herunterfahren

    - Offline Snapshot anfertigen

    - exportieren auf Snapshot FTP

    - Installation des Snapshot auf neuem Server

    - Einbinden der Failover-IP und des Networking Stack

    - Anpassung der Partitionsgrößen (da neuer Server mehr Platz) - hätte ich gern kurz mit dem GParted Image gemacht, da es nachts um 3 einfacher ist


    Schritte und Unwegbarkeiten:

    • Produktivserver ausschalten - keine Probleme
    • Offline Snapshot anfertigen - keine Probleme und überraschend schnell
    • Snapshot Export
      • Erste Überraschung - es wird vermeldet, dass dieser Vorgang länger dauern kann, da nur mit geringer Priorität durchgeführt. Nicht optimal finde ich, denn man möchte ja die neue VM so schnell wie möglich wieder ans Netz bekommen. Auch in einer Situation, die, aus welchen Gründen auch immer, zeitkritisch ist, wäre das nicht optimal. Hier wäre eine Option gut, dass man diesen Vorgang beschleunigen kann (Extrakosten wären in Ordnung). - Dauer ca. 50 Minuten, Image-Größe ca. 145GB.
      • Zweite Überraschung: Während das Image auf den FTP geladen wird, kann man den Host NICHT mehr starten, da "auf diesem gerade eine andere Aktion ausgeführt wird". D.h. die Maschine läuft nicht, während mit niedriger Priorität auf einen FTP hochgeladen wird? - Das macht keinen Sinn, man ist aber gezwungen, das abzuwarten.
    • Image auf neuer Maschine auswählen und installieren - klappt erstmal wunderbar, auch wenn es keine Fortschrittsanzeige gibt. Man muss warten, aber es geht einigermaßen fix.
      • Dritte Überraschung: Nach Beendigung der Image-Installation wird als Aktion noch "reinstall" im SCP angezeigt (dazu gibt es auch schon einige Threads hier im Forum). D.h. keine der im SCP verfügbaren Einstellungen funktioniert, da "gerade eine andere Aktion durchgeführt wird". Ich kann weder eine IP zuordnen/löschen, noch ACPI Befehle senden, kein Image einbinden, nicht einmal das Keyboard-Layout des VNC kann man ändern. Wenn ich für die neue VM nun eine Failover-IP einbinden müsste, wäre ich richtig gekniffen, denn das funktioniert nicht. Der Status "reinstall" hielt noch weitere 10(!!!) Stunden an, d.h. ich musste den Server quasi unfertig wieder ans Netz bringen.


    • Vierte (eigentlich nicht wirklich überraschend, da immer so bei NC, aber trotzdem lästig!) Überraschung - wenn man kurzfristig eine Failover IP benötigt, kann man diese nicht gleich verwenden, sondern muss Stunden lang warten, bis ein Mitarbeiter diese freigibt. Da bildet eigentlich NC auch die Ausnahme, da dies bei vielen anderen schon on-the-fly geht. Das tut vor allem den Admins weh, die vorher nicht perfekt planen und kurzfristig immer mal Sachen brauchen (dazu zähle ich mich leider selbst auch).

    Hier besteht noch einiges an Verbesserungsbedarf, vor allem was das Handling im SCP betrifft. Dies soll durch Stabilität und Schnelligkeit punkten und nicht die Schweißperlen auf die Stirn treiben. gerade die Entscheidung auf virtualisierte Hardware zu setzen geschieht auch aus dem Grund, genau an diesem Punkt flexibel zu sein und keine Stundenlange Migration hinlegen zu müssen, die es eigentlich nicht bräuchte.

    Wie ist Eure Erfahrung / Meinung dazu bzw. wie kam euch dieser Vorgang vor? Besser / Schlechter?

  • Habe ähnliche Erfahrungen gemacht, für eine Servermigration nutze ich mittlerweile das Rettungssystem und kopiere via dd. Eigentlich hatte ich vor in Zukunft aus einem Backup neu aufzubauen, dann ist das gleich nochmal ein live Test, ob das Backup/Restore funktioniert. Aber so ist das mit den guten Vorsätzen: Vielleicht im nächsten Jahr..


    Ich stimme dir zu, dass einer der großen Nachteile bei Netcup ist, dass man nicht "einfach" (ein bis zwei klick GUI) auf einen neuen vServer umziehen kann. Ich vermute aber mal, dass das so gewollt ist, damit Leute lieber noch etwas länger den alten Server benutzen und einen Umzug scheuen (zumindest bei mir klappt das)

  • Kurze Frage: Hast du die Generationen gewechselt? Ansonsten bietet sich doch ein Sidegrade an. Das dauert eigentlich max ~5 Min ( habs schon mehrmals gemacht). Die Gefahr bei Umzug innerhalb der Generationen ist halt bspw dass Interface Namen sich ändern, die Platte vda statt sda heißt etc. was dann auch Supportaufwand erzeugt.


    Mir ist bisher auch kein Provider in der Preisregion bekannt der solche Aktionen unterstützt, wen nur als aufpreispflichtiger Service der pro Stunde dann abgerechnet wird. Die Beträge da sind dann natürlich vielfaches von den monatlichen Kosten. (45€ für ein Debian installer iso mounten bspw!). Hatte da schon im geschäftlichen Umfeld "viel Spaß".


    Zum glück kann man bei Netcup ISO mounten, per preseed + ansible hab ich neue Server in ~7 min fertig und kann dann den Datenrestore per restic / rclone anschmeißen.

  • urze Frage: Hast du die Generationen gewechselt? Ansonsten bietet sich doch ein Sidegrade an.

    Nicht direkt, beides G9, aber das eine ist der RS Special 3, den es nicht als herkömmliches sidegrade gab.


    Mir ist bisher auch kein Provider in der Preisregion bekannt der solche Aktionen unterstützt,

    Das können doch die meisten heute im consumer-Bereich. Da tut sich eher der Enterprise-Bereich schwer mit diesen Features. Aber darauf wollte ich gar nicht wirklich hinaus, es ging um angebotene Features, die haken und genau deshalb da sind, um dieses Problem zu lösen. :)

  • Hatte gestern eine ähnliche Situation, die "reinstall"-Meldung hat einfach alles blockiert. Dann ist man quasi aufgeschmissen, weil man den Server per SCP nicht mehr zum Laufen bekommt.


    Heute gab es anscheinend Wartungsarbeitem am SCP in den Bereichen "DVD" und "Images", hoffentlich hat man sich auch dieses ärgerlichen Fehlers angenommen ;)

    friendly chat by and for customers:

    irc.hackint.org:6697

    #nc-kunden