Schwere Bugs/Probleme im VCP: KVM-Server nicht mehr erreichbar

  • Moin,


    Ich habe vor einigen Tagen das Angebot für den Umzug meiner vServer auf KVM entdeckt und das gleich mit einem zZ unbenutzten vServer auch durchgeführt. Dazu habe ich mir ein kleines, offizielles Netinstall CD-Image für Ubuntu Server 12.10 geholt, dieses auf den FTP-Server von netcup hochgeladen und eine minimale Installation davon gestartet.
    Diese verlief zunächst problemlos, die Kontrolle des KVM-Servers über die VCP-Steuerung funktionierte auch gut, zumindest solange ich keinen harten reset machte (siehe weiter unten).


    Dann bin ich aber leider auf folgende Probleme gestossen:
    - Die gemountete CD läßt sich im VCP nicht mehr "herausnehmen". Solange der Server erreichbar ist (nicht unbedingt hochgefahren, aber über VNC-Konsole noch sichtbar), bekommt man die Fehlermeldung dass der Server noch darauf zurückgreifen würde. Fährt man diesen ganz herunter, dann hat der Button "herausnehmen" keinen Effekt, die CD bleibt laut VCP für immer und ewig eingehängt, zumindest behauptet die UI das. Im VCP-Log kann man dagegen lesen:

    Code
    1. 02.02.2013 12:20:52 INFO CDRom wurde ausgeworfen.


    Ja was denn nun? ;)


    - Das viel schlimmere Problem: die Maschine läuft prima solange man ACPI- oder Software-Resets durchführt. Ein kompletter "poweroff" hat leider den Effekt dass der KVM-Server nicht mehr erreichbar ist und sich auch nicht mehr starten läßt. VNC-Konsole ist in diesem Zustand natürlich auch tot. Im VCP erscheint beim Start-Versuch dann die nichtssagende Fehlermeldung-Meldung: "Es ist ein fehler aufgetreten". Die momentane Abhilfe besteht darin eine komplette Neuinstallation durchzuführen, was allerdings nicht wirklich eine Option ist . Das eingebaute Rettungssystem von VCP (Netboot) funktioniert hier leider auch nicht mehr - gleiche Fehlermeldung.


    - Es gibt noch einen Trick zumindest auf die Partitionen des Servers zugreifen zu können: man bootet wieder von der eigenen ISO (Bootmodus auf CD setzen und starten) und benutzt dann - in meinem Fall - das Ubuntu eigene Rescue-System. Die Partitionen sind alle brav da. Hier kann man sich zwar austoben, aber der Server bleibt nach einem Hard-Reset unerreichbar.


    Deshalb die Fragen:
    1. Gibt es bestimmte Dinge die man bei der Installation von einem eigenen Medium auf KVM beachten muss? Partitionierung, Setting des Boot-Managers vielleicht?
    2. Kann man auf ausführlichere Logs zugreifen warum VCP den KVM-Server nicht starten kann? Unter den VCP-Logs fand ich leider nichts.
    3. Lohnt es sich überhaupt auf KVM-Server umzustellen, wenn man letztendlich die Hauptvorteile gegenüber vServer eh nicht nutzen kann? Für mich waren die Freiheit ein eigenes oder moderneres OS zu installieren und nicht an Kernel-Einschränkungen (z.B. keine iptables) des vServers gebunden zu sein sehr ausschlaggebend. Wenn es aber grundsätzlich Probleme mit eigenen Installations-Medien / Images gibt, sehe ich diese Vorteile nicht mehr.


    Wenn jemand ähnliche Erfahrungen gemacht hat, oder sogar eine Lösung weiß würde ich mich über jede Information freuen.


    Danke und beste Grüße!

  • Ich habe habe auch ein KVM Server allerdings unter nclabs und meiner lauft spitze, keine Probleme.


    Das man die CD manchmal nicht auswerfen kann das ist kein Fehler, hat ich bei der System Rescue Disk auch gehabt, weil diese den Auswurf verhindert.
    Dann muss man das Livesystem ausschalten und den KVM Server über poweroff ausschalten.

  • Hallo,
    ich hatte das Problem auf meienm Labs server auch schon - ein ausschalten über die Steuerung hat geholfen. Dann konnte man die CD entfernen und er startet wieder normal.
    Alternativ kannst du auch einfach die Bootreihenfolge umstellen, dann kann die CD auch drin bleiben.

  • Mit dem hängendem CD Medium kann man ja auch leben, zumal mir auch aufgefallen ist dass man mit der Bootreihenfolge spielen kann um Probleme zu umgehen. Dass aber ein Neustarten über ACPI oder Soft-Reboot möglich ist während ein Hardreset zu einer unbrauchbaren VM führt halte ich schon für einen Fehler. Wenns nur am Bootloader liegen würde, müsste dann nicht die Maschine bei jeder Art von Neustart tot sein?

  • Im VCP steht doch beim Reset noch eine Erklärung!

    Quote


    Die Instanz wird von außen resettet. Hierbei kann es zu Datenverlusten kommen.

    Linux mag es nicht wenn es einfach resettet wird, weil Linux anderes als Windows arbeitet und die Daten nur in bestimmten Zeitintervallen auf die Festplatte speichert.
    Daher sollte man das System nur mit einem ACPI Reboot oder ACPI Shutdown ausschalten, damit alle Daten gesichert werden.

  • Im VCP steht doch beim Reset noch eine Erklärung!

    Linux mag es nicht wenn es einfach resettet wird, weil Linux anderes als Windows arbeitet und die Daten nur in bestimmten Zeitintervallen auf die Festplatte speichert.
    Daher sollte man das System nur mit einem ACPI Reboot oder ACPI Shutdown ausschalten, damit alle Daten gesichert werden.

    Das ist doch alles klar, nicht nur Linux mag das nicht, jedes Betriebsystem hat damit Schwierigkeiten ;-). Doch darum geht es hier nicht, weil ich keinen Hard-Reset während das System lief vorgenommen habe. Da ich mich vielleicht falsch ausgedrückt habe kann ich es hier nochmal kurz erläutern:


    - Reboot via "sudo reboot" oder shutdown Kommando -> geht.
    - Reboot via "ACPI CTRL+ALT+DEL signal", z.B. aus VNC heraus -> geht.
    - "sudo halt" oder "ACPI Shutdown" und dann versuchen aus VCP die Maschine ganz normal wieder zu starten -> nichts geht mehr. Ab dem Zeitpunkt ist die Instanz über den VCP-Start nicht mehr erreichbar (Hier hilft nur noch Boot von CD und Rescue-Menü).


    Ich denke einfach es liegt irgendwie am Boot-Manager von Ubuntu 12.10, VCP kommt damit nicht zurecht. Deshalb auch die Frage ob man bei der Partitionierung / GRUB-Settings irgendwas besonderes beachten muss im Zusammenhang mit KVM.

  • Was ist denn an dem Verhalten ein schwerer Bug im VCP? Können Sie das bitte genauer erklären?


    So wie es aussieht haben Sie die CD noch gemountet. In dem Zustand können Sie diese nicht auswerfen. Das wäre bei Ihrem PC genau so. Unmounten Sie die CD und werfen Sie diese dann aus.

  • Hallo,


    Erklärung steht im Initial-Posting und nochmal in meiner vorherigen Antwort.
    Ich würde gerne die CD unmounten. Hierfür muss ich das System erstmal wieder starten (wurde mit "halt" ordnungsgemäß heruntergefahren). Und eben darum geht's im ganzen Thread: es fährt beim Starten aus VCP heraus nicht mehr hoch -> siehe beschriebene Fehlermeldung! Zusätzlich scheint die Option "CD herausnehmen" im heruntergefahrenen Zustand zwar anklickbar zu sein, hat aber keinen Effekt. Das kann vielleicht tatsächlich ein gewolltes Verhalten sein, verwirrt jedoch, v.a. weil man die CD sehr wohl VOR der Installation des Servers auch "einlegen" kann. Aber (wie ich auch bereits schrieb) ist das mit der CD das kleinere Problem und vielleicht lediglich ein UI-Detail des VCPs.



    Mich wundert deutlich mehr warum das frisch installierte System erst problemlos rebootet und funktioniert bis man es mittels OS-Kommandos oder mit der VCP "ACPI Shutdown" komplett herunterfährt (was ja auch durchaus erlaubt ist). Danach funktioniert VCP->Steuerung->Start einfach nicht mehr, auch hierzu habe ich die Fehlermeldung beschrieben. Seit dem Vorfall ist mein Test-Server übrigens heruntergefahren und leider unbenutzbar. Die einzige Möglichkeit darauf zu kommen ist es die Boot-Reihenfolge zu ändern, von der (eingelegten) CD zu starten und in den Rescue Modus zu gehen. Ich habe bewusst keinen neuen Installationsversuch vorgenommen weil ich a) zwei schon hinter mir habe mit dem gleichen Ergebnis: startet nicht mehr nach dem ersten Komplett-Shutdown und b) ich gehofft habe dass der Zustand der Maschine dem netcup-Team bessere Einblicke gewähren kann in dem was beim durchgeführten Szenario schiefgelaufen sein könnte.


    Die Beschreibung des Problems soll auch kein Angriff sein, oder die Kompetenz von netcup in Frage stellen, sondern lediglich eine Bug-Meldung aufgrund eines Verhaltens des VCP das von mir (ein Benutzer desselben) als Fehlverhalten interpretiert wird. Diese Meldung kann man durchaus ruhig und unvoreingenommen zunächst mal so aufnehmen und ernsthaft analysieren. Mir ist vollkommen bewusst, dass es sich um ein Beta-Programm handelt. Aber v.a. deshalb sollte man sich beschriebene Probleme genauer durchlesen bevor man mit den Standard-Anweisungen antwortet. Nicht jeder der bereit ist KVM-Migration zu testen hat unbedingt so wenig Ahnung, dass er nicht weiß wie man a) Medien mounted, b) ein Betriebsystem herunterfährt... etc.


    Falls meine eigene Einschätzung "schwerer Bug" im Titel des Threads das Problem ist und man der Meinung ist dass es eine Kleinigkeit ist wenn VCP einen KVM-Server nach einem sauberen Shutdown nicht mehr starten kann, kann ich das gerne ändern. Es ist ja zuerst einmal nur ein Test-Server und die Migration nur ein Beta-Programm...


    In diesem Sinne wünsche ich einen entspannten Abend und sende viele Grüße,


    D.


    P.S. Nein, Titel des Threads kann ich leider doch nicht ändern, wenns stört kann man "Schwere Bugs/" entfernen.

  • Ich habe das Problem mittlerweile gelöst. Nur als Info für alle die in eventuell in die gleiche Falle laufen sollten:


    Wenn man einen KVM-Server von einer eigenen CD ISO im VCP installiert sollte man die Netinstall-Version der Installations-CD vermeiden. Diese bootet nach einer erfolgreichen Installation nicht mehr falls die KVM Instanz mit dem VCP poweroff gestoppt wird (bei mir war das die Ubuntu 12.10 Netinstall ISO - insgesamt 3 Versuche). Ausserdem gibt es mit der Netinstall CD Probleme beim Auswerfen der ISO im VCP. Also lieber zur Sicherheit die "volle" CD ISO verwenden, damit funktioniert alles problemlos. Es ist mir noch ein Rätsel warum, aber jedenfalls läuft jetzt alles wie erwartet (inklusive poweroff und start). :thumbup:

  • mit der Debian netinstall lief/laeuft es bei mir ohne jegliche probleme

    Logic will take you from A to B. Imagination will take you everywhere.(A.Einstein)
    Nur wer sein Ziel kennt findet auch den Weg!