Beiträge von vladat

    Kann es sein, dass wenn auf einem Node der ACPI Shutdown Befehl betätigt wird, alle darin laufenden KVM-Instanzen anfangen gleichzeitig herunterzufahren?


    Wenn ja, dann ist auch klar warum vereinzelt vServer abgeschossen werden. Alles wird einfach langsam, weil jegliche Dienste anfangen ihre Daten auf die Festplatten zu schreiben. Bei sowas kann dann eine Datenbank (wie in meinem Fall) deutlich mehr als 5 Minuten brauchen, um alles aus dem RAM auf die Festplatte zu bringen.


    Lob für die Kommunikation & Co.

    Große Kritik für das harte Herunterfahren.

    Das ist nicht nett:


    Code
    2018-01-10 15:36:12.982 CET [3830] LOG:  database system was interrupted; last known up at 2018-01-10 15:23:07 CET
    2018-01-10 15:36:59.048 CET [3830] LOG:  database system was not properly shut down; automatic recovery in progress


    Obwohl aus dem SCP per ACPI Shutdown alles vorher geklappt hat, wurde ein vServer trotzdem "abgeschossen".

    Ein Gentoo ohne SystemD mit acpid reagiert auch gerne auf ein ACPI-Signal von außerhalb. Interessanterweise läuft mein vServer seit etwa 90 Tagen ununterbrochen ohne jegliches Anzeichen eines Neustarts des Wirtes.


    Ich kann mir gerade recht gut vorstellen, dass in Nürnberg in den Rechenzentren wo Netcup zuhause ist, eine "Party" saust...


    Was für ein Schlamassel das ganze. Brave new world.

    Hallo,


    ich spiele gerade mit dem WSDL API (nice!). Dabei ist mir etwas aufgefallen, das es keine Methode gibt, die mir sagen kann, ob ein KVM-vServer neugestartet werden sollte, da es ein KVM/Qemu eurerseits gegeben hat, d.h. in den zu Verfügung gestellten Methoden findet sich leider nichts. Es geht um die Meldung im SCP: 'Neue KVM Version verfügbar! Bitte den Server aus- und wieder einschalten um von den neusten Verbesserungen zu profitieren.'


    Es wäre schön in etwa so was zu haben:


    Code
    getVServerUpdateNotification(loginName, password, vserverName)


    mit z.B. den folgenden Responses:

    Code
    NA - alles O.K. nichts neues
    UpdateAvailable - Da war ein KVM/Qemu Update...


    Oder gibt es einen einfacheren Weg dies (automatisiert) herauszufinden?

    Hallo,


    auf einem vServer bei Netcup, den ich verwalte, kommen ebenfalls rcu_sched stall Fehler, das komplette Herunterfahren und Neustarten hat leider nichts gebracht.


    Code
    [65701.500030] INFO: rcu_sched detected stalls on CPUs/tasks:
    [65701.500091] 	0: (3 GPs behind) idle=f6b/140000000000000/0 softirq=576191/576191 fqs=2101 
    [65701.500094] 	(detected by 1, t=2102 jiffies, g=411375, c=411374, q=3)
    [65701.500097] Task dump for CPU 0:
    [65701.500102] crond           R  running task        0 10192   2327 0x00000008
    [65701.500115]  000000000000270f 00007f18b4957b40 0000000000000230 00007f18b4957b98
    [65701.500118]  00007f18b4957b98 00007f18b4957dd8 00007f18b3d924a0 0000000000000000
    [65701.500121]  0000000001e2eb90 0000000000000231 000000000001cf71 0000000001e30e70
    [65701.500124] Call Trace:


    Nabend,


    ich musste leider grade einen Reset auf meinen KVM-Server ausführen, da er nicht mehr reagierte.


    Das stammt aus dem aller ersten Post.
    "nicht mehr reagieren" = einfrieren?


    Dieses "nicht mehr reagieren" fand bei mir in etwa gleichem Zeitraum. Ebenfalls musste ein Reset durchgeführt werden.


    Im Forum hier gibt es zu den von mir beschriebenen Vorfällen nur diesen, der den meinen am nächsten kommt. ;)

    Hallo,


    ich habe diese Einfrieren auch auf 2 meiner vServer vor kurzem erlebt. vServer lassen sich anpingen, jedoch kommt man auf sie per ssh nicht ran. ssh -v sagt, ssh meldet sich an, es kommt sogar zum interactive Modus, dann kommt aber nichts weiter. Die beiden Systeme stehen in Nürnberg, so glaube ich zumindest.


    Ebenfalls lassen sich die vServer per vnc aus dem vcp ansprechen. Nach der Passworteingabe des Logins, scheint alles einzufrieren.


    Ein Systemneustart per "reset" aus dem vcp hat nicht geholfen, da hat sich das System geweigert zu starten. Ein "Power Off" hingegen, nach einer gewissen Zeit, hat das System ausgeschaltet, danach mit einem "Power On" das System gestartet - es funktioniert alles. (Beide Systeme laufen mit Gentoo).


    Logs auf beiden Systemen bringen nichts außergewöhnliches zum Vorschein. Es gibt keine Anzeichen eines Einbruchs. Datenverlust gab es auch keinen. Ein Reset des gesamten vServers gab es bei mir allerdings nicht.


    Daher muss ich wohl davon ausgehen, dass etwas bei Netcup los war.... (Vielleicht eine live-Migration im laufenden Betrieb?)