Meldung über dringende Wartungsarbeiten am Wirtssystem aufgrund QEMU-Bug

  • Vielleicht hilft es ja jemanden weiter:


    bei mir war nur SSH und sonst nichts erreichbar, obwohl die Dienste liefen. Nach einem manuellem reload der iptables (die ja beim Neustart auch automatisch gestartet werden) funktionierte es. Wenn ich neu startete, wars wieder das selbe - ich musste meine iptables-Regeln neu abspeichern für den Neustart - jetzt wirds auch beim Neustart wieder geladen.


    Wäre interessant, was das verursacht hat, denn ich habe gerade im letzten Monat öfters neu gestartet, da ich die Distri upgegradet habe und da hats da auch keine Probleme gegeben.

  • Bei mir waren es nur 10 Minuten wo die Kiste weg war.
    Gleich eine praktische Gelegenheit den neuen Kernel zu starten. :)
    Bis auf IPv6 verlief alles ohne Probleme, und auch das geht wieder :)
    Besser so als warten bis das Kind in den Brunnen fällt.
    Manchmal müssen Sachen schnell eingespielt werden. :thumbup:
    Zumal es auch immer ein guter Test ist, ob man alles richtig konfiguriert hat, so das alles wieder hochkommt :)

  • Nach diesem Zwischenfall wird die Schwäche des Managed Server bei Netcup (u.anderen) bewusst. Man erhält nur einen Basis-Service, dass der Server läuft.
    Dass Customer/Webseiten auch mit dem Basis-System zusammen funktionieren, dafür bin ich dann verantwortlich und der Provider kontrolliert es nicht
    Bzw. verhaltet sich so, dass die Webseiten für Stunden down sind.


    Habe eigentlich nur ein paar wenige Webseiten. Da gibt es andere Provider managed Server, die schauen, dass sowohl Server als auch Webseiten laufen.


    Und jetzt ist die Hotline überlastet...........


    Werde wohl bei Netcup kündigen

  • Guten Tag,


    Zitat

    Dass Customer/Webseiten auch mit dem Basis-System zusammen
    funktionieren, dafür bin ich dann verantwortlich und der Provider
    kontrolliert es nicht Bzw. verhaltet sich so, dass die Webseiten für Stunden down sind.

    wir machen das, was wir vertraglich festgelegt haben. Wir können nicht alle Websites auf einem managed Server kontrollieren, da wir zum einen gar nicht wissen wie diese aussehen sollen, zudem wissen wir nicht ob ein durch den Kunden produzierter Fehler diesem bekannt ist oder nicht. Wenn Sie einen vHost falsch konfigurieren, ist das in Ihrem Zuständigkeitsbereich. Wir können ja nicht bei jedem Fehler der in den Error-Logs auftaucht den Kunden anrufen und fragen ob das so sein soll oder nicht.


    Was für Vorstellungen Sie haben....


    Lassen Sie uns bitte die Arbeit tun, für die wir bezahlt werden. Wenn Sie weiter so im Forum herum schreiben, erhalten Sie unsere Antworten zu den vereinbarten Zeiten außerhalb des Feiertags. Mehr als Ihnen zu helfen können wir nicht und wir arbeiten jetzt schon die ganze Nacht durch.



    Mit freundlichen Grüßen


    Felix Preuß

  • Btw dorgan,
    du zahlst nicht für 100% Verfügbarkeit. Zwischen 99,6 und 100% mag mathematisch nicht viel liegen. Das zu gewährleisten wäre aber sehr teuer und letztlich noch immer nicht bis 100% möglich.


    Und du wärst sicher auch nicht erfreut, wenn aufgrund des Bugs auf einmal jemand unbefugtes deine Daten kopiert.

  • Ich habe leider das falsche Produkt gekauft, einen Managed Server beim falschen Provider.


    Wir reden nicht von 99.6% Verfügbarkeit oder 100%.
    In diesem Fall bedeutete, es das Netcup meine Webseite für 13 Stunden lahm legt und nachher sagt, es wäre mein Fehler wegen einer blöden variable im Confixx.


    Und gleichzeitig ist Netcup nur unter Notsupport für 40€ die 15 Minuten erreichbar, heute der Support stundenlang überlastet.


    Ob die VENOM-Lücke innnerhalb von wenigen Stunden gefixt werden muss, wage ich zu bezweifeln.
    Das machen noch nicht mal die Cloud-Provider, bei denen es viel wichtiger wäre.
    Cloud providers scramble to address VENOM security vulnerability | VentureBeat | Cloud | by Jordan Novet


    So etwas muss geplant werden und nicht überhastet in der Nacht durchgeführt werden.
    Root-Server-Kunden können es verkraften, da sie neu starten können etc (wenn sie die Mail gelesen haben), aber managed Server Kunden sind hilflos.
    Den Kunden muss eine Möglichkeit gegeben werden zu reagieren und der Support kostenlos verfügbar sein nach der Umstellung.


    Und nicht einfach machen und dann schlafen gehen.

  • Tolle und schnelle Reaktion, netcup. Bei der Servermenge ist das extrem gut abgelaufen! :thumbup:


    Speichern bei uns einige Daten in einer Ramdisk da es doch wichtig ist das auf diesen Daten schnell zugegriffen werden kann. Dank dem doch abrupten Update sind nun Daten seit heute um 12 Uhr weg...


    Dann hast Du etwas falsch gemacht. Die Server sind nicht abgestürzt, sie wurden ganz normal und sauber heruntergefahren. Was kann netcup dafür, wenn Du auf eine saubere Methode beim Shutdown vergisst?


    Unabhängig davon ist es normalerweise gängige Praxis, dass man auch dazwischen den Datenbestand aus einer wichtigen Ramdisk sichert, z.B. mittels Crontab. Ansonsten können die Daten nicht so wichtig gewesen sein…


    Komisch war allerdings, dass HTTP sofort erreichbar war, SSH aber erst einige Minuten später.


    Der SSH-Daemon wird bei einer Standardinstallation vieler Distributionen erst ganz am Ende (nach allen anderen Diensten) gestartet, insofern: Völlig normal, wenn das System durch den Start ausgelastet ist :)


    Wir reden nicht von 99.6% Verfügbarkeit oder 100%. In diesem Fall bedeutete, es das Netcup meine Webseite für 13 Stunden lahm legt und nachher sagt, es wäre mein Fehler wegen einer blöden variable im Confixx.


    Rechne bitte einmal nach, wie viele Stunden Dein System ausfallen dürfte laut der garantierten Verfügbarkeit…


    Und gleichzeitig ist Netcup nur unter Notsupport für 40€ die 15 Minuten erreichbar, heute der Support stundenlang überlastet.


    Bitte genauer lesen, es wurde bereits mehrfach erklärt, dass diese Kosten nur anfallen, wenn es z.B. in Deinem Einflussbereich liegt und netcup somit keine Schuld trifft.


    Ob die VENOM-Lücke innnerhalb von wenigen Stunden gefixt werden muss, wage ich zu bezweifeln.


    Und bitte nochmals genauer lesen, da diese Lücke wirklich extrem kritisch ist/war. Provider die dabei nicht zeitnah handeln, kann man nur als fahrlässig einstufen. Insofern hat es netcup 100% richtig gemacht!


    Das machen noch nicht mal die Cloud-Provider, bei denen es viel wichtiger wäre.


    Ohne Deine Aussage zu verifizieren: Nur weil vor Jahren Millionen W-LANs ungeschützt oder mit WEP-Verschlüsselung liefen, wäre es auch keine gute Idee gewesen bei der Neueinrichtung auf die WPA(2) Verschlüsselung zu verzichten, weil die anderen es ja auch nicht machen, wo es viel wichtiger wäre.


    So etwas muss geplant werden und nicht überhastet in der Nacht durchgeführt werden.


    Wir kennen beide nicht die internen Abläufe bei netcup, aber aus den bisherigen Beiträgen lese ich zumindestens heraus, dass der Patch getestet wurde. Angekündigt wurde es auch. Was willst Du noch mehr planen?


    Dir ist schon bewusst, dass sobald ein Patch öffentlich verfügbar ist, es nur noch eine Frage der Zeit ist, bis Exploits für die Lücke existieren. Die Auswirkungen davon, muss ich Dir hoffentlich nicht erklären…


    Den Kunden muss eine Möglichkeit gegeben werden zu reagieren und der Support verfügbar sein nach der Umstellung.


    Nochmals: Notfallsupport…


    Und nicht einfach machen und dann schlafen gehen.


    Selbst wenn es so gewesen ist (was ich nicht behaupte): Irgendwann muss jeder Mensch schlafen, das solltest Du aus eigener Erfahrung wissen :sleeping:


    Irgendwie finde ich es wirklich schade, dass manche die Dringlichkeit von solchen Wartungsarbeiten nicht einsehen. Da wird spät Abends bzw. in der Nacht und am Feiertag gearbeitet, um die Sicherheit für die Kunden weiterhin gewährleisten zu können, und dann meckern manche nur, dass es "sicher nicht so dringend" war. Da kann man nur leicht den Kopf schütteln und hoffen, dass die Mitarbeiter von netcup auch die positiven Reaktionen wahrnehmen, in denen ihre Arbeit gewürdigt wird. Von daher nochmals: GJ! ;)



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)


  • Genau das erzählt mir Netcup, ich bin Schuld und hätte den Notfall Support zahlen müssen.




    Zitat

    Nochmals: Notfallsupport…"

    Selbst der normale Support ist heute nicht erreichbar, der Notfallsupport wäre auch nicht erreichbar gewesen.


    Zitat

    Wir kennen beide nicht die internen Abläufe bei netcup, aber aus den
    bisherigen Beiträgen lese ich zumindestens heraus, dass der Patch
    getestet wurde. Angekündigt wurde es auch. Was willst Du noch mehr
    planen?

    Ich bekam eine Mail um 18:32 Uhr am 13.5. und habe sie um 22.15 Uhr gelesen. Mich hat keiner zum Testen aufgefordert.


    So etwas macht man nach Ankündigung morgens um 9, aber nicht in einer Nacht-und Nebelaktion unmittelbar vor einem Feiertag.
    Und nach der Ankündigung gibt man den Kunden Zeit zum Testen.


    Ein Tag mehr oder weniger, macht keinen Unterschied
    Warum sollen die Hacker in Nullkommanichts einen Exploit bauen und ausgerechnet Netcup,und nicht Tausende Cloud-Provider attackieren ???


    Das ist typischer deutscher übertriebener Aktionismus.
    Zerstört selbst mehr als eine Gefahr da wäre.

  • Einer meiner vServer hing im GRUB Menü. Über die VNC Konsole habe ich mich vorhin verbunden und den bereits richtig markierten Eintrag nur noch bestätigt, danach bootete das Betriebssystem.


    Das hatte ich auch noch nie. Der vServer war deshalb seit dem Herunterfahren offline :thumbdown:

  • 99,6% Verfügbarkeit wären rund 36 Stunden, die der Server offline ist bevor überhaupt über eine Vertagsverletzung nachgedacht werden kann.


    Wo ist jetzt also das Problem?

    Learn to sit back and observe. Not everything needs a reaction

  • Ich bekam eine Mail um 18:32 Uhr am 13.5. und habe sie um 22.15 Uhr gelesen.


    So etwas macht man nach Ankündigung morgens um 9, aber nicht in einer Nacht-und Nebelaktion unmittelbar vor einem Feiertag.
    Ein Tag mehr oder weniger, macht keinen Unterschied
    Warum sollen die Hacker in Nullkommanichts einen Exploit bauen und ausgerechnet Netcup,und nicht Tausende Cloud-Provider attackieren ???


    Das ist typischer deutscher übertriebener Aktionismus

    Das ist so lange für Dich übertriebener Aktionismus, bis Du selbst betroffen bist, oder?
    Und wenn man einen produktiven Server betreibt, der nicht nur Spielwiese ist, sollte man entsprechende Vorkehrungen treffen, dass Mails auch zeitnah gelesen werden können.


    Und die Hacker suchen sich nicht einen Provider aus, sondern testen alles, was ihnen gerade unter die Finger kommt.


    Ich würde es eher als typisch deutsch bezecihnen so lange zu meckern,bis einem selbst was passiert.


    Aber das ist nur meine pers. Meinung.

    Learn to sit back and observe. Not everything needs a reaction

  • Hallo zusammen,


    bei mir hat alles reibungslos geklappt, vielen Dank dafür.


    Dadurch das ich die Mail rechtzeitig gelesen habe, war es mir möglich noch einen Snapshot zu machen - nur für den Fall der Fälle.


    Als Anregung: wäre es möglich, dass netcup das bei Änderungen wie dieser automatisch macht? So kann jeder Kunde, falls etwas passiert, unkompliziert den Status zurücksetzen


    Viele Grüße

    • Offizieller Beitrag

    Selbst der normale Support ist heute nicht erreichbar, der Notfallsupport wäre auch nicht erreichbar gewesen.


    Ich habe Ihnen heute morgen bereits auf Ihre eMails geantwortet die Sie uns heute morgen gesendet haben. Der Support ist also Sehr wohl per eMail erreichbar. Telefonisch ist der normale Support heute aufgrund des Feiertags nicht besetzt.


    Der Notfallsupport ist rund um die Uhr erreichbar. Wodurch begründen Sie Ihre Aussage, dass der Notfallsupport heute erst recht nicht erreichbar wäre? Ich kann Ihnen versichern, dass der Notfallsupport heute ganz regulär rund um die Uhr erreichbar ist. Ein andere Kunde hat diesen z.b. heute bereits genutzt.


    Das Notfallsupport Telefon liegt derzeit keine 2m von mir entfernt.

  • Guten Tag,

    Zitat

    Man hätte es ja vorab bei den netcup Labs ausprobieren können.
    Diese wurden anscheinend noch nicht informiert oder aktualisiert.

    die nclabs nutzen eine QEMU-Version noch im Testing ist. Dazu steht mehr im entsprechenden Forenbereich.


    Update:


    Ein paar wenige Server sind mit unserem automatischen Script nicht neu gestartet worden. Diese bearbeiten wir jetzt manuell. Betroffene Kunden schreiben wir per E-Mail an.


    Mit freundlichen Grüßen


    Felix Preuß

  • Bei mir ebenfalls: Hing seit heute früh per ssh auf der shell und mein Server war nicht im automatischen Neustart gestern dabei. Ich bekam, wie angekündigt, eine E-Mail, sah auf der Console "Rebooting Power Button pressed" und die Maschine war nach knapp 15 min wieder online, alles ohne Fehler. Vielen Dank für die schnelle Reaktion und den guten Service!