Wiederherstellung eines RAID

  • Moin,


    ich habe Freitag die nicht so schöne Rückmeldung bekommen, dass unser V-Server-Wirtssystem einem Defekt erlegen ist und somit auch der vServer zerstört ist. Es gibt zwar Backups dazu, dennoch muss der ganze Kram wieder zusammengebastelt werden, wozu momentan recht wenig Zeit ist.
    Nun ist meine Frage, ob eine professionelle Datenrettungsfirma das RAID rekonstruieren kann oder ob die Geräte direkt auf den Müll wandern. Und natürlich ob Netcup dafür sorgen kann inklusive KVA etc.
    In Zukunft wäre es schön, wenn in der E-Mail mit der Ankündigung nochmal erwähnt wird, dass eine Snapshotdatensicherung meinerseits hätte gemacht werden sollen, da dieses offenbar nicht Standard bei Wartungen ist. Zumindest stand es in der Entschuldigungsmail drin. Da war es aber schon zu spät... Daher der Vorschlag dazu einige Sätze in diesen Mails zu verlieren. Auch wäre der Hinweis auf einen technischen Defekt nett gewesen. Dann wären die Sirenen bei mir definitiv angegangen...


    Ansonsten sind wir ja schon selbst dafür verantwortlich. Ist ja schon klar. Aber die Divise ist: Wer an den Sachen rumspielt, sichert sie nochmal vorher. Selbst ein automatischer Snapshot bei Erkennung des Fehlers wäre sehr cool gewesen ;)


    Viele Grüße
    Stefan

  • Die Snapshots helfen leider gar nichts, da sie sich auf dem selben Dateisystem befinden.


    Die sind nur dazu gedacht fehlgeschlagene Updates rückgängig und ähnliches zu machen.


    Man hätte wirklich eine Vollsicherung machen müssen. Ich persönlich finde das auch unbefriedigend, aber es scheint bei netcup nicht anders zu gehen.

  • Leider ist es so, dass ein RAID keine 100%ige Datensicherheit auf unbegrenztem Zeitraum sicher stellen kann. Es besteht zum einen die Gefahr das so viele Festplatten zeitgleich ausfallen, so dass Daten verloren gehen und auch keine Rekonstruktion dieser mehr möglich ist oder das der RAID-Controller Fehler verursacht und es dadurch zu einem Datenverlust kommt. Diese beiden Gefahren sind bei uns bereits bei wenigen Systemen eingetreten. Weitere Gefahren wären noch menschliches Versagen, höhere Gewalt wie z.B. ein großes Unwetter und einige mehr. Da diese Gefahren bestehen sichern wir keine 100%ige Datensicherheit zu und verpflichten die Kunden per AGB ihre Daten ausreichend zu sichern. Das ist in der Webhostingbranche ein gängiges Vorgehen, besonders im kostengünstigen Massenmarkt. Als Kunde sollten Sie sich also bewusst sein, dass es immer zu einem Datenverlust kommen kann und Maßnahmen ergreifen um bei einem Datenverlust ihre Daten möglichst schnell zurück spielen zu können.


    Wir bieten dafür mehrere Möglichkeiten an. Zum einen bieten wir externen Backupspace auf dem Sie eigenständig Daten kopieren und sichern können. Dieses ist besonders für Systeme zu empfehlen, auf denen wir als netcup keinen Zugriff auf einzelne Dateien haben (das ist bei KVM-Servern der Fall). Bei Webhostingangeboten bieten wir z.B. ein komplettes Backupmanagement an, über das regelmäßig Daten gesichert und auch vom Kunden gezielt zurück gespielt werden können. Für managed Server bieten wir selbstverständlich auch einen Service zur individuellen Datensicherung an. Bei KVM-Servern gibt es zudem die Möglichkeit, gesamte Snapshots zu exportieren (das Anlegen eines reinen Snapshots ist nicht ausreichend).

    Quote

    Nun ist meine Frage, ob eine professionelle Datenrettungsfirma das RAID
    rekonstruieren kann oder ob die Geräte direkt auf den Müll wandern.

    Wenn eine Rekonstruktion möglich gewesen wäre, hätten wir dieses gemacht. Dieses ist bereits in der Vergangenheit schon von uns durchgeführt worden, wenn es möglich gewesen war. Wir haben hier keine Kosten gescheut.

    Quote

    In Zukunft wäre es schön, wenn in der E-Mail mit der Ankündigung nochmal
    erwähnt wird, dass eine Snapshotdatensicherung meinerseits hätte
    gemacht werden sollen, da dieses offenbar nicht Standard bei Wartungen
    ist.

    Ich möchte hier noch einmal betonen das ein reiner Snapshot nicht ausreicht. Dieser Snapshot muss für eine unabhängige Sicherung vom Wirtssystem auch auf ein anderes exportiert werden. Sie müssen so Backups anlegen, dass dieses für Sie ausreichend ist. Wir selber können bei Wartungen wie das Firmwareupgrade eines RAID-Controllers alle KVM-Server beenden, die Daten dann auf ein externes Storage kopieren, das Upgrade durchführen und die Server wieder starten. Dieses würde aber mehrere Stunden Zeit in Anspruch nehmen. Das ist nicht im Interesse der meisten Kunden und würde aufgrund des Aufwands die Kosten die wir für KVM-Server verlangen müssen, deutlich teurer machen. Stattdessen prüfen wir jedes Firmware-Upgrade zunächst in einer Testumgebung (nclabs). Auch sichert uns der Hersteller zu, dass die Firmware zuvor getestet wurde. Bislang hat dieses Vorgehen bei mehreren hundert Servern zu keinen Problem geführt, weswegen wir diesen Ansatz bislang für ausreichend gehalten haben. Welche Maßnahmen nun von uns ergriffen werden, wurden Ihnen ja individuell per E-Mail mitgeteilt.


    An diese Stelle möchte ich als Geschäftsführer der netcup GmbH mein Bedauern für den Vorfall erneut betonen. Uns ist die Sicherheit der Daten unserer Kunden sehr wichtig. Aus diesem Grund setzen wir bei der Wahl unserer Lieferanten ausschließlich auf welche, die lang erprobte Hardwarekomponenten liefern. Dieses hat sich bei vielen hunderten von Systemen als erfolgreich erwiesen. Leider können wir trotz der hohen Qualität der Hardware keine Fehler zu 100% ausschließen. Allerdings treten diese deutlich seltener auf wie bei billigen Hardwarekomponenten. Wie wir an einigen Stellen bereits angekündigt haben, arbeiten wir derzeit an einer weiteren Lösung zur Speicherung von Daten unabhängig von der physikalischen Hardware eines produktiv genutzten Systems. Dieser externe Storagespace wird frei skalierbar sein. Berechnet wird nur der tatsächlich genutzte Speicherplatz. Dadurch wollen wir allen Kunden ein weiteres Produkt für eine sehr kostengünstige Datensicherung anbieten.

  • Gut, dann noch eine letzte Frage: Kann bei einem Drittanbieter die Wiederherstellung beauftragt werden oder gibt es da bereits einen Partner? Kann man einen Kostenvoranschlag bekommen? Da Daten von Dritten drauf sind (es sind ja vServer) und ich nicht weiß, wie Sie KVM implementiert haben (Verschlüssellung etc.), müssten Sie dieses beauftragen.

  • Guten Tag,



    leider verstehe ich Ihre Frage nicht so recht. Wollen Sie fragen ob Sie die Festplatten von dem geschädigtem RAID bei einem externen Dienstleister zur Datenrettung abgeben können? Das ist nicht möglich.


    Da in dem hier konkretem Fall, aufgrund des Fehlers den der RAID-Controller hatte, die Daten auf den Festplatten verändert wurden, kann hier selbst ein Geheimdienst vermutlich keine Daten mehr retten.


    Falls ich Ihre Frage nicht richtig verstanden habe, bitte ich Sie diese genauer zu formulieren.


    Vielen Dank!



    Mit freundlichen Grüßen


    Felix Preuß

  • Diese beiden Gefahren sind bei uns bereits bei wenigen Systemen eingetreten.


    Kann man sagen wieviel Prozent der Server im Schnitt einen HDD/Raid Controller defekt haben? Mich interessiert vor allem wie es nach einem Defekt einer HDD oder eines RAID Controllers ausschaut, in wie viele Fällen gelingt es Euch die Daten wieder herzustellen? Man hört hier ja relativ selten etwas von komplettem Datenverlust, dann nehme ich einfach mal an das Ihr da schon einige Möglichkeiten habt.


    Wie wir an einigen Stellen bereits angekündigt haben, arbeiten wir derzeit an einer weiteren Lösung zur Speicherung von Daten unabhängig von der physikalischen Hardware eines produktiv genutzten Systems. Dieser externe Storagespace wird frei skalierbar sein. Berechnet wird nur der tatsächlich genutzte Speicherplatz. Dadurch wollen wir allen Kunden ein weiteres Produkt für eine sehr kostengünstige Datensicherung anbieten.


    Gibt es dazu schon ein mögliches Release? Schön wäre es auch wenn man bereits einen FTP Server hat, diesen einfach im VCP als Backupspeicher eintragen zu können um eventuell direkt die Snapshots der einzelnen Server da abzulegen.

  • Quote

    Kann man sagen wieviel Prozent der Server im Schnitt einen HDD/Raid Controller defekt haben?

    Ich denke das erst bei mehreren tausend Servern hier verlässliche prozentuale Angaben geliefert werden können. So viele dedizierte Server betreuen wir nicht. Wenn ich 365 Tage zurück gucke ist es bei 0,4% der eingesetzten RAID-Controller zu einem Fehlverhalten gekommen, dass einen totalen Datenverlust zur Folge hatte.

    Quote

    in wie viele Fällen gelingt es Euch die Daten wieder herzustellen?

    In einem von drei Fällen konnten wir die Daten wieder herstellen.


    Quote

    Gibt es dazu schon ein mögliches Release?

    Wenn nichts unerwartetes dazwischen kommt wird die öffentliche Beta-Phase im Oktober beginnen. Wir stehen kurz vor dem Release :-)

  • Das hängt von dem Produkt und den / dem Kunden ab der die Hardware nutzt. Wir kalkulieren immer mit drei Jahren Laufzeit für einen Server. Viele Kunden wollen nach drei Jahren aber nicht auf neue Hardware wechseln (never touch a running system) weshalb die Hardware durchaus länger läuft. Wir verlängern dann unsere Garantieverträge mit den Lieferanten.


    Wir setzen nur Hardware ein die für den Server-Betrieb ausgelegt ist. Gerade bei HDDs ist dieses wichtig. Desktop-Festplatten geben in der Regel nach 1,5 - 2 Jahren Betriebsdauer ihre Funktionsfähigkeit auf wenn sie dauerhaft und auch in einer wärmeren Umgebung laufen.