Nach Performance-Problemen und Ursachenforschung bootet VPS nicht mehr

Janerio · 28. Mai 2020

Hallo liebe Forengemeinde,

ich habe meinen VPS bei netcup seit 2015 und heute habe ich mir hier angemeldet. Leider, da ich ein Problem habe und momentan keine Idee, wie ich es Lösung kann.

Ich habe einen M-VPS und betreibe dort folgende Dienste:

Debian Buster

- mariadb

- php-fpm

- apache2

- postfix

- dovecot

Anwendung:

- matomo

- wordpress

- nextcloud

Ein ähnliches Setup betreibe ich seit Jahren und habe Anfang April den Server neuaufgesetzt, da mein Debian hofflungslos veraltet war.

Vor ca. einer Woche kam es nun plötzlich dazu, dass der Server träge wurde. In "top" hatte mariadb teils 100% CPU, nextcloud, wordpress etc. reagierten langsam. Ich kann mir bis heute nicht erklären, was die Ursache war, da ich wissentlich nichts geändert habe (kein Update, keine Konfiguration und keine volle Festplatte etc.). Daraufhin habe ich den netcup-Support kontaktiert und diverse Performance Tests gemacht:

mysqlslap --no-defaults -u root -p --delimiter=";"

> --create="CREATE

> TABLE t (a int);INSERT INTO t VALUES (5)" --query="SELECT * FROM t"

> --concurrency=40 --

> iterations=

dd if=/dev/zero of=/home/jan/testfile bs=1G count=1

> oflag=direct

Beide Tests waren nicht schnell, aber liefen durch. Manche Iterationen dauerten allerdings recht lange.

Mir wurde dann empfohlen, auf das Rettungssystem zu wechseln und dort zu versuchen, ob das Verhalten dort reproduzierbar sei. Da dort meine o.g. Dienste ja nicht laufen habe ich folgenden Test gemacht:

> > > dd if=/dev/zero of=/dev/sda bs=1G count=1 oflag=direct

> > > 1+0 records in

> > > 1+0 records out

> > > 1000000000 bytes (1.0 GB, 954 Mi

> > >

> > > B) copied, 12,5336 s, 79,8 MB/s

Ich habe die Vermutung, dass ich mir dadurch das System zerschossen habe, da dieses nicht mehr bootet. Hat mir jemand bitte einen Typ, wie ich das System wieder herstellen bzw. einrichten kann? Mir fehlt aktuell die Inspiration bzw. kann ich auch nicht sagen, wo das Problem liegt. Ich vermute aber, dass ich die Festplatte (/dev/sda) blöderweise in der Test überschrieben habe. Kann das sein? Wenn ja, kann ich das System retten?

Ich wäre über jeden Hinweis dankbar.

Beste Grüße und vielen Dank

Jan

Kraeutergarten · 28. Mai 2020

Ich würde bei so etwas das Backup einspielen. Alternativ kannst du Netcup fragen ob die eines haben.

Bensen · 28. Mai 2020

Zitat von Janerio

Ich habe die Vermutung, dass ich mir dadurch das System zerschossen habe, da dieses nicht mehr bootet.

https://unix.stackexchange.com…if-dev-zero-of-dev-sda-do

Zitat

WARNING: dd if=/dev/zero of=/dev/ is used to clean a drive or device before forensically copying data. The drive or device must always be sanitized before copying information from a system under forensic investigation to mitigate cross contamination. Therefore, it is not a bad command, the end-user must understand what it is used for or they will destroy their data. If this is what you desire then to verify the zero write operation do dd if=/dev/sda | hexdump -C | head.

Source: A Practical Guide to Computer Forensics Investigations by Dr Darren Haye

Musashi · 28. Mai 2020

Zitat von Kraeutergarten

Ich würde bei so etwas das Backup einspielen. Alternativ kannst du Netcup fragen ob die eines haben.

Der war gut

vmk · 28. Mai 2020

Zitat von Janerio

Mir wurde dann empfohlen, auf das Rettungssystem zu wechseln und dort zu versuchen, ob das Verhalten dort reproduzierbar sei. Da dort meine o.g. Dienste ja nicht laufen habe ich folgenden Test gemacht:

> > > dd if=/dev/zero of=/dev/sda bs=1G count=1 oflag=direct

Du hast deine Festplatte mit Nullen überschrieben. Wer hat dir diesen Befehl gegeben?

Lukay · 28. Mai 2020

Zitat von Janerio

dd if=/dev/zero of=/dev/sda bs=1G count=1 oflag=direct

Mit dem Befehl hast du die ersten 1GB deiner virtuellen Festplatte mit nullen überschrieben.

Ich bin ja kein Profi, vielleicht kannst du Tools zur Datenrettung noch was holen, aber ich vermute eher nicht.

Vermutlich ist dein Bootloader weg, die Partitionstabelle und eben was noch alles auf den ersten 1GB deiner Festplatte gespeichert waren.

Mehr als ein Backup einzuspielen wird dir nicht übrig bleiben..

Janerio · 28. Mai 2020

Ohje, habe befürchtet, dass das der Grund ist und dass der Befehl aus dem Rettungssystem heraus meine Festplatte genullt hat.

Ich wollte eigentlich nur prüfen, wie die IO-Performance ist. Den Befehl hatte ja bereits früher auf eine Datei im Home-Verzeichnis angewandt. Nun ging das nicht mehr und ich habe dann aus Unverständnis direkt /dev/sda angesprochen. Hatte die Hoffnung, dass sda vielleicht nur im Rettungsystem die Festplatte ist o.ä.

Danke für die zahlreichen Rückmeldungen. Nein, leider habe ich kein Backup seit der Neuinstallation Anfang April gemacht. Nextcloud-Daten sind glücklicherweise komplett synchronisiert. Netcup hat leider auch kein Backup....

Lukay · 28. Mai 2020

Zitat von Janerio

un ging das nicht mehr und ich habe dann aus Unverständnis direkt /dev/sda angesprochen

Für das nächste mal: eine Partition deiner Festplatte in einen lokalen Ordner am Rettungssystem mounten und da rein schreiben

Zitat von Janerio

Netcup hat leider auch kein Backup....

Da der Server vollkommen in deiner Kontrolle ist, ist Netcup dafür leider nicht zuständig.

eripek · 29. Mai 2020

Wenn die Verzweiflung groß ist: testdisk ist ein Tool unter Linux, das unter Umständen Partitionen noch retten kann, auch, wenn die Partitionstabelle jetzt erledigt ist. Ich erwähne es halt einmal, aber für jemanden der dd in der erwähnten Form anwendet, ist das vielleicht auch nicht optimal. Andererseits: man lernt nur aus Fehlern. Insofern ist das eine Chance zu wachsen. Das erste Gigabyte ist aber verloren. Mein Beileid zum Datenverlust.

sdellenb · 29. Mai 2020

Ich hab am Sonntag was ähnliches produziert (mit shred) als ich ein altes Notebook neu installiert habe.

Ich dachte noch: warum zum Geier blinkt die externe HDD, ich lösche doch die interne? Nach etwa 5 Sekunden ist der Groschen gefallen.

Tags