HDD-Performance KVM-Server (RS 4000 SAS G7SEa3)

  • Ich bin mittlerweile schon eine ganze Weile Kunde bei Netcup und habe u.A. auch einen KVM-Server (RS 4000 SAS G7SEa3). Anfangs lief der Server auch wirklich flott, aber seid einiger Zeit fällt mir auf, dass die HDD-Performance sehr schlecht ist.


    Die Umgebung ist Ubuntu 16.04 LTS, die Festplatte ist laut SCP als "SCSI" eingebunden, was auch empfohlen wird.


    Konkret gemessen mit hdparm -tT /dev/sda komme ich kaum über 20 MB/s Lesegeschwindigkeit. Ja, ich habe vor dem Test auch alle Dienste beendet, die potentiell die HDD beanspruchen könnten (MariaDB, Apache, PHP-FPM, Dovecot etc.). Das Ergebnis ist wie zu erwarten, dass alle Aktionen, die Zugriffe auf Dateien oder Datenbanken benötigen, die noch nicht im Cache liegen, extrem langsam sind. :(


    Auf anderen Servern, die ich für Freunde bei Netcup betreue, werden problemlos mindestens 100 MB/s erreicht, teilweise auch mehr als 300 MB/s. Grundsätzlich geht es wohl - aber offenbar ist der Storage-Bereich, an dem mein Server hängt, mittlerweile durch andere Maschinen so ausgelastet, dass nur noch wenig Leistung übrig bleibt. Die wöchentliche Datensicherung mit backup2l, die vorher in 1-2 Stunden erledigt war, braucht mittlerweile fast 8(!) Stunden - und das für gerade mal etwas über 90 GB Daten.


    Mit ist klar, dass es immer Schwankungen geben kann und ein gemeinsamer Storage für alle KVM-Server zwangsläufig nicht jeden Server immer mit maximaler Leistung bedienen kann. Aber wenigstens 50-100 MB/s lesend im Mittel wären schon wünschenswert.

  • Ja, mit den SAS Festplatten bin ich auch nie so richtig glücklich geworden. Aktuell gibt es ja den Root-Server 4000 SSDx4 G8SE im Angebot. Wäre das vielleicht eine Option? Die SSD Varianten spielen da in einer ganz anderen Liga. Kann ich sehr empfehlen.

  • Du kannst im SCP eine Speicheroptimierung / Defragmentierung durchführen. Wenn das keine Besserung herbeiführt, kannst du dich an den Support wenden.

    Dieser kann deine VM auf ein anderes Hostsystem verschieben.


    Evtl. ist auf deinem Host auch ein Defekt (z.B. leere Pufferbatterie), wodurch die I/O Performance verlangsamt wird.

  • 20MB/s ist schon extrem wenig. Wie sieht es denn im Rettungssystem aus? Sind die Werte dort auch so schlecht?

    Meine Minecraft-Plugins auf SpigotMC (Open Source): www.spigotmc.org/members/mfnalex.175238/#resources

    Discord: discord.jeff-media.com

  • Eine Defragmentierung ist für mich keine echte Option, weil das eine Downtime von mehreren Stunden bedeutet. Der Server wird aber produktiv für mehrere gut besuchte Websites und Postfächer für mehrere dutzend Personen genutzt und mehr als 10-20 Minuten Downtime am Stück sind immer ein Problem.


    Mittlerweile hatte ich Kontakt mit dem Support und mir wurde angeboten, die VM auf einen anderen Node zu migrieren, wobei das im laufenden Betrieb ohne nennenswerte Downtime möglich sein soll. Dem habe ich zugestimmt und warte die Rückmeldung ab, wenn das durchgeführt wurde.


    Zu diesem Anlass:


    Gibt es bei Netcup die Option, mehrere Server als Ausfallsicherheit zu betreiben? Also z.B. extern nur eine IP-Adresse und Forwarding auf die erste Maschine, die erreichbar ist? Dann könnte man ggf. einen Server in Ruhe warten während der Betrieb von einer zweiten Maschine fortgeführt wird. Die Synchronisierung der Daten zwischen den Maschinen wäre für mich kein Problem.

  • Gibt es bei Netcup die Option, mehrere Server als Ausfallsicherheit zu betreiben? Also z.B. extern nur eine IP-Adresse und Forwarding auf die erste Maschine, die erreichbar ist? Dann könnte man ggf. einen Server in Ruhe warten während der Betrieb von einer zweiten Maschine fortgeführt wird. Die Synchronisierung der Daten zwischen den Maschinen wäre für mich kein Problem.

    Ja, wäre z.B. mit der Failover IP (https://www.netcup.de/bestellen/produkt.php?produkt=1073) und einem keepalived Service gar kein Problem. Das hatte ich genau so auch schon im Einsatz.

  • Wenn du kein keepalive, etc. willst, dann kannst du dir auch einen kleinen VPS mit z.B. haproxy via opnsense davor setzen.

    "Security is like an onion - the more you dig in the more you want to cry"

  • Wenn du kein keepalive, etc. willst, dann kannst du dir auch einen kleinen VPS mit z.B. haproxy via opnsense davor setzen.

    Ich würde einen Root-Server empfehlen wegen der höheren Verfügbarkeit und den garantierten CPU Ressourcen. Mit einem VPS hatte ich als Router und mit keepalived schonmal Probleme.

  • Danke für die Tipps.


    Eine offizielle Rückmeldung vom Support zum Stand der Migration habe ich zwar noch nicht erhalten, aber hdparm -tT /dev/sda liefert jetzt um die 60-80 MB/s, was für mich vollkommen akzeptabel ist. Vermutlich ist der Umzug erledgt und ich wurde nur nicht benachrichtigt.


    Kleiner Nebeneffekt: ich überwache die Kiste auch mit netdata und hatte bislang regelmäßig eine Warnung wegen verworfener Netzwerk-Pakete. Eine Anpassung der Kernelparameter (speziell net.core.netdev_budget etc.) hat zwar die Häufigkeit der Warnungen reduziert, aber ganz wegbekommen hatte ich das nie. Seit gestern Abend treten diese Warnungen nicht mehr auf, ohne dass ich etwas geändert hätte.