Performance Probleme mit meinem Root-Server

  • Guten Abend und einen schönen Sonntag allesamt:saint:


    Ich bin seit Juli im Besitz eines Root Servers von diesem Typ: RS 4000 SSD G8SE a1.

    Bisher lief dieser auch ohne Probleme mit einer aktivierten Version von Windows Server 2019.


    Auf diesem Server sollen gleichzeitig mehrere kleine Minecraft-Server, mehrere kleine Teamspeak 3-Server sowie jeweils ein paar Musikbots, ein FTP-Server und verschiedene andere Gameserver laufen.

    Bis vor etwa 4 Wochen ging das wie gesagt alles ohne Probleme.


    Zum Problem:


    Seit etwa 4 Wochen werde ich von Performance-Problemen geplagt, die sich allerdings weder im Taskmanager, noch über die Ereignisanzeige oder sonstige Methoden visualisieren lassen. Den Server habe ich Samstagnacht bereits neu aufgesetzt, zum aktuellen Zeitpunkt laufen nur ein Minecraft-Server und ein Teamspeak 3-Server. Auf beiden Servern lassen sich regelrechte Aussetzer feststellen, am stärksten sind die Auswirkungen im Teamspeak, besonders gut hörbar, wenn ein Musikbot vorhanden ist, der auf dem Root-Server läuft.

    Die Aussetzer im Teamspeak sind am ehesten mit metallischen / robotischen Störgeräuschen / Rauschen zu vergleichen, die sporadisch auftreten. Auch über den Remotedesktop sind sporadische Aussetzer zu erkennen.


    Was ich schon versucht habe:


    Zunächst hatte ich die Netzwerkverbindung in Verdacht, allerdings ergaben gleichzeitige Traceroute-Tests in beide Richtungen keine Probleme, obwohl die Störungen während dieser Tests deutlich zu vernehmen waren.

    Auch der Taskmanager und die Ereignisanzeige zeigten wie bereits erwähnt nichts Verdächtiges an.

    Anschließend habe ich den Server neu aufgesetzt und nur das Nötigste installiert, ohne Besserung.

    Meine anschließende Anfrage im Ticketsupport wurde freudig entgegengenommen und schnell bearbeitet, sodass alle Tests seitens NetCup innerhalb von 2 Tagen durchgeführt waren. Allerdings konnte mir hier nicht geholfen werden und alles blieb beim Alten.


    Momentanzustand:


    Im Moment laufen die beiden oben genannten Server und produzieren eine dauerhafte CPU-Auslastung von 5-6% und eine RAM-Auslastung von 14-15%, was auch dem Dauerzustand auf dem Server entspricht, dennoch sind die Aussetzer nach wie vor vorhanden.

    Was mich am meisten verwundert, ist die Tatsache, dass die gleiche Konstellation bis vor knapp 4 Wochen einwandfrei lief, ohne jeden Ruckler oder Aussetzer. Die Probleme tauchten schleichend auf und wurden immer schlimmer.


    Ich bin mit meinem Latein am Ende und würde mich über jede Antwort freuen. Sollte ich etwas vergessen haben oder ihr sonst noch Infos brauchen, lasst es mich bitte wissen.

    P.S.: Entschuldigt bitte den Roman:saint:

  • Bist Du sicher, dass die Störungen den Server und nicht Deinen Internetzugang betreffen?

    Hast Du auch die IP-Konfiguration des Servers statisch gesetzt?

    Also diese Aussetzer konnte ich mit meinen Systemen (PC und Notebook) bei mir zuhause, sowie mit dem Notebook bei Bekannten feststellen. Überall das gleiche. Zudem ist anzumerken, dass die Aussetzer ( zumindest gefühlt ) gegen Abend schlimmer werden. Auch andere Nutzer, die in ganz Deutschland verteilt sind, haben die gleichen Aussetzer auf dem Remote und auf den anderen Servern, die auf dem Root laufen.


    Was genau meinst du mit statisch setzen? Die öffentliche IP sollte doch statisch sein, oder bin ich da falsch? Die öffentliche Adresse funktioniert jedenfalls bis heute und hat sich nicht geändert.

  • Kabelanschluss?


    Schicke doch mal (bspw. abends) einen MTR auf den Server, klingt ja alles nach Paketverlust

    Es fühlt sich auch an wie Paketverlust, allerdings ist keiner vorhanden.

    Selbst die Verbindungsinfo des Musikbot, meinem Paradebeispiel der Störungen in dieser Angelegenheit, der bisher einwandfrei funktioniert hat, zeigt einen Ping von 1 ms ohne Paketverlust.

    Allerdings bricht die Wiedergabe bei den Störungen ab, wer schonmal Teamspeak verwendet hat, kennt den blauen Punkt, der leuchtet, wenn gesprochen wird und aus ist, wenn man nicht spricht.

    Bei den Aussetzern geht der blaue Punkt kurzzeitig aus, dann beginnt der blaue Punkt wieder zu leuchten, unterdessen sind die Störgeräusche zu vernehmen, nach einer halben Sekunde ist es vorbei und die Musik läuft ganz normal weiter.

    Da der Musikbot, genauso wie die anderen Server, auf dem Root-Server läuft, liegt für mich die Vermutung nah, dass etwas mit dem Server nicht stimmt.

    Ich habe bereits zu allen Tageszeiten Traceroute Tests in beide Richtungen laufen lassen, über 2 Stunden am Stück, im Hintergrund der Teamspeak freudig am Störgeräusche produzieren, die Spieleserver am aussetzen und so weiter.

    In der Traceroute keinerlei Paketverluste über 2 Stunden hinweg. Wie bereits im Eingangspost beschrieben wurden die Aussetzer von anderen Nutzern und an verschiedenen Hausanschlüssen bestätigt.

    Es liegt also definitiv nicht an meinem System und offenbar auch nicht an der Internetverbindung vom / zum Server.:/

  • Statische IP: Unter Windows nicht DHCP verwenden, sondern IP, Netzmaske, Gateway und DNS-Server manuell eintragen. Detto für IPv6.

    Nur weil Dir Dir eine statische IP zugewiesen worden ist, musst Du sie ja nicht statisch konfigurieren. Per Default ist DHCP aktiv... und DHCP-Leases laufen ab. Auch kann ein DHCP-Server vorübergehend Störungen haben. Überall wo „Serverdienst“ draufsteht, ist ein DHCP-Client eher nicht optimal.

  • Auch kann ein DHCP-Server vorübergehend Störungen haben.

    Inwiefern beeinflusst ein gestörter DHCP meine bereits geleaste Adresse oder gar überhaupt meine Netzwerkanbindung? Bin jetzt kein Netzwerk Junkie aber wäre mir schon fremd.

    • Nichts desto trotz, was machen eigentlich so deine Latenzen in den ganzen Zeiträumen? Kein Paketverlust zu haben ist eine Theorie wenn Pakete aber über den Globus geleitet werden, ist das etwas zu lange um einen vernünftig gepufferten Stream hin zu bekommen.
    • Wie ist dein Medium mit dem du dich auf deine Spielwiese verbindest angebunden? WLAN, Kabelgebunden?
    • Welche Netzwerktechnologie hat dein Anschluss? Kaut vieleicht eine Kuh auf der Leitung deines Anbieters?
    • Ist eventuell dein Bot das Problem? Der bezieht ja seinen Stream ja auch irgendwo her und Multicastet ihn...
    • Ist Windows vielleicht auch selbst einfach das Problem? Das ist jetzt auch zur Abwechslung mal ernst gemeint.

    • Bezüglich der Steal Time könntest du einfach mal ein paar Performance Counter unter Windows suchen die genau sowas verraten könnten.


    Oh mächtige Glaskugel!

  • Inwiefern beeinflusst ein gestörter DHCP meine bereits geleaste Adresse oder gar überhaupt meine Netzwerkanbindung? Bin jetzt kein Netzwerk Junkie aber wäre mir schon fremd.

    Jeder Lease hat ein Timeout. Nach einer Weile wird der Lease ungültig, und der DHCP-Client muss ihn dann entweder (rechtzeitig) erneuern oder gänzlich neu anfordern. Auch DHCP-Server können bei Überlast verzögert antworten. Die Antwortpakete auf Basis von UDP sind im Gegensatz zu TCP nicht abgesichert und können verloren gehen. Den Worst-Case kennt jeder, das schon einmal selbst eingerichtet hat und nicht aufgepasst hat: zwei konkurrierende DHCP-Server im Netz bei Fehlkonfiguration.


    Wenn IPv6 im Spiel ist, passiert dasselbe auf Basis von SLAAC/radvd in ähnlicher Weise - nur, dass da auch Routeninformationen dynamisch hereinkommen können.


    In beiden Fällen kann es -selten aber doch- vorkommen, dass ein Rechner kurz einmal ohne jegliche Verbindung dasteht oder -häufiger- eines der Protokolle -meistens IPv6- gerade nichts routet, obwohl es präferiert wird. Das Thema gab es hier im Forum auch schon ein paar mal in Bezug auf Debian und sysctl-Settings, die nicht wie im Wiki beschrieben gemacht worden sind.

  • ist echt ein Grund warum ich nie wieder was mit Windows zu tun haben will...

    und Ja leider... muss ich noch die Clients verwenden.


    Was mir aber so noch als Stichwort einfällt: Firewall, Antivirus und ich weis nicht in wieweit windows Server 2019 wie Win10 ist, die heimlichen nicht abschaltbaren Updates im Hintergrund


    was ich mal probieren würde, um jegliche netzwerkproblem extern auszuschliesen, versuchen einen client auf dem server zu installieren und eine aufnahme starten, diese herunterladen und abhören ob die fehler da auch sind. also via 127.0.0.1 (localhost)


    P.s. ist der musikbot auch per localhost angebunden?

    jeder der einen Schreibfehler in meinem Post findet, darf ihn Kommentarlos behalten

    P.S. gilt auch für Schignaturen ;)

  • Statische IP: Unter Windows nicht DHCP verwenden, sondern IP, Netzmaske, Gateway und DNS-Server manuell eintragen. Detto für IPv6.

    Nur weil Dir Dir eine statische IP zugewiesen worden ist, musst Du sie ja nicht statisch konfigurieren. Per Default ist DHCP aktiv... und DHCP-Leases laufen ab. Auch kann ein DHCP-Server vorübergehend Störungen haben. Überall wo „Serverdienst“ draufsteht, ist ein DHCP-Client eher nicht optimal.

    Also zu diesem Post, ich weiß nicht ganz welche Einstellungen ich setzen muss, um ein funktionierende Verbindung hin zu bekommen.


    Inwiefern beeinflusst ein gestörter DHCP meine bereits geleaste Adresse oder gar überhaupt meine Netzwerkanbindung? Bin jetzt kein Netzwerk Junkie aber wäre mir schon fremd.

    • Nichts desto trotz, was machen eigentlich so deine Latenzen in den ganzen Zeiträumen? Kein Paketverlust zu haben ist eine Theorie wenn Pakete aber über den Globus geleitet werden, ist das etwas zu lange um einen vernünftig gepufferten Stream hin zu bekommen.
    • Wie ist dein Medium mit dem du dich auf deine Spielwiese verbindest angebunden? WLAN, Kabelgebunden?
    • Welche Netzwerktechnologie hat dein Anschluss? Kaut vieleicht eine Kuh auf der Leitung deines Anbieters?
    • Ist eventuell dein Bot das Problem? Der bezieht ja seinen Stream ja auch irgendwo her und Multicastet ihn...
    • Ist Windows vielleicht auch selbst einfach das Problem? Das ist jetzt auch zur Abwechslung mal ernst gemeint.

    • Bezüglich der Steal Time könntest du einfach mal ein paar Performance Counter unter Windows suchen die genau sowas verraten könnten.

    Die Latenzen sind in diesem Zeitraum zu keinem Zeitpunkt höher als 20 ms zum Server.

    Ich sitze vor einem Desktop-PC, dementsprechend auch per LAN-Kabel angebunden, das habe ich auch schon ausgetauscht, weil ich dieses zunächst sogar in Verdacht hatte

    Ich verwende hier eine 75000er Leitung, die einwandfrei funktioniert und ich muss dich leider enttäuschen, Kühe haben wir hier keine:D

    Der Bot funktioniert einwandfrei, wenn ich ihn vom Root auf meinen PC verschiebe, die IP-Adressen anpasse und ihn zu einem anderen TS verbinde.

    Das ist eine gute Frage, allerdings lief alles für etwa 3 Monate ohne jedes Problem und ich habe seit etwa 3 Monaten keine EInstellungen mehr getätigt, frei nach dem Motto: don't touch a running system!

    Zu dem Link den du eingefügt hast, das erscheint mir etwas zu sehr aufgeblasen, ich werde das ganze heute Mal im Rettungssystem testen.

    Der Musikhost verbindet lokal auf den Server, also über 127.0.0.1, den Test habe ich auch schon durchgeführt, mit den gleichen Aussetzern wie über den normalen Client auf meinem PC.

    Firewall habe ich alles 3 mal geprüft, da ist auch nichts mehr zu machen, was den Bot oder den Teamspeak betrifft.

    Als Antivirus muss ich zugeben verwende ich den Windows Defender, ich denke nicht, dass der plötzlich Probleme macht (bitte keine Debatten über Antivirus anfangen!)

    Hab ich auch erst überlegt aber es scheint so:

    Um diese Fragen abschließend zu klären, ja, er läuft auf dem Root Server und ist per 127.0.0.1 auf dem Teamspeak verbunden.

  • [...] allerdings lief alles für etwa 3 Monate ohne jedes Problem und ich habe seit etwa 3 Monaten keine EInstellungen mehr getätigt, frei nach dem Motto: don't touch a running system!

    In wie fern kannst du denn ausschließen, dass keine böswilligen Prozesse deine Netzwerkanbindung beeinträchtigen? Sprich wie hast du deinen Server nach außen/innen abgesichert?

  • Wie viel Traffic verursacht der Server? Das kann im SCP unter "Statistiken -> Netzwerk Bytes -> vergangene 31 Tage" unten in der Grafik bei "total" abgelesen werden.


    Eventuell wurde die Maschine aufgrund von überdurchschnittlich viel Traffic auf einen dafür reservierten Node migriert, wodurch Lastspitzen anderer Gäste jetzt spürbarer sind?

  • In wie fern kannst du denn ausschließen, dass keine böswilligen Prozesse deine Netzwerkanbindung beeinträchtigen? Sprich wie hast du deinen Server nach außen/innen abgesichert?

    Die Probleme bestanden ununterbrochen nach einer Neuinstallation des Root - Servers und wie bereits erwähnt ist das Problem sowohl mit meinem PC und meinem Notebook, über localhost direkt auf dem Server als auch von anderen Clients in ganz Deutschland verteilt, sehr stark zu vernehmen

  • Wie viel Traffic verursacht der Server? Das kann im SCP unter "Statistiken -> Netzwerk Bytes -> vergangene 31 Tage" unten in der Grafik bei "total" abgelesen werden.


    Eventuell wurde die Maschine aufgrund von überdurchschnittlich viel Traffic auf einen dafür reservierten Node migriert, wodurch Lastspitzen anderer Gäste jetzt spürbarer sind?

    Mit dem Filter auf 31 Tage steht bei TX 97 GB und bei RX 46 GB wobei an der Stelle noch weitere 17 GB in beiden Richtungen alleine auf die manuelle Datensicherung und Rückspielung zurückzuführen ist, die ich von Samstag auf Sonntag durchgeführt habe.