Hallo zusammen,
ich wende mich als Netcup-Kunde jetzt einfach mal an Euch, da mir der Support in dieser Angelegenheit scheinbar nicht weiterhelfen kann/will und vielleicht habt ihr hier im Forum ja noch ein paar Ideen, wonach man gucken, bzw. was man testen könnte.
Ich habe das Problem, dass mein Server stoßweise mit ziemlich hohen Pingzeiten geschlagen ist. Auf dem Server läuft recht wenig:
- Apache2 mit PHP + MySQL, eine (wenig genutzte) Webseite und ein "Datenspeicher"
- Subversion, wobei ich der einzige bin, der da Daten bewegt und ich es in diesen Zeiten nicht getan habe.
- Teamspeak3-Server (6 virtuelle Server, etwa 250 Slots - wobei so viel nie genutzt wird).
Natürlich sind noch die dazu notwendigen Pakete, sowie extras wie NTP installiert - aber das sind die "Hauptaufgabengebiete". Installiert ist ein Debian 6, 64 Bit ohne Admin-Panel.
Die Server-Hardware langweilt sich hier zu Tode. Ich habe (neuerdings) den KVM-Neptun-Server (2 GHz, 2GB Ram). Wenn ich in meiner CPU und RAM-Statistik, welche mir mein Icinga hier zu Hause freundlicherweise erstellt nachgucke, sehe ich eine CPU-Auslastung von 0.2 im Schnitt, 0.6 in der Spitze und einen RAM-Verbrauch von etwa 200MB. Einen Datendurchsatz habe ich im Wochenmittel von (in/out) 18kB/s / 45 kB/s und einen maixmalen Wert für die Woche von 296kB/s / 386kB/s.
Zu unterscheiden ist hier zwischen zwei Situationen.
Situation 1: Der Server (Teamspeak) laggt. Hoher Ping, Paketverlust, etc., der Server lässt sich aber noch bedienen und man versteht sich noch halbwegs im TS.
Situation 2: Der Server laggt stark und der TS-Client verliert sogar die Verbindung. Per SSH nicht erreichbar, VCP zeigt "Server nicht erreichbar".
Der Support hat mir gesagt, dass sie da nichts machen können und es auch kein DDoS war. Haben mir nur gesagt, dass sie da nichts machen können und ich mich im Zeitpunkt des Geschehens melden soll (welcher zu meinem Glück hauptsächlich abends/nachts - also außerhalb der Geschäftszeiten liegt). Ich Monitore den vServer seit einer Woche mittels Trace-Statistik hier von zu Hause aus. Der letzte Hop (der Server) hat im Schnitt einen Ping von 20ms. Gelegentlich schießt dieser jedoch auch mal durch die Decke bis zur 600. So heute wieder, für 10 Minuten. Zum selben Zeitpunkt zeigt der vorletzte Hop (corebackbone.netcup.net) jedoch weiterhin einen Ping von 20ms.
Ich frage mich nun, woran das liegt. Der Server ist in diesen Momenten auch nicht mehr ausgelastet als sonst. Ganz im Gegenteil - zu Stoßzeiten auf den Teamspeak-Servern (wir reden hier von maximal 100 Verbindungen) händelt er dies völlig problemlos, schießt dann aber bei ~40 Verbindungen durch die Decke.
Gestern Abend hatte ich wieder mal so einen Fall. Es ist ~20:25 Uhr, ich bin selber auf dem Teamspeak. Ping von ursprünglich ~20ms schießt hoch in die 300 - wieder runter - wieder rauf auf 400 - runter - usw, dies etwa für 20 Minuten. Danach wieder alles normal. Dann erneute Ping-Spitze für etwa 15 Minuten und dann den rest des Abends alles gut. Glücklicherweise lief der Server weiter und ich kam auch noch per SSH drauf. Also vom Server aus MTR zurück - gleiches Bild, 400ms direkt beim ersten Hop. Dann mal einen MTR vom vServer zu einem anderen Netcup-vServer: ebenfalls 400ms bei 5 Hops.
Der Support meint nur ich könne da etwas dran machen - ich habe jedoch ehrlichgesagt das Problem, dass ich keine Ahnung habe, was das sein könnte, wo ich gucken und was ich einstellen könnte. Ich halte mich zwar für "Fit" in Linux und Serveradministration - sonst hätte ich mir einen solchen Server nicht geholt - aber hier weiß ich auch nicht mehr weiter. Zumal dieses Problem keinem für mich verständlichem Muster folgt, sondern auch einfach mal auftritt wenn nichts los ist. Vor einer Woche hatte ich dieses problem Samstag morgen zwischen 3 und 4 Uhr - die Teamspeak-Server so gut wie leer geräumt und der Ping schwankt im 2-Minuten Tackt zwischen 20ms und 630ms.
Vorher (vor dem jetzigen Server) hatte ich einen Profi vServer, mit welchem ich dieser art Probleme aber nicht hatte. Er hat in 2 Jahren nur ein mal Spürbar gelaggt - und da war ein DDoS auf einem Server nebenan schuld wie mir vom Support mitgeteilt wurde. Den neuen KVM-Server habe ich jetzt seit nicht mal einem Monat und seit dem deutlich häufiger diese Probleme.
In den Anhängen mal Traceroute-Statistiken, sowohl von mir zum vServer, als auch der Rückweg vom vServer zu mir und eine Traceroute vom NetCup-vServer zum NetCup-vServer. Die ersten und letzten Hops habe ich unkenntlich gemacht. Ich habe, dank des Monitorings noch weitaus mehr Statistiken von mir zum Server, falls hier Bedarf sein sollte.
Danke + Gruß,
Flamme