Serverlag und hoher Ping

Flamme · 17. Mai 2013

Hallo zusammen,

ich wende mich als Netcup-Kunde jetzt einfach mal an Euch, da mir der Support in dieser Angelegenheit scheinbar nicht weiterhelfen kann/will und vielleicht habt ihr hier im Forum ja noch ein paar Ideen, wonach man gucken, bzw. was man testen könnte.

Ich habe das Problem, dass mein Server stoßweise mit ziemlich hohen Pingzeiten geschlagen ist. Auf dem Server läuft recht wenig:
- Apache2 mit PHP + MySQL, eine (wenig genutzte) Webseite und ein "Datenspeicher"
- Subversion, wobei ich der einzige bin, der da Daten bewegt und ich es in diesen Zeiten nicht getan habe.
- Teamspeak3-Server (6 virtuelle Server, etwa 250 Slots - wobei so viel nie genutzt wird).

Natürlich sind noch die dazu notwendigen Pakete, sowie extras wie NTP installiert - aber das sind die "Hauptaufgabengebiete". Installiert ist ein Debian 6, 64 Bit ohne Admin-Panel.

Die Server-Hardware langweilt sich hier zu Tode. Ich habe (neuerdings) den KVM-Neptun-Server (2 GHz, 2GB Ram). Wenn ich in meiner CPU und RAM-Statistik, welche mir mein Icinga hier zu Hause freundlicherweise erstellt nachgucke, sehe ich eine CPU-Auslastung von 0.2 im Schnitt, 0.6 in der Spitze und einen RAM-Verbrauch von etwa 200MB. Einen Datendurchsatz habe ich im Wochenmittel von (in/out) 18kB/s / 45 kB/s und einen maixmalen Wert für die Woche von 296kB/s / 386kB/s.

Zu unterscheiden ist hier zwischen zwei Situationen.
Situation 1: Der Server (Teamspeak) laggt. Hoher Ping, Paketverlust, etc., der Server lässt sich aber noch bedienen und man versteht sich noch halbwegs im TS.
Situation 2: Der Server laggt stark und der TS-Client verliert sogar die Verbindung. Per SSH nicht erreichbar, VCP zeigt "Server nicht erreichbar".

Der Support hat mir gesagt, dass sie da nichts machen können und es auch kein DDoS war. Haben mir nur gesagt, dass sie da nichts machen können und ich mich im Zeitpunkt des Geschehens melden soll (welcher zu meinem Glück hauptsächlich abends/nachts - also außerhalb der Geschäftszeiten liegt). Ich Monitore den vServer seit einer Woche mittels Trace-Statistik hier von zu Hause aus. Der letzte Hop (der Server) hat im Schnitt einen Ping von 20ms. Gelegentlich schießt dieser jedoch auch mal durch die Decke bis zur 600. So heute wieder, für 10 Minuten. Zum selben Zeitpunkt zeigt der vorletzte Hop (corebackbone.netcup.net) jedoch weiterhin einen Ping von 20ms.

Ich frage mich nun, woran das liegt. Der Server ist in diesen Momenten auch nicht mehr ausgelastet als sonst. Ganz im Gegenteil - zu Stoßzeiten auf den Teamspeak-Servern (wir reden hier von maximal 100 Verbindungen) händelt er dies völlig problemlos, schießt dann aber bei ~40 Verbindungen durch die Decke.

Gestern Abend hatte ich wieder mal so einen Fall. Es ist ~20:25 Uhr, ich bin selber auf dem Teamspeak. Ping von ursprünglich ~20ms schießt hoch in die 300 - wieder runter - wieder rauf auf 400 - runter - usw, dies etwa für 20 Minuten. Danach wieder alles normal. Dann erneute Ping-Spitze für etwa 15 Minuten und dann den rest des Abends alles gut. Glücklicherweise lief der Server weiter und ich kam auch noch per SSH drauf. Also vom Server aus MTR zurück - gleiches Bild, 400ms direkt beim ersten Hop. Dann mal einen MTR vom vServer zu einem anderen Netcup-vServer: ebenfalls 400ms bei 5 Hops.

Der Support meint nur ich könne da etwas dran machen - ich habe jedoch ehrlichgesagt das Problem, dass ich keine Ahnung habe, was das sein könnte, wo ich gucken und was ich einstellen könnte. Ich halte mich zwar für "Fit" in Linux und Serveradministration - sonst hätte ich mir einen solchen Server nicht geholt - aber hier weiß ich auch nicht mehr weiter. Zumal dieses Problem keinem für mich verständlichem Muster folgt, sondern auch einfach mal auftritt wenn nichts los ist. Vor einer Woche hatte ich dieses problem Samstag morgen zwischen 3 und 4 Uhr - die Teamspeak-Server so gut wie leer geräumt und der Ping schwankt im 2-Minuten Tackt zwischen 20ms und 630ms.

Vorher (vor dem jetzigen Server) hatte ich einen Profi vServer, mit welchem ich dieser art Probleme aber nicht hatte. Er hat in 2 Jahren nur ein mal Spürbar gelaggt - und da war ein DDoS auf einem Server nebenan schuld wie mir vom Support mitgeteilt wurde. Den neuen KVM-Server habe ich jetzt seit nicht mal einem Monat und seit dem deutlich häufiger diese Probleme.

In den Anhängen mal Traceroute-Statistiken, sowohl von mir zum vServer, als auch der Rückweg vom vServer zu mir und eine Traceroute vom NetCup-vServer zum NetCup-vServer. Die ersten und letzten Hops habe ich unkenntlich gemacht. Ich habe, dank des Monitorings noch weitaus mehr Statistiken von mir zum Server, falls hier Bedarf sein sollte.

Danke + Gruß,
Flamme

Blaster · 18. Mai 2013

Bei Situation 2 kannst du nicht wirklich viel Dafür. Hast du den Teamspeak nach der Netcup Anleitung aufgesetzt ?

[gelöschtes Individuum] · 18. Mai 2013

Zitat von Blaster

Bei Situation 2 kannst du nicht wirklich viel Dafür. Hast du den Teamspeak nach der Netcup Anleitung aufgesetzt ?

Warum nicht?

Blaster · 18. Mai 2013

Wenn das VCP Server nicht erreichbar ansagt, was willst du dafür können ?

Flamme · 18. Mai 2013

Zitat von Blaster

Hast du den Teamspeak nach der Netcup Anleitung aufgesetzt ?

Ähnlich. Als ich den Teamspeak-Server das erste mal installiert habe, gab es von NetCup noch keine Anleitung dafür. Auf den neuen KVM-Server habe ich ihn dann einfach nur rüberkopiert.

Blaster · 19. Mai 2013

Dann kann es an der Falschen Konfiguration liegen...

LG Blaster

Flamme · 21. Mai 2013

Als wenn man da so viel falsch machen kann...

Also gut, mein TS liegt in einem weiteren Unterverzeichnis, der Benutzer heißt anders und der Server nutzt statt SQLite eine MySQL-DB. Ansonsten identisch.

[gelöschtes Individuum] · 21. Mai 2013

Zitat von Blaster

Wenn das VCP Server nicht erreichbar ansagt, was willst du dafür können ?

Wenn dein Server ausgehend DoS't kannst du zum Beispiel sehr viel dafür und der VCP daemon kann auch nicht mit dem Server kommunizieren. Gibt noch viel mehr weniger kritische Beispiel.

Aber genug Offtopic nun.

Zum Problem: Ist das auch genau so wenn der Teamspeak Server nicht läuft? Wenn ja, dann davon mal genau solche Graphen erstellen.

Flamme · 22. Mai 2013

Hallo gelöschtem Individum,

das Problem ist hier, dass der Teamspeak-Server ja genutzt wird und ich nicht vorhersagen kann, wann der Server mal wieder nicht/schwer erreichbar sein wird.

Den letzten Anstieg hatte ich am 17.05.2013 zwischen 17:36:00 und 17:43:30 mit einem Ping von bis zu 652. Seitdem, bis auf einige nicht nennenswerte Spitzen, ist er problemlos erreichbar. So extrem, wie zu Beginn meiner "Aufzeichnungen" am 11.05.2013, zu denen der Server satte 8 Stunden zwischen Situation 1 und 2 hin- und her pendelte, ist es glücklicherweise noch nicht wieder geworden - und ich hoffe, wird's auch nicht mehr.

Ich kann höchstens beim nächsten starken und andauernden Lag mal den TS-Server kurz ausschalten und gucken, ob's sich dadurch bessert.

Das Problem was ich hier generell jedoch sehe ist, dass ich das Problem mit "meinem alten" Profi vServer (über Hetzner gerouted) nie hatte und seitdem ich nun den KVM-Server (über Netcup @ corebackbone.net gerouted) habe, beschäftigt mich das Problem bereits 3 Wochen, bei nahezu identischer Konfiguration - da kann doch irgendwas anderes nicht stimmen. Ob es was mit dem Routing oder dem KVM zu tun hat, weiß ich allerdings nicht - jedoch sind das die auffallensten unterschiede.

Dragon · 22. Mai 2013

Am Routing hängt es ja ganz offensichtlich nicht (laut dem Screenshot). Mal davon abgesehen routet Netcup unterschiedlich, nicht nur über Core-Backbone.

MMax · 22. Mai 2013

Die Verwendung der Suche kann gelegentlich hilfreich sein!

Mein persönlicher Tipp zur Aufzeichnung der hohen Latenzen.
Eine mögliche Sichtweise seitens netcup zum vorliegenden Sachverhalt.

locke3 · 4. Juni 2013

Hab das Problem auch seit (gefühlt) zwei Wochen. Traffic weißt keine Anomalien auf.
Wenn man n ping laufen lässt, lässt sich das Problem gut erkennen (siehe Screenshot).

LunaBytesBack · 7. Juni 2013

Ich bin momentan gerade von so einem ähnlichen Problem betroffen.
Seit ca 18:26 Uhr ist mein Server nicht erreichbar. Der Server sollte rennen (im VCP ist dieser aber nicht erreichbar). Bei Ping-Versuchen war der Server sehr sporadisch mit einer Ping-Zeit von 1,3 Sekunden (im Vergleich zu 20-30 ms normalerweise) kurz da. Vor ein paar Tagen trat dieses Problem ebenfalls für eine kurze Zeit auf. Was genau da abgeht weiß ich nicht, wäre aber nett, wenn das behoben werden könnte.
Warum ich das ganze hier schildere? Weil in der Vergangenheit es ebenfalls dies ein paar mal passiert ist, der Support mir damals aber auch nicht weiterhelfen konnte.

Traceroute auf meinen Server (Auszug, der Netcup betreffend ist):

Code

7 18 ms 18 ms 19 ms gw**-corebackbone.netcup.net [80.255.***]
 8 * 18 ms * gw**-corebackbone.netcup.net [80.255.***]
 9 * * * Zeitüberschreitung der Anforderung.
 10 * * * Zeitüberschreitung der Anforderung.
 11 * * * Zeitüberschreitung der Anforderung.
 12 * * * Zeitüberschreitung der Anforderung.
 13 * * * Zeitüberschreitung der Anforderung.
 14 * * * Zeitüberschreitung der Anforderung.
 15 * * * Zeitüberschreitung der Anforderung.

Dragon · 7. Juni 2013

Vermutlich wird ein vServer auf dem gleichen Wirt angegriffen und so die Anbindung lahmgelegt. In der Regel hat Netcup das nach wenigen Minuten im Griff.

ramstein · 7. Juni 2013

interessant ist das sich diese Problematik derzeit zu häufen scheint.
Ich hab das zeitweise das selbe Problem.

Mir wurde gesagt das es wohl an falschen DNS einstellungen liegen könne ....
Da stellt sich mir die Frage was sich denn von alleine daran ändern sollte ?!?
Mal schauen ob isch noch jemand Meldet.

theis · 7. Juni 2013

mein vServer ist seit heute 18:00 offline.

Ein Thread dazu habe ich übrigens auch erstellt.

Ebenfalls nicht über VCP Steuerbar

Dragon · 7. Juni 2013

"Lags" und ein Ausfall von über 90 Minuten haben aber nun wirklich nichts miteinander zu tun...

theis · 7. Juni 2013

naja. lustigerweiße ist meiner jetzt wieder da.

Und als ich eben mal ein Ping gemacht habe. Ja ich weiß auf die Idee kam ich früh ...

hatte ich schon Antworten aber mit Ping Zeiten von 3442 ms

jetzt geht es wieder.

LunaBytesBack · 7. Juni 2013

Zitat von theis

naja. lustigerweiße ist meiner jetzt wieder da.

Und als ich eben mal ein Ping gemacht habe. Ja ich weiß auf die Idee kam ich früh ...

hatte ich schon Antworten aber mit Ping Zeiten von 3442 ms

jetzt geht es wieder.

Alles anzeigen

Hier geht es ebenfalls wieder. Kann sein, dass unsere vServer auf dem gleichen System sind

theis · 7. Juni 2013

ach wie schön. So lernt man sich kennen. Für was so ein bisschen Aufregung nicht alles gut ist.

Jetzt wüsste ich noch gerne woran das lag, aber mein Ticket ist ja noch offen

Tags