Latenz Probleme

  • Hallo,


    ich habe seit kurzem bei netcup einen vServer und habe deshalb viel per SSH gearbeitet. Bereits am anfang, habe ich bemerkt, dass nach einer gewissen Zeit vom Server keine Reaktion kommt. Die Verbindung bricht nicht ab (keep alive übrigends auf 30sek).
    Nach gefühlt 2-20 Sekunden geht es dann weiter.


    Dieser Sache bin ich dann auf die Spur gegangen. Zuerst habe ich geschaut, ob mangelnder Speicher ein Problem ist. Egal wieviel ich frei hatte, an der Situation hat sich nichts geändert. Auch die sonstige Auslastung war vollkommen i. O.


    Deshalb habe ich mal einen Test gemacht. Alle 5 Sekunden wird zu einem Webserver ein Request für eine statische Seite (Die bekannte "It works") gesendet. Die Zeit bis der Response kommt, wird gemessen und protokolliert.


    Dies habe ich auf 3 Servern parallel gemacht. Der Test lief ca. 30 Minuten.


    [Blockierte Grafik: http://www.bondservant.de/latenz.png]


    Legende:
    Blau) privater DSL > vServer
    Rot) business Standleitung > vServer
    Gelb) vServer -> privater DSL


    Die y Achse zeigt die Latenz in Sekunden an.
    Mit einer max. Latenz von 1 Sekunde bei "Gelb" kann man ohne Probleme leben. Somit scheint es beim ausgehenden Verkehr keine Probleme zu geben.


    Die eingehenden Werte sind aber teilweise sehr heftig. 12,5 Sekunden für eine Antwort ist schon sehr lange.


    Es geht in dieser Zeit auch nicht um einzelne Verbindungen, da die Probleme zeitgleich bei zwei unterschiedlichen Clients bzw. sogar Netzen auftreten.


    Den gleichen Test (gleiche Laufzeit) habe ich mal bei google (sie mögen mir verzeihen ;)) gemacht. Dort bin ich auf max. Werte von 233ms gekommen.


    Mein Fazit ist, dass vielleicht der Server bzw. der Router ab und zu Probleme mit der Queue der eingehenden Pakete hat.


    Für das "Live" arbeiten am Server, ist dies sehr nervig und für http auch unschön.


    Bei ping konnte ich das Problem im ersten kleinen Test soweit nicht feststellen.


    Mit freundlichen Grüßen
    Tim Jordans

  • Vorab sei gesagt, dass Google keinen einzelnen Server besitzt, sondern etliche Server die auf der ganzen Welt verteilt sind. Ist eine Route gestört, wird eine von vielen Ersatzrouten genommen. Wenn Sie das Geld in die Hand nehmen was Google benutzt um gut verfügbar zu sein, können Sie einen Vergleich anstellen. Mit einem vServer haben Sie nicht einmal ansatzweise die Verfügbarkeit und Laufzeiten wie Google sie hat (ich denke dieses sollte alleine der Preis schon klarstellen).


    Um eine Lösung für Ihr Problem finden zu können, sollten Sie zunächst die Ursache für das Problem finden. Wenn Sie vermuten das ein Router hierfür verantwortlich ist, können Sie dieses ja relativ einfach über MTR feststellen.

  • Hallo, danke für die schnelle Antwort.


    Das mit google soll auch kein Vergleich mit meinem kleinen vServer sein, sondern soll zusätzlich Fehler bei den Clients ausschließen.
    D. h. es soll sichergestellt sein, dass die Clients diese sporadischen Probleme nicht produzieren.


    Ich bin nochmal die Schichten durchgegangen, um meinen ersten Test zu bestätigen, bzw. etwas zu lokalisieren.


    Auf der ICMP Schicht konnte ich bisher keine Fehler feststellen. Dies hat MTR auch bestätigt.


    Somit habe ich dann auf TCP Schicht ein Test auf Port 80 mit SYN Flag gemacht. Dieser hat auch keine Probleme bereitet.


    Anschliessend habe ich dann mit wbox auf HTTP Schicht getestet. Dieser hat meinen ersten Test bestätigt.


    --- 344 replies received, time min/avg/max = 64/82.27/5441 ---


    Bei dem Test waren 343 requests i. O. und einer hatte die 5,4 Sekunden.


    Meine Probleme waren ja HTTP und SSH. D. h. beides Dienste die TCP/IP gekapselt sind.


    Ich denke das Problem liegt nicht bei dem TCP/IP Verbindungsaufbau, sondern der darin enthaltenen HTTP Request/Response.


    Da HTTP und SSH von der Konfiguration nichts gemeinsam haben, schliesse ich einen Konfigurations-/Benutzerfehler "eigentlich" aus.


    Es wäre ausserdem komisch, wenn man zwei Anwendungen beide falsch konfiguriert und diese dann die gleichen sporadischen Fehler erzeugen.


    Ich weiss nicht, was ich noch für die Lösung des Problems beitragen könnte und sehe keine Möglichkeit softwareseitig an der Situation etwas zu ändern.

  • Das schließt keinen Fehler an Ihrem System aus. Eine hohe Auslastung einer Ressource kann z.B. das Phänomen verursachen (Logateien können nur verzögert geschrieben werden o.ä...). Auch besteht die Möglichkeit, dass der TCP-Verkehr gestört wird, da unsere Firewall Pakete verwirft oder Sie mehr Bandbreite beanspruchen als ihnen zur Verfügung steht.


    Hier am besten einmal direkt an den Support wenden. Der kann dann prüfen ob bei uns Gründe für das Phänomen vorliegen.