Beiträge von [Anexia] Sebastian W.

    Noch eine kurze Rückmeldung,

    wir hatten das Problem Anfang der Woche ja schon so behoben, dass keine spürbaren Auswirkungen mehr vorhanden waren. Allerdings gab es noch ein paar messbare Fehler (die in der Praxis nicht zu bemerken waren) die heute repariert wurden. Hier war der Grund ein defektes Kabel hinter einer Abdeckung das dann getauscht wurde. Damit ist die Leitung jetzt auch in den Messungen komplett fehlerfrei. Hierzu noch ein Foto vom Tatort. Man sieht einen leichten Knick bzw. eine Quetschung, was bei Glasfaserkabeln aber schon zu messbaren Fehlern führen kann:


    sys_attachment.jpg

    Guten Morgen,


    wir haben jetzt noch einige Tests durchgeführt und das Problem endgültig behoben. Wir können in unseren Benchmarks keine Probleme mehr feststellen, der Datenverkehr läuft normal. Falls noch Probleme auftreten lasst es uns wissen.

    Hallo,


    wir haben jetzt Änderungen vorgenommen von denen wir uns Besserung erwarten. Bitte berichtet uns ob ihr noch Probleme seht oder nicht. Für uns sieht es so aus als wäre das Problem derzeit nicht mehr vorhanden.


    Bitte beachtet, dass wir ggf. noch weitere Tests durchführen müssen, ich kann also noch keine vollständige Entwarnung geben. Es sieht aber ganz gut aus.

    Hallo zusammen,


    ich wollte kurz einen Zwischenstand melden. Wir arbeiten seit dem erneuten Auftreten des Problems an dessen Eingrenzung, ich derzeit exklusiv. Leider erweist es sich als schwer zu fassen. Trotzdem können wir es inzwischen so reproduzieren, dass wir daraus eine Eingrenzung der möglichen Problemstellen vornehmen konnten.


    Das Problem tritt nur bei bestimmten Kombinationen aus fünf Werten auf die jedes TCP- oder UDP-Paket enthält:


    • Quell-IP
    • Ziel-IP
    • Quell-Port
    • Ziel-Port
    • Protokoll


    Bei der gleichen Quell- und Ziel-IP sowie dem gleichen Protokoll tritt das Problem nur bei manchen Kombinationen aus Quell-Port und Ziel-Port auf.


    Das alles weißt auf ein Problem hin welches bei sogenannten Port-Bundles (manchmal Port-Channel, Aggregated Interface o.ä. genannt) auftritt. Bei diesen Bundles werden mehrere physikalische Ports zu einem "Bündel" zusammengefasst und bilden ein logisches Interface. Diese Technik wird weltweit von allen Providern eingesetzt um die Bandbreite von Verbindungen zu erhöhen.


    Wenn Pakete über dieses Interface geschickt werden sollen, berechnet der Router aus den oben genannten Werten eine einzige Nummer (Hash-Wert) die einem der pyhsikalischen Ports in dem Bundle zugeordnet ist. Das wird gemacht damit Pakete der gleichen Verbindung nicht über unterschiedliche physikalische Ports gesendet werden was Probleme verursachen könnte.


    In unserem Fall kann es jetzt sein, dass einzelne physikalische Ports in diesem Bundle entweder voll sind (Das Hashing kann keine perfekte Verteilung garantieren) oder weil Fehler auf einem der physikalischen Ports auftreten. Dann leiden alle Verbindungen darunter die über diesen Port geschickt werden.


    Wir haben mit Verbindungen von mehreren weltweiten Locations getestet um gemeinsame "Problemstellen" auf dem Weg zu finden. Damit waren wir in soweit erfolgreich, dass wir diese auf eine Handvoll Router außerhalb unseres Netzes eingrenzen konnten.


    Wir werden testweise einzelne Links zu diesen Routern deaktivieren um festzustellen ob das Problem nur in bestimmten Kombinationen auftritt. Wir hoffen es dadurch noch weiter eingrenzen zu können um dann gemeinsam mit Telia das Problem endgültig zu beheben.

    Deshalb bitte ich noch um etwas Geduld, sobald es etwas neues dazu gibt melden wir uns wieder.