Probleme mit VLAN

  • Moin,


    bin ich der einzige, der Probleme mit dem internen VLANs hat ?

    Am 16.2 gings noch am 17.2 um 23:00 Uhr jedenfalls nicht mehr.

    ifdown/ifup und reboot haben nicht geholfen. Status ist auch ok.



    Ping in diese Netze funktioniert nicht, kann auch nicht angepingt werden.

    Einige Server in diesen Netzen lassen sich aber untereinander anpingen.


    Wenns nicht besser wird muss wohl der Support ran aber da komme ich erst Montag zu.

    Workaround wäre erstmal die öffentliche IP zu nutzen oder zu versuchen ein neues VLAN zu erstellen.

  • Ping in diese Netze funktioniert nicht, kann auch nicht angepingt werden.

    Einige Server in diesen Netzen lassen sich aber untereinander anpingen.

    Der letzte Satz klingt bedenklich. Es können sich also nur einige Server untereinander nicht erreichen? So ein Problem hatte ich (und irgendein anderer Forenuser) auch schon mal, da musste damals der Support ran.


    Angeblich funktioniert es manchmal wieder, wenn man auf allen Servern das betroffene vLAN einmal entfernt und wieder neu hinzufügt. Das geht aber nur, wenn Du nirgends Snapshots hast. Außerdem wäre mir persönlich das zu heikel, da würde ich eher den Notfallsupport anrufen. (Wenn Du alle Ursachen in Deinem Einflussbereich ausgeschlossen hast.)

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Einige Server in diesen Netzen lassen sich aber untereinander anpingen.


    Wenns nicht besser wird muss wohl der Support ran aber da komme ich erst Montag zu.

    Workaround wäre erstmal die öffentliche IP zu nutzen oder zu versuchen ein neues VLAN zu erstellen.


    Als ich das Problem mal hatte, war mein VPS per Live-Migration auf einen anderen Host umgezogen worden, weil es auf dem Original-Host ein Problem gab. Auf dem neuen Host fehlte aber eine Konfiguration. Das ist dann ueber den Support repariert worden.


    Bei mir funktionierte schon die ARP-Aufloesung nicht mehr. Die ARP-Pakete des betroffenen Hosts kamen bei den anderen Kisten nicht mehr an und die ARP-Pakete der anderen kamen beim isolierten VPS nicht an, Das habe ich mit tcpdump gesehen.

  • Ich habe jetzt bei einem betroffenem Host mal die Interfaces entfernt, ausgeschaltet, gestartet neu hinzugefügt und nochmal neu gestartet, das hat nicht geholfen.

    Das Problem tritt bei zwei meiner 10 Server auf, einmal VPS und einmal RS. Kann sein das die Migriert wurden die lagen aber sehr wahrscheinlich nicht auf dem gleichen Wirtssystem,.

  • So neuer Versuch. Ich habe ein weiteres Interface aus einem bisher ungenutztem Cloud VLAN zugefügt.

    Diesmal 10.5.70 als Netzt gewählt.

    Das Funktioniert.

    Habe jetzt ein Ticket eröffnet.

    Mal sehen was da kommt.

  • Konnte bei euch das Problem mit dem VLAN durch den Support schon gelöst werden?

    Habe seit ein paar Tagen leider genau das gleiche Probleme auf einem meiner Server. Habe jetzt heute dem Support noch einen Screenshot aus dem Rettungssystem vom dem betroffenen Server gesendet wo das Problem (VLAN geht nicht mehr) genauso vorhanden ist.


    LG Jim

  • Konnte bei euch das Problem mit dem VLAN durch den Support schon gelöst werden?

    Habe seit ein paar Tagen leider genau das gleiche Probleme auf einem meiner Server. Habe jetzt heute dem Support noch einen Screenshot aus dem Rettungssystem vom dem betroffenen Server gesendet wo das Problem (VLAN geht nicht mehr) genauso vorhanden ist.


    LG Jim

    Hatte ich vor kurzem auch und der Support hat das Problem nach 4 Tagen gelöst. Also eigentlich nach 3 Stunden, es hatte nur 4 Tage gedauert, bis das Problem an die richtige Ansprechstelle weitergeleitet worden war.

  • Ich kapere mal dieses Thema, da ich seit letzte Woche Donnerstag das gleiche Problem habe: Einige meiner Server im VLAN können nicht mehr miteinander kommunizieren. ping, arping, mtr, nichts geht, alles liefert nur "no route to host" bzw. "destination host unreachable".


    Der Support weiß seit Freitag davon und hat von mir die entsprechenden Analyse-Textfiles aus dem Rettungssystem bekommen. Leider keine Lösung bis heute. Ich bin mal gespannt, wie lange das dauert. Effektiv kann ich seit fast einer Woche die Hälfte meiner Nodes nicht nutzen.

  • Der Support weiß seit Freitag davon und hat von mir die entsprechenden Analyse-Textfiles aus dem Rettungssystem bekommen. Leider keine Lösung bis heute. Ich bin mal gespannt, wie lange das dauert. Effektiv kann ich seit fast einer Woche die Hälfte meiner Nodes nicht nutzen.

    Das Problem hatte ich auch vor zwei Monaten. Ich habe kurzen Prozess gemacht und den Notfallsupport angerufen. Eine Stunde später lief’s wieder und ich musste auch keinen Cent zahlen.

    Dieses Gebäude hat mir die Vorfahrt genommen! *hup*

  • Heute bekam ich Rückmeldung vom Support, dass sie in den letzten beiden Tagen die VLAN Infrastruktur gewartet haben und dabei das Problem behoben haben sollten. Dem ist auch so, ich kann meine Server wieder nutzen.

  • Hi guys, hoping someone here can shed some light on a strange network issue that popped up recently.


    my setup with several servers (opnsense and Debian 12) has been running flawlessly for over a year. But since yesterday, I started getting massive, random packet loss, but only on the internal Cloud VLAN. My administrative SSH sessions (which run over the VLAN) are dropping constantly. More critically, my web apps are timing out with Cloudflare 522 errors. This happens because all incoming traffic is routed from my opnsense through this unstable internal VLAN to reach the backend servers. I specifically chose the 2.5 Gbit VLAN to handle this exact mix of client traffic, internal server-to-server communication, and log shipping,etc,

    Interestingly, the public interfaces on the servers are completely stable if I connect to them directly, bypassing the VLAN. The problem is definitely isolated to the internal network.


    Here's what my tests are showing:


    - Running mtr between two VMs on the VLAN shows packet loss spiking to over 30%. On a VLAN, I'd expect this to be zero. ^^

    - My iperf3 tests show a weird performance issue. Even though my Cloud VLAN is 2.5Gbit, any traffic to my OPNsense gets throttled to just under 1 Gbit. A test between two Debian hits the full 2.5Gbit, but with thousands of TCP retransmissions, which confirms the underlying packet loss.

    - The packet loss is so bad that even basic ARP requests are failing. I'm seeing <incomplete> entries in my ARP table when one tries to find another on the same VLAN, which should never happen.


    All servers are in the Manassas and use the recommended virtio network driver on VLAN....

    The issue occurs between both opnsense and debian servers. I've already tried disabling all hardware offloading (TSO, LRO, etc.) inside the servers, but it didn't help. at this point, At this point, I'm running out of ideas on my end and starting to suspect an issue with the specific host I'm on, which makes me suspect the issue is in the underlying L2 network....


    Has anyone else run into something like this, especially in Manassas ?


    Any thoughts on what else I could check would be amazing.

    Thanks in advance for any help :thumbup:

  • I've already opened a support ticket and sent the logs taken in "Rescue System" mode, and the problems persist when testing connections between three servers on the same network.


    The connection is unstable, suffers from thousands of TCP retransmissions, and freezes completely for long periods during the test.

    I'll now await the next steps; my network is down, awaiting a solution from them.


    thanks for the feedback ;)

    "Face life on your feet, not on your knees."