Failover-IPv4 für Failover nutzlos?

  • Hallo Forum,


    ich nutze jetzt seit einiger Zeit eine Failover-IPv4 Adresse für einen Cluster um im Falle eines Ausfalls den Dienst weiterhin verfügbar zu haben. Im Konkreten nutze ich es für meinen Mail-Cluster. Dies habe ich mit Hilfe von Keepalived + einem Skript zum Routing der IP Adresse gelöst (dank Tipps hier aus dem Forum).


    Jetzt habe ich nur in den letzten Monaten festgestellt, dass diese Szenario so leider nicht funktioniert. Wenn die IPv4 Adresse auf einen Server geroutet ist und der darunter liegende Host ausfällt, lässt sich die IPv4 Adresse nicht mehr von dem Server lösen. Weder über das SOAP Protokoll noch über das Web-Interface (Es erscheint nur eine Fehlermeldung ohne Details). Nachdem der Host dann wieder da ist und der Server wieder läuft, scheint zudem das Routing der Failover IP kaputt zu sein. Hier hilft es nur, wenn man das Routing der IP manuell im Web Interface löscht und neu anlegt.


    Das ist in den letzten Monaten leider ein paar Mal passiert. Die Ausfälle waren nicht weiter tragisch, es macht nur meine Idee des HA-Clusters ziemlich nutzlos.


    Mich würde daher an dieser Stelle mal interessieren, wie ihr die Failover IP nutzt. Habt ihr vielleicht andere HA Lösungen? Weil im Grunde könnte ich sie mir auch sparen, wenn im Failover Fall die IP nicht mehr geroutet werden kann.


    Darüberhinaus dauert ein Ändern des Routings immer so 30 Sekunden. Mal etwas mehr, mal weniger. Ist das normal?


    Gruss
    Paul

  • Mich würde daher an dieser Stelle mal interessieren, wie ihr die Failover IP nutzt.


    Ich kann dazu leider keine Antwort liefern, mir jedoch vorstellen dass die Failover-IP auch für das Szenario eines Anwendungsfehlers genutzt wird und dann umgeleitet wird. Nicht erst wenn die VM steht. Aber ja auch da stehe ich voll hinter dir, das sollte auch so, wenn der Host Probleme macht umgezogen werden können.

  • Diese Problematik wurde im Forum schon mehrmals geschildert und damals wurde laut netcup ein Bug behoben, wodurch es nicht mehr auftreten sollte. Leider finde ich den Thread gerade nicht mehr. Ich würde das aber einmal beim Support melden, wenn es immer noch auftritt. Das ist kein gewünschter Zustand.


    Dass die Änderung des Routings etwas dauert ist meiner Meinung nach normal.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Failover-IP umschwenken im Fehlerfall


    Vielen Dank für den Link. Da ich meist unangemeldet im Forum unterwegs bin, habe ich ihn im internen Bereich bisher noch nicht gesehen. Das Verhalten beschreibt meine Beobachtung sehr gut.


    Der letzte Ausfall war übrigens gestern abend. Ich kann nicht 100% ausschließen, ob es da nicht über das Web-Interface funktioniert hätte. Ich kann nur mit Sicherheit sagen, dass ein Schwenk der IP über das SOAP Skript nicht funktioniert hat. Mein Monitoring hat mich dann informiert, dass sowohl die Services als auch Ping auf die Failover IP nicht mehr funktioniert haben. Als der Server wieder online war, auch aber wie in der Vergangenheit das Routing nicht mehr Ok und musste manuell über das SCP korrigiert werden.


    Vielleicht schreibe ich dem Support wirklich nochmal eine kurze Mail mit der Info, dass es wohl immer noch Probleme gibt.



    Dass die Änderung des Routings etwas dauert ist meiner Meinung nach normal.


    Danke für die Bestätigung. Ich war immer etwa irritiert, weil es so lange gedauert hat und dies bei kleinen Wacklern zu Problemen geführt hat, weil die IP schon wieder auf dem anderen Server war, das Skript aber immer noch lief und so erneut getriggert wurde (auf dem anderen Server).