Rückmeldung:
Läuft wesentlich stabiler, leider weiterhin jedoch nicht ohne kleinere Störungen, wonach die Failover IP auf dem falschen Host landet und ein Zugriff nicht mehr möglich ist.
Daher teste ich jetzt folgendes Szenario
- Umschaltung weiterhin über keepalived notify master script
(Für sich alleine problematisch, siehe Erklärung unten) - Cron Job der jede Minute prüft
- Bin ich der MASTER laut keepalived
- Wenn ja, frage über die SOAP Schnittstelle ns1:getVServerIPs ob Netcup das genauso sieht
- Wenn nein, sorge über die SOAP Schnitstelle ns1:changeIPRouting dass sich das ändert
Downtimes / Nicht Erreichbarkeit von 1 Minute kann ich akzeptieren.
Ich beobachte weiter. Es scheint als scheinen die Zeiten mit den Hängern genau die zu sein wo Datenbank Backups, externe Backups, etc. laufen
Es ist jedoch IMMER zu sehen, dass nach 1-2 Sekunden (manchmal sogar innnerhalb der selben Sekunde) wieder geswitcht wird. z.B.
===================================
Date: 12-Dec-2022 23:20:08
[INFO] Now Master
===================================
Date: 12-Dec-2022 23:20:08
[INFO] Now Backup
Problem ist, dass auf dem eigentlichen Master um 23:20:08 keine Änderung stattfand. Der o.g. Server machte sich also zum Master, was der eigentliche Master aber nicht mitbekam. Daher klappt natürlich auch die Umschaltung per SOAP API nicht mehr zurück auf den eigentlichen Master, da sie nie ausgeführt wurde.
Für den Master sah der letzte Eintrag nämlich so aus (10 Uhr ist wirklich 10 Uhr AM - 24 Format wurde geprüft)