Nach mehreren Tagen Ruhe gab es jetzt wieder Probleme. Sowohl das externe Monitoring schlug an als auch der interne Verkehr zwischen zwei vServern auf unterschiedlichen Hosts stockte. Zuerst zum externen Monitoring:
22.06.2017 01:55:02 Socket timeout after 11 seconds von 212.72.183.125 (Hamburg)
22.06.2017 01:56:02 Socket timeout after 11 seconds von 193.164.132.46 (München)
22.06.2017 01:57:02 Socket timeout after 11 seconds von 5.83.128.154 (Frankfurt)
Um 1:58 kommen wieder Anfragen durch und werden im syslog protokolliert; zwischen 1:55 und 1:58 gibt es im syslog keine Einträge.
Ähnliches spielt sich um 22.06.2017 02:10:02 ab. Um 2:10:53 gibt es im syslog einen Eintrag der FW, danach ist für 2min Stille.
Dann um 22.06.2017 02:55:02 für drei Minuten. In der Zeit wurde eine Mail von einem anderen vServer bei NC entgegengenommen, die FW wies Anfragen an die Ports 22 und 23 zurück. Rechner und Netzwerk müssen da eigentlich oben gewesen sein.
22.06.2017 05:04:02 - nichts besonderes im logfile; cron-jobs werden abgearbeitet
22.06.2017 08:25:02 - nichts besonderes im logfile; cron-jobs werden abgearbeitet
Jetzt die missglückten Munin Abfragen zu dem anderen vserver auf einem anderen host:
00:25
00:35
01:05
01:55 da klemmte auch das ext Mon
02:10
02:35
02:40
02:50
02:55
04:00
04:10
05:05
....
08:25 letzter Fehler für heute
Wie schon weiter oben beschrieben treten die Fehler während eins laufenden MTR (zwischen den vServern oder einem PC und dem Server) nicht auf. Bei wenig Auslastung scheint irgendein Prozess im Swap zu landen - aber welcher und wo? Könnte nicht auch der Host an dem Dilemma beteiligt sein?
Es widerstrebt mir auch den Rechner permanent zu beschäftigen, nur damit das Problem nicht auftritt.