Guten Tag.
Ich habe am Black Friday einen RS 4000 SSDx4 G8SE BF19 bestellt. Mittlerweile ist der Server schon seit fast 2 Wochen fester Bestandteil meines Kubernetes Clusters. Ich habe die Node wie alle anderen auch mit dem CentOS 7 Image aufgesetzt und danach mein Installation-Script ausgeführt. Schlussendlich wurde der RS in meinen Cluster integriert. Alles schien Problemlos zu laufen. Nun habe ich aber im laufe von rund einer Woche einige Abstürze festgestellt. Ich verwende das Monitoring-Tool Grafana. Ich prüfe die Uptime nun rund 2 mal täglich und stelle fest das die Uptime immer so zwischen 4 und 12 Stunden liegt, während die Uptime meiner übrigen Nodes bei mehreren Wochen liegt..
Meine Frage ist nun, wie finde ich die Absturzursache heraus?
Wie man hier auch sieht, ist der Server nicht übermäßig ausgelastet. Außerdem habe ich den Uptime Wert mit der Ausgabe des Befehls "uptime" abgeglichen. Die Ergebnisse sind nahezu identisch.
Ich hoffe es kann mir jemand helfen.
Vielen Dank
Lg