Hallo,
in den letzten 3 Monaten kommt es bei meinem vServer zu vermehrten Ausfällen. Insgesamt 7 ungewollte Neustarts in den letzten 3 Monaten. Das Problem sind nicht die Neustarts selbst, sondern, dass mein vServer danach nicht mehr erreichbar ist.
Folgendes Phänomen: Der vServer lässt sich auf keinem Port mehr erreichen, also weder ssh, www oder smtp. Das OpenVCP control panel zeigt jedoch an, dass er "online" sei, mit einer uptime die der Zeit seit dem ich den Server letztmalig erreichen konnte (typischerweise 4 bis 5 Uhr nachts, ermittelt durch die letzte vom Server gesendete statusmail) entspricht.
Wenn ich dann im control panel auf "Neustart" klicke passiert gar nichts, d.h. ich bekomme keine Nachricht von OpenVCP ob der Neustart erfolgreich war (was er natürlich nicht war) und der Browser wartet vergebens auf weitere Daten vom Server. Ein einziges mal bekam ich folgende Meldung:
initctl: Unable to connect to Upstart: Failed to connect to socket
/com/ubuntu/upstart: Connection refused
An error occured after executing the vserver startup sequence. This
means that some processes may exist in the created context and the
manual execution of
/usr/sbin/vserver '/etc/vservers/v################' stop
is recommended to fix this.
Alles anzeigen
Das einzige was half ist das Rettungsystem im control panel zu aktivieren, dort NICHTS machen, und dann wieder zurück gehen. Voilà. Typischerweise bemerke ich den Ausfall erst nach ein paar Tagen, in der der Server nicht erreichbar ist. Da der Server unter anderem Mails weiterleiten soll, ist solch ein Ausfall äußerst unschön.
Diesen Zustand konnte ich bisher nicht selbst auslösen. Ein Neustart im control panel als auch ein reboot auf der Kommandozeile funktionieren ganz normal. Für mich ist es also ein Problem welches sich meiner Kontrolle entzieht. Es scheint so, dass der Host den "init"-Prozess (hier: upstart) nicht startet, nachdem der Host selbst hochgefahren ist.
Der Support von Netcup behauptet "ist dies in der
Regel auf fehlerhafte Konfigurationen innerhalb des vServers zurück zu führen". Ich verwende das von Netcup bereitgestellte Image "Ubuntu 10.04 LTS amd64" ohne etwas an der Konfiguration von upstart geändert zu haben, noch habe ich ein init-script (bzw. /etc/init/*.conf) manuell bearbeitet.
Sollte es wirklich keine meine Änderungen sein, so müssten weitere Kunden davon betroffen sein. Hat hier jemand Erfahrung dazu? Oder eine Vermutung, woran es liegen könnte und wie ich (oder Netcup) es beheben kann?
Details zum System:
# uname -a
Linux v###############.yourvserver.net 2.6.33.2-vs2.3.0.36.30.4-netcup #5 SMP Fri Apr 16 06:34:48 UTC 2010 x86_64 GNU/Linux
# dpkg -s upstart | grep Version
Version: 0.6.5-7
Gruß und schöne Weihnachten,
Meinersbur