Instabiler RS 2000 G7SE 15 years

  • Meine KVM Instanz ist ebenfalls zur exakt gleichen Zeit gecrashed wie die von S4Ne - und gerade eben wieder. Ca. 15:30 Uhr. Die logs geben nichts her. Einfach Reboot nach 10-15 Minuten "down."

  • Habe mal gerade nachgesehen... bei mir nicht. Äußerst merkwürdig.
    Wenn es bei mir nochmal vorkommt, mache ich ein Ticket auf. Bis dahin ist halt abwarten angesagt und hoffen, dass es nicht nochmal passiert.

  • Meine KVM Instanz ist ebenfalls zur exakt gleichen Zeit gecrashed wie die von S4Ne - und gerade eben wieder. Ca. 15:30 Uhr. Die logs geben nichts her. Einfach Reboot nach 10-15 Minuten "down."

    Also hat er sich bei Dir nicht von selbst erholt, war komplett weg und Du musstest über das SCP ein Reboot machen ?


    Was ist nur im Moment mit Netcup los ???

  • Guten Abend,



    bitte bei rcu_sched detected stalls an unseren Support mit einem Auszug von dmesg wenden. Dieser soll dann sicherstellen, dass auf dem Wirt alles in Ordnung ist.


    Bitte verweisen Sie auch auf diesen Beitrag.



    Vielen Dank!



    Mit freundlichen Grüßen


    Felix Preuß

  • Mein Server crashed regelmäßig - ohne jeglichen Eintrag in den Log Files.

    Ich stelle auch extrem schlechte bzw. extrem schwankende I/O Disk Performance fest, atop disk load geht bei 2MB/s Lese ODER Schreibgeschwindigkeit auf 100%.

    Manchmal schafft er aber 150MB/s (bei 100%). Ja, shared Platten etc. aber die Performance ist dann derartig schlecht, das selbst nano/pico mehrere Sekunden brauchen bis sie offen sind und der Server nicht mehr nutzbar. Die CPUs langweilen sich derweil...

  • Jetzt ist das Problem wieder aufgetreten. Mehrmals hintereinander. Ich werde ein Ticket aufmachen und berichten, was mir der Support so sagt.

    Das hier mehrere Kunden dieses Problem haben und sich von netcup aus nichts tut (zumindest berichtet keiner darüber), finde ich sehr schade. Dabei hatte ich überwiegend gute Erfahrungsberichte von Bekannten bekommen und bin deshalb zu netcup gewechselt.

    Mal sehen, wie es weitergeht...

  • Hallo,


    es wird von Netcup noch an dem Problem gearbeitet. Vermutlich aber mit
    niedriger Priorität.

    • Es wurde ein Bug im Raid-Controller gefunden. Leider war das nicht der Auslöser.
    • Einstellungen an meiner KVM geändert -> Stucks und Zeitsprünge gibt es nicht mehr, jedoch hängt der Server immer noch zur gleichen Zeit.

    Auf Nachfrage wurde mir am Mittwoch mitgeteilt, das es noch ein Verdacht gibt. Eine Rückmeldung sollte am Donnerstag erfolgen. Leider habe ich noch nichts gehört. Die Hänger gibt es noch.

  • Hallo,


    hier der aktuelle Stand (leider nichts neues)


    Zitat

    Wir sind weiterhin mit hoher Priorität an dem Problem dran, da es allerdings, wie Sie selbst wissen, meist nur alle 24h auftritt, dauern die Test hier leider etwas länger.


    Der Verdacht von letzter Woche hatte sich zumindest teilweise bestätigt und es laufen gerade mehrere Versuche auf einigen Test-Systemen. Da die Änderungen zur Behebung der Ursache unter Umständen auch andere unerwünschte Auswirkungen haben können, müssen wir diese auch einige Zeit beobachten.

    Frag mal beim Support noch, ob Sie die gleichen Einstellungen wie bei meinem RS 2000 vornehmen könnnen.

    Die vertragen sich aber nicht mit Online-Snapshots. Als Hinweis kannst Du ja meine Support-Ticketnr. NC#2018022510002521 angeben.


    Ich habe damit zumindest keine Kernel-Fehler und Zeitsprünge mehr.

  • Hallo SCD,


    ich habe mal nachgefragt. Auf meine Anfrage von vorhin kam auch direkt eine Mail zurück. Antwortzeit ist also wirklich super.


    Hoffen wir mal, dass sich bei den Tests was ergibt.

  • Jetzt hat es gerade wieder richtig geknallt. Der Server war für über 2 Minuten hirntot. Habe ihn produktiv im Einsatz, es stört echt sehr.


    Im Anhang wie immer der Log. Ich hoffe, hier lässt sich bald etwas drehen. Ticket ist raus, aber wohl durch Ostern noch unbeantwortet.


    By the way: Kann man hier im Forum nicht mal *.log als Anhang erlauben???

    Moin,


    spannend, zur gleichen Zeit hat es bei mir auch geraschelt: "CPU#0 stuck for 21s!". Bei mir tritt dieses Problem ca. alle 2-3 Tage seit dem 22. März auf. Email an den Support ist gerade unterwegs.


    (Noch) keine Ahnung, ob es damit zusammenhängt, aber der initiale Aufbau einer SSH-Session dauert generell ziemlich lange...


    Gruß Ralf

  • Zitat von reberling

    Bei mir tritt dieses Problem ca. alle 2-3 Tage seit dem 22. März auf.

    Ich hatte auch schon mehr als die hier geposteten Stalls, beschränke mich jetzt jedoch auf die Extremen.

    (Noch) keine Ahnung, ob es damit zusammenhängt, aber der initiale Aufbau einer SSH-Session dauert generell ziemlich lange...

    Das geht bei mir fix.


    Danke nochmal SCD, der Support hat in Windeseile die gleichen Anpassungen vorgenommen. Mal sehen, wie es nun läuft.

  • Meine Instanz ist gestern auch um 13:38:50 gecrashed...

    s4Ne war das auch deine Zeit ? (gem. Deinen Logs würde ich sagen ja da das Stall detected nur kurze Zeit später kommt.)

    Ich würde vermuten der Hosts hängt sich irgendwie auf. Interessant wäre es herauszubekommen ob wir auf dem gleichen Node sind.


    Leider stürzt meine Instanz nach wie vor alle 1-3 Tage ab, ich werde noch wahnsinnig.


    Der Support hatte das mit dem RAID-Controller auch bei mir schnell gefixed, seitdem stimmt I/O wieder.