Intel NUC: Ursache für Absturz?

  • Ich poste das einmal hier, vielleicht hat jemand noch weitere Ideen, an die ich nicht gedacht habe… :)


    Ich betreibe einen Intel NUC im Dauerbetrieb als Server ohne angehängtem Bildschirm. Das Ding läuft seit rund einem ¾ Jahr problemlos. Gestern ist mir im Vorbeigehen plötzlich aufgefallen, dass die Netzwerk-LEDs nicht mehr leuchten und das Gerät absolut kühl ist. Nach kurzer Überprüfung war klar: Das Gerät läuft nicht mehr, einfach ausgeschaltet. In den Logs war nichts sinnvolles zu finden, es wurde also nicht sauber herunter gefahren. Ich bin nur so schlau, dass es um xx:50 noch lief, und um xx:55 nicht mehr. Kurze Zeit später ist es mir eh schon aufgefallen. Ich habe dann die Power-Taste gedrückt und es ist anstandslos wieder hoch gefahren. Das Dateisystem hat sich leicht beschwert, aber ansonsten keine besonderen Defekte – es läuft wieder seit fast 24 Stunden. Gut, was war die Ursache dafür?


    • Kernel Panic? Würde ich ausschließen, da das Gerät offensichtlich ausgeschaltet war. Sonst hätte es ja noch laufen müssen.
    • Manuell abgeschaltet? Kann ich ausschließen, weil in den Logs nichts steht. Und physikalischen Zugriff zu dem Zeitpunkt gab es keinen.
    • Notabschaltung wegen Überhitzung? Wäre möglich, dagegen spricht nur, dass der Temperatur-Verlauf laut Monitoring absolut stabil war.
    • Defekter Arbeitsspeicher? Wäre denkbar, könnte sicherlich zu so einem Absturz führen. Memory-Test muss ich erst durchlaufen lassen.
    • Spannungsproblemel? Kann ich aktuell nicht ausschließen. Vorher und nachher lief zwar alles weiter, aber wer weiß…


    Fällt euch sonst noch eine mögliche Ursache ein? Natürlich könnte auch irgendeine andere Komponente am Mainboard verrückt gespielt haben.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Denke mal die Notschaltung solle im BIOS "vermerkt" sein.
    Zu mindeste bei den meisten Intel Boards die mir bisher unter die Finger gekommen sind.
    Ich würde eher tippen das die Spannungsversorgung kurzzeitig instabil war.
    Es kann natürlich auch eine Macke am Steuerchip sein, der das Bord einschaltet.(PW:ON Signal weg etc)

  • Denke mal die Notschaltung solle im BIOS "vermerkt" sein.


    Bei den abgespeckten Dingern? Wäre mir zumindestens noch keine Möglichkeit aufgefallen! :D


    Ich würde eher tippen das die Spannungsversorgung kurzzeitig instabil war.


    Andere Geräte liefen einwandfrei weiter, ich würde daher eher auf die Niedervolt-Spannung aus dem Netzteil oder innerhalb des NUC tippen.


    Es kann natürlich auch eine Macke am Steuerchip sein, der das Bord einschaltet.(PW:ON Signal weg etc)


    Ich habe sogar schon von NAS gehört, bei denen angeblich die Power-Taste gehängt ist und die Geräte bei Temperaturschwankungen ausgeschaltet hat. Was es nicht alles gibt… 8|



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Und es passierte heute Abend wieder. Dieses Mal hat es aber noch für lauter ^@ Meldungen im Syslog (vom Host und allen Gästen) gereicht. Allerdings gab es heute (einige Stunden später) auch schon mindestens einmal eine Stromschwankung oder gar einen kurzen Stromausfall von mindestens einer Sekunde. Von daher würde mich nichts mehr wundern…



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Nein, im Moment leider nicht. Normalerweise ist die Stromversorgung hier auch extrem stabil. In den letzten ~20 Jahren gab es keinen einzigen ungeplanten oder nicht selbst verursachten Stromausfall. Nicht einmal bei der Hitzewelle mit über 40 Grad vor zwei Jahren gab es Probleme. Das scheint diesen Sommer erstmals anders zu sein.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Das Problem trat seit damals übrigens nicht mehr auf. Ich tippe mittlerweile ebenfalls ausschließlich auf ein Problem mit der städtischen Stromversorgung mit Mikro-Ausfällen von <1s während der Hitzeperioden, die dieses Netzteil offenbar nicht erfolgreich überbrücken konnte. Andere Geräte liefen da ja nachweislich weiter, verbrauchen aber auch deutlich weniger Strom.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)