CPU high threshold alert. Going in "overheat" mode

  • Hallo zusammen,

    ich habe auf unserem root-Server (RS 2000 G9 a1 6M) eine Docker-Installation, auf welcher workadventure und jitsi deployed werden. Beim docker-compose up bekomme ich immer die Meldung:


    CPU high threshold alert. Going in "overheat" mode


    und dann wieder

    CPU is back to normal. Canceling "overheat" mode

    .
    Wie kommt das zustande? Die CPUs sollten doch voll verfügbar sein?


    Das jitsi hat dann auch Verbindungsprobleme (selbst bei nur zwei Teilnehmern)...

    Im SCP sehe ich Ausschläge für die CPU-Last von je 60M Op/s pro CPU (einmal auch 200M Op/s). Ist das viel oder wenig?
    Bzw.: sollte schon bei 60M Op/s ein overheat auftreten?

    Danke schon Mal,
    Lyonel

  • 60M Op/s ist mäßig viel, das verbraucht mein RS8000G9 artiger Server fast permanent im Idle. Auch Ausschläge bis 200M und mehr sollten locker ok sein.


    Ich würde mich evtl nach htop check mit dem Support auseinandersetzen, evtl hat der Server ja ein Lüftungs- oder sonstiges Problem?

    RS Ostern L OST22 (~RS "3000" G9.5) (8C,24GB,960GB) | RS Cyber Quack (1C,2GB,40GB)

  • 60M Op/s ist mäßig viel, das verbraucht mein RS8000G9 artiger Server fast permanent im Idle. Auch Ausschläge bis 200M und mehr sollten locker ok sein.


    Ich würde mich evtl nach htop check mit dem Support auseinandersetzen, evtl hat der Server ja ein Lüftungs- oder sonstiges Problem?

    Ja, mein kleiner Rentier-RS mit 2 Intel Cores zeigt bei manchen stündlichen Cronjobs regelmäßig Ausschläge bis 350M OP/s. Ein Lüfterproblem könnte in deinem Fall durchaus die Ursache sein. Es ist schliesslich ein dedizierter Core.

  • Herzlichen Dank für die vielen Antworten!

    Wie stelle ich das mit dem htop am besten an? Gibt es da eine einfache "logging"-Möglichkeit? Es ist sonst nicht so einfach, da parallel eine session zu öffnen und dann im richtigen Augenblick auf den Terminal zu schauen ;-)...

    Merci,
    Lyonel

  • Dann schmeiss dir mal ein Monitoring drauf. In diesem Fall währe vielleicht netdata gut, da du Echtzeitdaten bekommst. Es kostet auch nicht viel Recourcen und hat Standardmäßig eine Stunde rückwirkend Daten im Speicher.

  • Wie stelle ich das mit dem htop am besten an? Gibt es da eine einfache "logging"-Möglichkeit? Es ist sonst nicht so einfach, da parallel eine session zu öffnen und dann im richtigen Augenblick auf den Terminal zu schauen ;-)...

    Öhm. Doch? Ist einfach? Einfach noch eine Putty Session parallel?

    RS Ostern L OST22 (~RS "3000" G9.5) (8C,24GB,960GB) | RS Cyber Quack (1C,2GB,40GB)

  • Einfach noch eine Putty Session parallel?

    oder tmux mit zwei panes ?‍♂️

    Oder gleich via Byobu

    Externer Inhalt youtu.be
    Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.
    Durch die Aktivierung der externen Inhalte erklären Sie sich damit einverstanden, dass personenbezogene Daten an Drittplattformen übermittelt werden. Mehr Informationen dazu haben wir in unserer Datenschutzerklärung zur Verfügung gestellt.

    VServer IOPS Comparison Sheet: https://docs.google.com/spreadsheets/d/1w38zM0Bwbd4VdDCQoi1buo2I-zpwg8e0wVzFGSPh3iE/edit?usp=sharing

  • ich habe auf unserem root-Server (RS 2000 G9 a1 6M) eine Docker-Installation, auf welcher workadventure und jitsi deployed werden. Beim docker-compose up bekomme ich immer die Meldung:


    CPU high threshold alert. Going in "overheat" mode

    Würde ich eher ignorieren.


    Der Overheat Mode ist eine Kreation von Workadventure im Code.


    Sieht für mich nach dem Versuch aus mit node.js seine Ressourcen verwalten zu wollen.


    Die erste Zeile deutet an, dass CPU_OVERHEAT_THRESHOLD eine Environment Variable ist, die du im Docker Compose File bearbeiten kannst.

    Die solltest du hoch setzen.

  • Danke für die vielen weiteren Hinweise!
    H6G: sehe ich das richtig, dass das dann eine Meldung ohne Konsequenz ist (also kein Drosseln der Leistung oder ähnliches)?

    Ich habe einen Tag nach dem Post übrigens festgestellt, dass die Op/s wieder hoch gingen (über 500 MOp/s) - könnte also wirklich ein (inzwischen behobener?) Hardwaredefekt gewesen sein...
    Würde das gerne genauer wissen :-(...

    Das mit dem parallelen top war halt problematisch, wenn man auf der Weboberfläche etwas bedienen muss und dann ggf. nicht im richtigen Augenblick htop im Blick hat - deshalb die Nachfrage ;-).

    Danke nochmals,
    lyonel

  • sehe ich das richtig, dass das dann eine Meldung ohne Konsequenz ist (also kein Drosseln der Leistung oder ähnliches)?

    Aus irgendeinem Grund werden die das eingebaut haben - aber ich habe keine Lust mir den Quelltext weiter anzusehen.

    Die Werte scheinen jedoch nicht mit der Hardware-Geometrie zu skalieren, deshalb musst du wohl selbst die Env Variablen setzen.


    Der Code an sich wirft bei mir viele Fragen auf.