I/O error: hostbyte=DID_TIME_OUT

  • Neulich auf meinem KVM-Server, als er fast nichts zu tun hatte:



    Sollte ich mir Gedanken machen, wenn ich solche Fehler innerhalb meiner Instanz sehe? Hatte das schon einmal jemand bei netcup oder woanders?


    Edit: Im Monitoring taucht der kurze Ausreißer ebenfalls auf.


    diskstats_latency-pinpoint=1476136800,1476223200.png


    Ticket beim Support ist offen, mal schauen, ob die es sich erklären können.


    Edit: Laut netcup ist am Node alles in Ordnung.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Tja, war kein Einzelfall:


    Code
    Oct 21 06:55:35 vmx kernel: [1421616.804055] sd 0:0:0:0: [sda] abort
    Oct 21 06:57:07 vmx kernel: [1421708.887433] sd 0:0:0:0: [sda] Unhandled error code
    Oct 21 06:57:07 vmx kernel: [1421708.887445] sd 0:0:0:0: [sda]  
    Oct 21 06:57:07 vmx kernel: [1421708.887452] sd 0:0:0:0: [sda] CDB: 
    Oct 21 06:57:07 vmx kernel: [1421708.887467] end_request: I/O error, dev sda, sector 83677168
    Oct 21 06:57:07 vmx kernel: [1421708.888248] sd 0:0:0:0: [sda] abort
    Oct 21 06:57:07 vmx kernel: [1421708.888536] EXT4-fs (sda3): discard request in group:140 block:12542 count:2039 failed with -5
    Oct 21 06:57:07 vmx kernel: [1421708.902367] sd 0:0:0:0: [sda] abort



    In beiden Fällen zeigt auch das Monitoring interessante Werte an:


    diskstats_latency-pinpoint=1476990000,1477378800.png


    Ich habe jetzt einmal das Online-Discard für alle Partitionen deaktiviert und werde es weiter beobachten.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Hallo Oli,


    Danke für Deinen Beitrag! Das habe ich irgendwann auch schon gehört.


    Bis zu meinem Beitrag vom 26.10. war es die Mountoption. Danach habe ich es gar nicht mehr ausgeführt, auch nicht als Cronjob. Außer in den eigenen Gastsystemen, die teilen es KVM noch in Echtzeit mit, wenn Blöcke frei werden. Ich denke mir, dort ist es eher egal?


    Zu Hause nutze ich die Mountoption neben VMs bisher noch bei zwei SSD: Im PC und am NUC-Serverchen. Dort hatte ich allerdings noch keine Performance-Einbußen. Die I/O-Last ist aber auch nicht mit einem Node von netcup vergleichbar.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Seit 25. Oktober gab es übrigens keine besonderen Vorkommnisse mehr. Das Monitoring schlägt selten zwar noch minimal aus, aber der Kernel hat nichts zu meckern. Dürfte also wirklich am Online-Discard gelegen haben. In den eigenen Gastsystemen ist es derzeit noch aktiv, dort nehme ich erst nach weitereren Beobachtungen Änderungen vor.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)

  • Nachdem jetzt längere Zeit absolute Ruhe war, ist mir eine VM vorhin wieder eingefroren. 100% CPU-Last, nichts ging mehr. Im VNC-Bildschirm war außer einem nicht dazu gehörenden [-Zeichen nur ein Teil vom nicht mehr bedienbaren Loginbildschirm zu sehen. Am Hostsystem war (außer der gestiegenen Last) nichts zu bemerken, auch nichts im Kernellog und keine Ausreißer bei der HDD-Latenz.



    MfG Christian

    "Wer nur noch Enten sieht, hat die Kontrolle über seine Server verloren." (Netzentenfund)