Servus. Ich betreibe nebenbei auf einer dedizierten Maschine Proxmox mit KVM und hab in letzter Zeit seit Debian 10 regelmäßig Probleme mit allen Maschinen.
Ich versuche im Laufe des Tages noch weitere Infos zu liefern, da ich gerade im Zug sitze.
—
Auswirkung
Nach einiger Zeit läuft der RAM + SWAP voll und das System fährt mit 100% CPU Last weiter. Nach kurzem, langem Debuggen habe ich herausgefunden, dass es ein Memory Leak sein muss. Leider jedoch nicht von einer Software sondern direkt im Kernel.
Genauer gesagt ist der SLAB zu der Zeit mehrere GB groß. Ich kann es jedoch nicht auf einzelne Items einwchränken und komme an dem Punkt auch nicht mehr weiter.
—
Bisherige Vermutungen / Findings
Es gab im Linux Kernel wohl mal ein Problem mit den memory cgroups. Diese konnten nicht mehr beendet werden und verblieben lange in diesem Status. Ich konnte ähnliches jedoch nicht für Debian selbst finden, sondern nur für Ubuntu.
https://bugs.launchpad.net/bugs/1792349
Auch gab es mal im Raspbian Probleme mit dem inode_cache.
https://github.com/raspberrypi/linux/issues/2829
Ich habe dann in einem Blog einen möglichen Workarround gefunden, der bei mir jedoch leider nicht greift.
https://darkimmortal.com/debian-10-kernel-slab-memory-leak/
Da ich den Leak leider nicht auf einen einzigen Bereich zurückführen kann, bin ich jetzt ziemlich ratlos. Ballooning ist im Proxmox deaktiviert, ein Upgrade auf den 5er Kernel bringt ebenso nichts.
Ein System ist gerade wieder kurz vorm Crashen. Ich versuche nochmal den Output von slabtop zu erwischen.