Posts by sla

    And what about today's tests? Awaiting the results...

    Sorry I was busy the last few days.


    The single-core score fluctuates by about 4000 points during the day, the multi-core score by about 8000 points. But the disk is now "stable".

    Werte von heute, beides RS 16000. Kein Steal und beide im Idle (Installiertes OS, mehr nicht):


    Entweder hatte ich in dem Moment Glück oder es tut sich wirklich was. Allerdings noch keine Bewegung im Ticket. Wenn das in der Geschwindigkeit so weiter geht, haben wir Ende der Woche endlich wieder den alten Stand erreicht.

    Ich würde ja jetzt sagen schön das ich nicht alleine bin, so traurig die Situation auch gerade ist. Dennoch kann es nicht sein, dass ein RS 16000 G12 mit einem VPS gleichzieht. Sorry dann braucht man auch keine 140€/Monat ausgeben. Es ist ja nicht das erste Mal, dieser Thread lebt zum zweiten Mal mit gleichem Fehlerbild auf, langsam wirds peinlich

    Ich lass mal was von heute da.

    Eine Reaktion vom Support vor dem Wochenende:


    Quote from netcup Support

    vielen Dank für Ihre Anfrage und Geduld.


    Die zuständigen Kollegen sind aktuell dabei, den Sachverhalt gründlich zu untersuchen. Ich bitte noch um ein wenig Geduld. Wir melden uns bei Ihnen, sobald wir Neuigkeiten haben. Danke für Ihr Verständnis.

    Bin gespannt wie lange die Analyse dauert, Ticket liegt seit 6 Werktagen in der Fachabteilung.


    Edit: Den YABS von heute vergessen

    Du hast ja jetzt keinen 17 Euro Server gemietet, sondern wenn man das so nennen kann, die Premium Ausführung.


    Da sollte Netcup zumindest ein gewisses Verhältnis waren. Sonst wäre es tatsächlich Unsinn einen so treuen vServer zu mieten. Da bist Du mit kleineren vServern besser dran.

    Sehe ich genauso, dass sich die Werte von Bereitstellung bis heute etwas "beruhigen" ist normal, aber in dem Umfang finde ich das nicht okay.


    Es geht ja schon mit der Bereitstellung los: 24 Sockets a 1 Core, so wurde mein G12 per Default ausgeliefert. Das habe ich natürlich geändert auf 1 Socket a 24 Core. Die Block Size der virtuellen Festplatten ist auch bei 512, bei NVMe würde 4096 mehr Sinn machen. KVM kann das auch, warum es netcup nicht macht ist mir ein Rätsel. All das drückt halt auf die Performance der Server. Gerade die Blocksize ärgert mich, es gibt doch Linux legacy als Optimierung im SCP, wer 512 will soll das nutzen und "Linux" reicht den Datenträger dann mit 4096 passend für NVMe in die VM durch. Das spart bei der Menge VM's jede Menge unnötige Alignmentkorrekturen und Read-Modify-Write Zyklen.

    Das dachte ich mir, wobei Kerne vermutlich keine Kerne sind. Ich denke das dürfte das Problem sein das sla hat. Neue CPUs, bedeutet mehr Kerne/Threads = mehr VMs, die sich alle neben der CPU jetzt auch die Bandbreite teilen müssen. Im vergleich zu den älteren CPUs war es ja so, das weniger Kerne/Threads vorhanden waren, was bedeutet, das weniger VMs, auf einen Host passten und die Bandbreite zum Datenträger durch weniger VMs aufgeteilt werden muss.


    Was ja bedeutet, das zumindest in Bezug auf die Bandbreite zum Datenträger die Performance besser ist.

    Dem mag ich so nicht zustimmen, ich beobachte die Probleme über alle Servergenerationen hinweg: 9, 9.5, 11 und jetzt 12. Es bricht überall ein, was für mich auf eine Fehlkonfiguration oder ein massives Überbuchen (auch bei RS) schließen lässt.


    Edit: Felix spricht hier aber von Kernen und nicht von Threads. Sofern keine Änderung erfolgt ist, dürfte das die SMT Theorie entkräften.

    Wenn dem so ist, würden mir gleich mehrere Dinge sauer aufstoßen:


    1. Leistungseinschränkung ohne Mitteilung (Lars und co. wurden von mir hier markiert, bis heute schweigen. Support ebenfalls)

    2. Leistungseinschränkung ohne Zustimmung (sowas ergibt ein Sonderkündigungsrecht)

    3. Irreführendes Marketing mit dedizierten Kernen, das würde ich als Konkurrent schon zur Anzeige bringen – das schreit nach unlauterem Wettbewerb.

    4. Keine Dokumentation irgendwelcher Werte (garantierte IOPS, sofern das wirklich zutrifft)

    5. I don't care about my customers.


    Um dieses Performance-Thema ist es seitens netcup derart ruhig, fast schon verdächtig. Nicht mal ein "wir schauen uns das an" oder so. Einfach nichts. Als Kunde steht man hier wie der Ochs am Berg und weiß nicht ob man die Kiste kündigen soll, oder ob netcup das zeitnah in den Griff bekommt. Zahlen darf man aber brav weiter. Man könnte dem Anbieter jetzt natürlich unterstellen "Vertrag ist ja auf Laufzeit abgeschlossen, juckt mich nicht, Kohle fließt". Es passt aber, muss man leider sagen, ins Bild von netcup. Man erinnere sich mal zurück ans neue Traffic-Limit, Klagen von uns Nutzern, öffentliche Reaktion: keine. Selbst Bestandsserver, die anders verkauft wurden, wurden angepasst. Auch das dürfte eigentlich ein Sonderkündigungsrecht nach sich ziehen mit proaktiver Information des Anbieters, da sich ja das Produkt verändert/zum Nachteil des Kunden verschlechtert hat.


    Man ist mit Problemen dieser Art halt einfach ausgeliefert. Als Kunde kannst du nicht mehr machen als zu dokumentieren das deiner Büchse regelmäßig oder dauerhaft die Performance wegbricht. Man kann ja nicht mal eben auf den Hypervisor und das selbst checken, wenn dem so wäre, hätte netcup ein richtiges Problem. Selbst wenn man nach den Regeln des Hauses spielt (Rettungssystem, verschiedene Tageszeiten usw.) quält man sich durch den Support, bis das Ticket in der Fachabteilung liegt. Da liegt es jetzt schon ’ne Weile ohne Reaktion (gemacht wurde auch nichts, zumindest nicht laut meines Monitorings). Hat netcup keinen KVM-Guy mehr? Ist die "Fachabteilung" maßlos überfrachtet? Das alles wäre Organisationsversagen, all diese Sachen kann man regulieren, wenn man nur will. Der Rest wäre ein Kommunikationsproblem, dass es dringend zu fixen gilt.


    Ich weiß nicht was ich von netcup halten soll, aber das was man öffentlich sieht: Zu alte Prozesse bei zu schnellem Wachstum gepaart mit massivem Personalmangel. Das bricht dir halt irgendwann das Genick. Über all den Mist könnte man ja hinwegsehen, wenn die Qualität der Produkte stimmen würde und das tut sie aktuell nicht.


    Warum bekommt es ein Hetzna hin (sogar im First Level mit qualifiziertem Personal) aber netcup nicht. Das muss ja einen Grund haben und da ist ein Geschäftsführer in der Pflicht (sofern er Interesse an seinem Unternehmen hat) drüber nachzudenken und es zu regulieren. Alles andere schadet der Reputation.


    Ich werde hier und an den Support meine Werte weiter dokumentieren, in der Hoffnung, dass ein potenzieller Neukunde diesen Thread findet und diesem zermürbenden Horror entgeht. Aktuell kann ich netcup keinesfalls empfehlen.

    Da wir ja schon bei stille Nacht waren:


    Drinnen vom Rechenzentrum, da komm ich her,

    ich muss euch sagen: die Performance schmerzt mich sehr.

    Dedizierte Kerne? Ach kaum.

    Von 24 Kernen bleibt nur ein Traum.


    Ich tipp dd doch nix passiert,

    die SSD schreit, die CPU kollabiert.

    Einst lief der EPYC wie auf Koks,

    jetzt zieht er lahm, als wär er doof.


    Die Benchmarks jammern, IOPS tanzen wild,

    vom stolzen RS nur noch ein Bild.

    Einst flog er durch Geekbench wie ein Speer,

    jetzt schleicht er wie ’n Pi mit leerem Cache daher.


    Der IOPS-Gott hat mich verlacht,

    mein RS röchelt, nicht nur bei Nacht.

    Die Nachbarn glühen, ich steh’ im Stau,

    im KVM-Queue, ganz genau.


    Ich ruf den Support, doch der bleibt stumm,

    ich weiß kein Weg drumherum.

    Besserung ist nicht in Sicht,

    meine Datenbanken üben sich in Verzicht.


    Frustriert bleibe ich zurück,

    dabei war die G12 doch mein Weg zum Glück.

    Drum lehnt euch zurück und nehmt euch in Acht:

    bei netcup hat die Drossel aktuell sehr viel Macht.


    Unser täglich YABS gib uns heute, Disk noch schlechter als gestern und der Support ghostet mich/mein Ticket. Bald kann ich auf ’nem Lochstreifen hosten, die Datenbanken freuen sich …


    Autsch. Es wird schlimmer statt besser. Im Multi-Core das erste mal vier- statt fünfstellig

    EDIT: Immer noch ein RS 16000 G12


    Neuer Tiefpunkt erreicht:

    Steal bei 0,0

    Entweder tut sich was im Hintergrund oder es ist Zufall aber meine Werte gehen leicht nach oben:

    Die Schlussfolgerung halte ich so nicht für richtig. Der Unterschied bei den Benchmarks zeigt zwar, dass die CPU-Leistung schwankt aber das beweist noch nicht, dass die Kerne geteilt sind. Ein niedrigerer Single-Core-Wert kann auch durch CPU Skalierung oder andere Last auf dem Host entstehen. Ein RS hat laut Produktbeschreibung dedizierte Kerne. Wenn die Performance schwankt, liegt das also eher an allgemeiner Systemlast oder an der I/O-Schicht, nicht an fehlendem Core-Pinning. Dass die I/O-Werte parallel zum Geekbench fallen, passt zwar ins Bild, beweist aber nichts über die tatsächliche CPU Zuteilung.


    Echtes Blech mag hier die Lösung sein, allerdings hat es Gründe warum Leute einen RS statt Blech buchen. Hier hat der Anbieter ein Problem, den Anbieter und das Produkt zu wechseln löst das Problem zwar für mich, ist aber mit vermeidbarem Aufwand verbunden.

    Wow, performance dropped between 40% and 60%. Quite a big one.


    Performance loss is normally expected, but this was a really big performance loss. :huh:


    Send them the evidence in the ticket and send them the forum link as well for them to monitor.

    After observing this on multiple servers, the pattern is clear: the bigger the machine, the greater the performance loss.


    I haven’t opened a support ticket for the G12 server; I’m waiting for a public statement. [netcup] Sarah G.  [netcup] Lars S.

    But all my servers are affected: G9.5, G11 and G12, all of them RS with dedicated resources. It hits me hard since it not only slows down my database queries, but also reduces the number of requests that can be processed, simply because each one takes longer.


    Why should we flood support with tickets, a complete waste of time in the rescue system with downtime and copy-paste responses, when it hasn’t helped any of us anyway? Only the pressure from this public thread made netcup react, and while it briefly improved afterwards, performance has never returned to its original level.


    I even outlined an analysis approach earlier in the thread, for free and as a customer, which is quite ironic. It only needs to be implemented by netcup.

    Ich habe gerade mal wieder ge-yabs-t und wohl einen guten Moment erwischt. RS 16000 G12: