Vielen Dank für die Gedankenanstöße.
Ich habe in einem ersten Versuch einmal node.js über mehrere Cluster via pm2 gestartet, und auch "worker_threads" auf die besagte Funktion angewendet, sodass ein Objekt mit bspw. 1600 Einträgen entsprechend der Kerne in "Chunks" aufgeteilt wird. Grundsätzlich müsste das Szenario passen, da keine I/O-Operation vorliegt und node.js die Rechenleistung benötigt, um das Decrypting und ein paar tatsächliche Berechnungen auf diesen Objekten durchzuführen.
Im ersten Ergebnis war die Performance leider schlechter als im "fork"-Mode und ohne "worker_threads". Dennoch könnte das der richtige Weg sein – vorausgesetzt einer korrekten Anwendung, an der es vermutlich scheitert!
Auf "Bun" werde ich auch mal einen Blick werfen.
Gruß