05.05.2025, 20:12
(Dieser Beitrag wurde zuletzt bearbeitet: 05.05.2025, 20:13 von NewProggie.)
(05.05.2025, 19:53)HenneNWH schrieb: Das klingt spannend. Wie hast du denn die zweite Schleife vektorisiert, wenn ich fragen darf?
Entweder darauf vertrauen, dass der Compiler das selbst checkt, oder in meinem Fall über NEON instructions (speziell vld1_u8), weil ich auf einem M4 (ARM) Macbook unterwegs bin gerade.
Lass mich wissen, wenn du denkst, dass der Code soweit portiert ist und es Engstellen bei der Performance gibt. Da helfe ich gerne mit. Mein CMake Pull-Request auf GitHub dümpelt auch noch so vor sich hin und kann eigentlich gemerged werden ;-) Eine CI könnte ich auch auf GitHub schon mal aufsetzen für das Projekt.