Ich möchte das ganze im Rahmen einer grafischen Simulation nutzen, Shader werden also bereits verwendet.
Es würde daher den Overhead erheblich reduzieren, wenn ich nicht noch extra Cuda oder ähnliches einbinden müsste.
Die Umgebung der des Programms sieht so aus:
Darstellung über die beschreibende Sprache x3d (leider Vorgabe),
Shader werden in der x3d Umgebung aufgerufen, Vertex-, Geometry- und Fragmentshader sind möglich, als Sprache kann glsl, cg und hlsl genutz werden.
Alle weiteren Berechnungen müssen über Script, also Javascript oder Java-Klasse implementiert werden.
Im Moment benutze ich JTransform als Java Klasse, also eine reine CPU basierte Lösung.
Die erstellte FFT wird nicht mehr verändert, sondern direkt als Texture an meinen Vertex Shader übergeben, falls das irgendwie helfen sollte.
Falls das ganze im Shader nicht so einfach möglich ist, bin ich für alle anderen Lösungsansätze natürlich auch sehr dankbar!