Ich versuche mich mal an der Basis-Theorie:
Ein Klang oder ein Geräusch in einem Video oder einem Musikstück besteht immer aus ganz vielen Tönen. Die werden als SInus-Schwingung modelliert. Um einen Klang oder ein Geräusch in seine unterfrequenzen und Amplituden zu zerlegen, benötigt man
Fourier-Transformation. Wenn man ein Klang oder ein Geräusch in seine einzelnen Frequenzen zerlegt nennt man das Spektrumanalyse - gibts auch bei Licht - exakt das gleiche nur für elektromagnetische Wellen. Problem an der Fouriertransformation ist, dass sie keine feste genauigkeit besitzt - je nach benötigter Genauigkeit (also je mehr Schwingungen "zerlegt" werden) steigt der Rechenaufwand rapide an. Die Genauigkeitsspanne beginnt bei den Grundtönen (die machen die Tonlage aus), geht über diverse Oktavtöne (doppelte Frequenz der Grundschwingung) und endet bei den in der Realität praktisch unendlich vielen Obertönen (macht den Charakter und die Klangfarbe aus). Obertöne haben eine meist hohe Frequenz, deshalb muss der Algorithmus sehr genau arbeiten, damit solche Schwingungen nicht "durchs Raster fallen".
Audacity hat nur eine begrenzte Rechenleistung zur Verfügung, deshalb kann es die Schwingungen nur zu einem gewissen Grad analysieren. Darunter leidet die Vielfalt der Obertöne. Um das zu kompensieren, kann man darauf verzichten, jeden neuen Klang in einer Musikspur zu analysieren. Manche Programme nehmen einfach jeden zweiten Klang und verlängern seine Länge. Ein Gemisch aus beiden Methoden macht der Standard-Audacity-Algorithmus - das hört man bei größeren Geschwindigkeitsänderungen dann, weil die Tonlängenänderung unregelmäßig passiert ist. Da handelt es sich zwar nur um Millisekungen, allerdings passen die Oberschwingungen dann sofort nicht mehr mit ihren Grundschwingungen überein - das hört man Unterbewusst und das Gehirn macht dann draus: "Klingt Käse!"
Ich hoffe meine Erklärung war nicht zu stark vereinfacht, und weitesgehend verständlich. Ich als MP3-Hasser (da werden die Oberschwingungen auch nicht artgerecht behandelt) rate ich bei großen Geschwindigkeitsänderungen ab! Das wäre so alles über 10%. Mag aber auch am Gehör und der Übung liegen, was aufällt und was nicht.
Vom selber implementieren rate ich dringend ab - das ist eine hoch mathematische Angelegenheit. Eher würde ich nach Audacityplugins oder professionellerer Bearbeitungssoftware, die als Demo zur Verfügung steht, suchen.
Viel Erfolg bei der Suche wünsche ich!