Ausgangssignal ist ein Signal über die Zeit mit den in Kapitel beschriebenen : FRQ-Datenarray
Genauso wie bei Feiten et al. wird in weiterer Folge eine fixe Anzahl hintereinander liegender PCM-Samples genommen und für diese Werte eine FFT durchgeführt. Die Anzahl der Samples ergibt sich aus folgender Überlegung:
Musik besteht meist aus zwei Kanälen.
512 Samples je Kanal bedeuten 1024 Samples, die bei einem Lesezugriff zu lesen sind.
Ein Sample besteht aus einer 16-bit Zahl, somit sind pro Lesezugriff 2048 Bytes zu lesen (Rechnung ).
Eine Auswahl von 512 aufeinander folgenden Samples deckt somit eine Dauer von etwa 10 ms innerhalb des Musikstücks ab (Rechnung ).
Es wurde somit ein spezielles Visualization-Plugin implementiert, das die beiden oben beschriebenen Datenreihen aus einer beliebigen Audiodatei extrahiert und in eine separate Datei speichert. Im nächsten Schritt werden dann aus dieser Datei die FRQ-Daten für einen Kanal (linker Kanal) extrahiert und nach Entfernen der Nullwerte am Beginn und Ende der Datei in eine neue Datei gespeichert. Diese Datei wird zur weiteren Verarbeitung genutzt.