Проблемы с обработкой волнового файла scipy.io после применения преобразований Фурье

Я работаю с некоторыми аудиофайлами на Python, используя пакеты scipy.fftpack и scipy.io. Это означает, что у меня есть волновые файлы, которые я импортирую, играю с ними, используя преобразования Фурье, а затем выводю в новый волновой файл. Однако у меня возникают проблемы, когда после запуска этих преобразований волновой файл не воспроизводится и примерно в 4 раза превышает размер исходного файла.

В настоящее время я просто импортирую песню, беру скорость, фрагменты данных из импорта, выполняю ifft (fft (data)) и затем выводю это. Я попытался взять эти значения с плавающей запятой и преобразовать их в целые числа и вычислить разницу между исходными импортированными данными и ifft (fft (data)) и увидел, что оно равно нулю.

Итак, у меня есть следующие вопросы:

  1. Кто-нибудь знает, почему волновые файлы, которые я пытаюсь воспроизвести после преобразования Фурье, не воспроизводятся?

  2. Существуют ли какие-либо ограничения на волновые файлы, которые могут вызывать проблемы в целом? Или данные должны быть целыми числами?

Уже поздно, и я чувствую, что мой пост может быть бессмысленным, поэтому, если вам нужна дополнительная информация, спрашивайте, и я сделаю все возможное, чтобы дать лучшее описание.


person KevinShaffer    schedule 24.03.2013    source источник


Ответы (1)


Вам необходимо преобразовать ваши данные после обработки в целочисленный тип соответствующей битовой глубины. Используя этот файл в качестве примера:

>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('Happy Tree Friends.wav')
>>> rate
8000
>>> data
array([ 5, -5,  5, ...,  0, -1,  0], dtype=int16)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([  5.00000000e+00 -1.55406753e-11j,
        -5.00000000e+00 +1.95349676e-11j,
         5.00000000e+00 +1.41131140e-11j, ...,
         8.06674092e-12 -7.58643463e-13j,
        -1.00000000e+00 -2.21611283e-12j,  -2.04999489e-11 +4.55890751e-12j])
>>> data_bis.dtype
dtype('complex128')

Несмотря на то, что значения в data действительно близки к значениям в data_bis, они очень разные звери, как показано ниже:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis)
>>> scipy.io.wavfile.read('test.wav')
TypeError: data type not understood

Но если вы просто конвертируете обработанные результаты обратно в исходный dtype, все снова будет работать нормально:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis.astype(data.dtype))
__main__:1: ComplexWarning: Casting complex values to real discards the imaginary part
>>> scipy.io.wavfile.read('test.wav')
(8000, array([ 4, -5,  4, ...,  0, -1,  0], dtype=int16))
person Jaime    schedule 24.03.2013
comment
Спасибо, это было прекрасно! - person KevinShaffer; 24.03.2013