Как измерить сходство речевого файла

У меня есть два речевых аудиофайла. Каждый записан из телефонного разговора, и они различаются по продолжительности (первый файл длится 3 секунды, а второй — 5 секунд). Я хочу измерить сходство двух файлов. Обратите внимание, что меня не интересует текстовое содержимое в речевом сигнале (т.е. NO Speech to Text). Мне нужно просто измерить сходство и получить оценку или процент.

Я нашел несколько инструментов, которые выполняют анализ звуковых отпечатков пальцев, но я обнаружил, что почти все они нацелены на музыкальные аудиофайлы и плохо работают с речью.


person user1794913    schedule 16.11.2013    source источник
comment
Уже задан вопрос stackoverflow.com/questions /19841333/   -  person Nikolay Shmyrev    schedule 16.11.2013
comment
Уважаемый Николай, не могли бы Вы ответить на него. Спасибо за добавление этого комментария. Надеюсь получить ваше руководство.   -  person user1794913    schedule 16.11.2013


Ответы (1)


Audio Fingerprint не должен работать для поиска сходства, Audio Fingerprint следует использовать, когда у вас есть звук или фрагмент звука, полностью идентичный.

Возможно, вам нужно собрать набор функций, таких как кепстральные коэффициенты частоты Мела (MFFC), и использовать один метод классификации, такой как HNN, чтобы сказать вам о сходстве (тяжелая работа), лол.

person ederwander    schedule 19.11.2013