Предложение по методу классификации и модели машинного обучения для классификации звуков окружающей среды

В настоящее время у меня есть проблема с Классификацией звуков окружающей среды. Я хочу использовать звуковую классификацию для обнаружения определенного типа коллированного звука (который действительно отличается от других и очень легко распознается человеческими ушами). Но есть и другие типы коллированных звуков, которые могут произойти, что для меня не важно, то есть все, что мне нужно, это просто не классифицировать их как мой "конкретный тип коллированного звука".

Сейчас я пытаюсь использовать GMM и LFCC для классификации. Одна модель GMM, обученная всеми LFCC из этого типа коллизионного звука, и модель GMM для всех других LFCC (либо из какого-то звука среды без столкновений, либо из какого-либо другого типа столкновения, который мне не нужен). Производительность в настоящее время очень плохая, с очень высокой скоростью отзыва, но с чрезвычайно низкой точностью. Я обнаружил, что, хотя моя модель GMM для «определенного типа звука» дала бы очень низкую вероятность, когда тип звука отсутствует, другая модель GMM для всего звука, кроме того, который я хочу, также даст низкую вероятность, если это была ситуация, когда происходят все другие типы столкновений.

В такой ситуации мне следует переключиться на другую модель, такую как ANN или SVM, или мне нужно добавить больше моделей GMM? Я думал, например, о GMM_1 для типа столкновения, который я хочу, и GMM_2 для других типов столкновений и GMM_3 для всего остального. Но мне трудно получить «все другие типы столкновений», и я не уверен, действительно ли этот способ повысит точность.

Tamaki Sakura 14.05.2014 источник

comment

К вашему сведению, этот тип вопросов больше подходит для datascience.stackexchange.com - merours 04.07.2014

comment

Действительно ли наука о данных связана с классификацией аудио? Но в любом случае спасибо, я не знаю, есть ли сайт Data Science Stack Exchange, прежде чем я посмотрю :) @fxm - Tamaki Sakura 04.07.2014

Ответы (1)

arrow_upward
0
arrow_downward

Что ж, я должен ответить на свой вопрос. В эти дни я провел некоторое тестирование, используя модель трех GMM, как я упомянул в вопросе. Он по-прежнему отлично работает. Я уверен, что если бы у меня было больше тренировочных данных, я смогу достичь точности выше 90%.

Tamaki Sakura 04.07.2014

Предложение по методу классификации и модели машинного обучения для классификации звуков окружающей среды

Ответы (1)

Вопросы по теме