В настоящее время у меня есть проблема с Классификацией звуков окружающей среды. Я хочу использовать звуковую классификацию для обнаружения определенного типа коллированного звука (который действительно отличается от других и очень легко распознается человеческими ушами). Но есть и другие типы коллированных звуков, которые могут произойти, что для меня не важно, то есть все, что мне нужно, это просто не классифицировать их как мой "конкретный тип коллированного звука".
Сейчас я пытаюсь использовать GMM и LFCC для классификации. Одна модель GMM, обученная всеми LFCC из этого типа коллизионного звука, и модель GMM для всех других LFCC (либо из какого-то звука среды без столкновений, либо из какого-либо другого типа столкновения, который мне не нужен). Производительность в настоящее время очень плохая, с очень высокой скоростью отзыва, но с чрезвычайно низкой точностью. Я обнаружил, что, хотя моя модель GMM для «определенного типа звука» дала бы очень низкую вероятность, когда тип звука отсутствует, другая модель GMM для всего звука, кроме того, который я хочу, также даст низкую вероятность, если это была ситуация, когда происходят все другие типы столкновений.
В такой ситуации мне следует переключиться на другую модель, такую как ANN или SVM, или мне нужно добавить больше моделей GMM? Я думал, например, о GMM_1 для типа столкновения, который я хочу, и GMM_2 для других типов столкновений и GMM_3 для всего остального. Но мне трудно получить «все другие типы столкновений», и я не уверен, действительно ли этот способ повысит точность.