Преобразование голоса подобно преобразованию цветного изображения в оттенки серого?

этот вопрос не классифицирован .. я думаю. Интересно, могу ли я преобразовать каждый записанный голос в один стандартный голос, чтобы иметь возможность работать с ним?

Let me explain on image. I have colored image but i know that it's very hard to recognize letter. So lets convert it. I can now operate on image which is in grayscale. I have more abilities to work on it then.

Несколько дней я дорабатывал свой собственный алгоритм распознавания букв на картинке, так что у меня есть некоторый опыт. :]

Can you give me some good ideas or alghoritms about converting voice to voice on which i can work easily?


изменить1

скажем, два человека разговаривают в микрофон моего компьютера. Посмотрите, что график моего голоса и голоса моего друга отличаются. Я спрашиваю, есть ли возможность нормализовать оба голоса в один универсальный голос. Если я запрограммирую "Привет!", это не сработает, если моя девушка скажет "Привет!" в моей программе (написанной на С#).


person deadfish    schedule 16.05.2011    source источник
comment
Я не уверен, что вы спрашиваете. Как прочитать изображение типа CAPTCHA как определенный голос?   -  person Raoul    schedule 16.05.2011
comment
выделенная жирным шрифтом фраза - это вопрос   -  person deadfish    schedule 16.05.2011
comment
Вам нужно будет обработать речь с помощью механизма преобразования речи в текст, а затем повторно сгенерировать речь с помощью механизма преобразования текста в речь.   -  person Paul R    schedule 16.05.2011


Ответы (1)


Основываясь на вашем обновлении, я думаю, что вы ищете комбинацию программного обеспечения для распознавания голоса и синтеза речи. Я предлагаю посмотреть CMUSphinx: http://cmusphinx.sourceforge.net/ и фестиваль: http://festvox.org/ соответственно.

Поэтому используйте распознавание голоса, чтобы определить, что говорят люди, и выведите их в виде стандартного «голоса» с помощью синтеза речи.

person Raoul    schedule 16.05.2011