Можно ли отредактировать речь (или голос) с микрофона перед отправкой на распознаватель речи?

Я хочу выровнять речь, прежде чем она попадет в распознаватель речи. Я создал новое намерение, которое запускает распознаватель речи и просит меня говорить, и после того, как я закончу говорить, оно будет переведено в текст. Хорошо, это круто и работает.

Но мне нужно изменить голос, выровнять его, прежде чем он будет переведен в текст. Потому что я хочу дать более четкую речь распознавателю, чтобы получить лучшую производительность, более точный текст.

Есть ли какие-нибудь возможности или идеи? Я ценю любую помощь! :))


person Berces Zsombor    schedule 14.06.2019    source источник


Ответы (1)


Я не знаком с распознаванием речи, но поскольку вы хотите выровнять необработанные данные с микрофона, а затем отправить их в распознаватель, почему бы не использовать Аудиозапись, чтобы сделать это. Я нашел для вас демонстрацию google-speech-api. https://github.com/GoogleCloudPlatform/android-docs-samples/blob/master/speech/Speech/app/src/main/java/com/google/cloud/android/speech/VoiceRecorder.java. Ниже приведен краткий поток:

final int size = mAudioRecord.read(mBuffer, 0, mBuffer.length);
// equliaze the buf you want here.
mCallback.onVoice(mBuffer, size);
person yw07    schedule 14.06.2019