Вступление

ASR или автоматическое распознавание речи может распознавать речь и преобразовывать ее в текст.

На рынке доступны и другие модели распознавания речи, но зачем их использовать, если ваше приложение само может обрабатывать все вызовы.

Это даже обеспечит накопление данных о вашем клиенте только в вашем приложении.

Модели глубокого обучения с точностью более 95% могут покрыть максимум 60 секунд.

В настоящее время поддерживаются английский и китайский.

ASR зависит от распознавания речи в облаке, поэтому устройство должно быть подключено к Интернету.

Вывод статьи

Ниже приведен окончательный результат, которого мы собираемся достичь после внедрения этого набора.

Шаги по интеграции

Шаг 1. Создайте новый проект в Android Studio.

Шаг 2. Добавьте указанные ниже зависимости в файл app.gradle.

implementation 'com.huawei.hms:ml-computer-voice-asr-plugin:1.0.4.300'

Шаг 3. Добавьте плагин agc в начало файла app.gradle.

apply plugin: 'com.huawei.agconnect'

Шаг 4. Добавьте указанные ниже разрешения в файл манифеста.

<uses-permission android:name="android.permission.INTERNET" />

<uses-permission android:name="android.permission.RECORD_AUDIO" />

Шаг 5: Добавьте в действие метод, указанный ниже, и вызывайте его одним нажатием кнопки.

Обсудим это подробнее.

Мы запускаем действие MLAsrCaptureActivity и предоставляем ему 2 параметра.

MLAsrCaptureConstants.LANGUAGE как «en-US», по умолчанию будет установлен английский язык.

MLAsrCaptureConstants.FEATURE имеет значение MLAsrCaptureConstants.FEATURE_WORDFLUX.

MLAsrCaptureConstants.FEATURE_WORDFLUX означает, что текст будет отображаться в пользовательском интерфейсе приема речи.

MLAsrCaptureConstants.FEATURE_ALLINONE означает, что он не будет отображать текст в пользовательском интерфейсе приема речи.

Шаг 6: переопределите метод onActivityresult ().

Обсудим это подробнее.

onActivityResult () предоставит вам успешные и неудачные варианты.

MLAsrCaptureConstants.ASR_SUCCESS

Данные будут представлены в виде текста в связке с ключом «MLAsrCaptureConstants.ASR_RESULT».

Чтобы получить его, используйте приведенный ниже код.

text = bundle.getString (MLAsrCaptureConstants.ASR_RESULT) .toString ()

MLAsrCaptureConstants.ASR_FAILURE

Если он попадает в категорию ошибки, вы можете получить подробную информацию, как показано ниже.

MLAsrCaptureConstants.ASR_ERROR_CODE - ключ для кода ошибки.

MLAsrCaptureConstants.ASR_ERROR_MESSAGE - ключ для сообщения об ошибке.

Существуют различные типы сохраненных сообщений, которые скрывают различные сценарии для достижения успешного результата. Они могут уведомить вашего пользователя, чтобы получить наилучшие результаты.

часто задаваемые вопросы

Результат в реальном времени?

Да, предоставленный результат - в реальном времени.

Заключение

Надеюсь, вам понравилась эта статья. Я хотел бы услышать ваши идеи о том, как вы можете использовать этот комплект в своих приложениях.

Прочтите другие мои статьи о ML Kit

Сегментация изображений:



Перевод текста:



Распознавание текста:



Распознавание банковских карт:





Для практики лаборатории кода