Выберите подходящую модель Amazon Transcribe для функции автоматического распознавания речи вашего проекта.

Если вы используете сервис Amazon Transcribe для функции автоматического распознавания речи (ASR) в своем проекте (особенно для английского языка), вам нужно было решить, создавать ли пользовательскую языковую модель или общую модель, предоставляемую сервисом транскрипции AWS. Также может случиться так, что вы попробовали оба варианта в своем приложении. Поскольку у меня был некоторый опыт использования обоих вариантов в моем проекте, здесь я поделюсь своими пятью центами.

Сценарий 1

Вы использовали общую модель для расшифровки аудио- или видеофайлов. Вы заметили, что Amazon Transcribe не может распознавать некоторые не очень часто встречающиеся английские слова или фразы, произносимые говорящими в аудиофайлах.

Сценарий 2

Вы создали пользовательскую языковую модель (CLM) с ограниченными данными, специфичными для предметной области. Теперь вы видите, что CLM хорошо подбирает специфические для предметной области слова или фразы, полученные из данных, но CLM плохо распознает слова, отсутствующие в обучающих данных.

Как решить вышеуказанные проблемы?

Если в вашем приложении недостаточно данных о клиентах, которые могут выступать в качестве представителя аудио/видеофайлов, которые вы собираетесь транскрибировать, выберите общую модель в своем задании транскрипции. Теперь, если определенные доменные слова не распознаются общей моделью, добавьте эти слова в пользовательский словарь. Детали пользовательской лексики — здесь.

С другой стороны, если в вашем приложении есть много данных о клиентах в текстовом формате, и эти текстовые данные представляют собой аудио/видеофайлы, которые вы собираетесь транскрибировать в будущем, создайте пользовательскую модель, используя эти текстовые данные. Текстовые данные клиента хорошо помогают уменьшить количество ошибок в словах при транскрипции. В некоторых случаях вам даже не нужен какой-либо пользовательский файл словаря в вашем задании на транскрипцию. Здесь — документ AWS по построению CLM.

Если вы еще не являетесь платным участником Medium, вы можете сделать это, перейдя по этой ссылке. Вы получите неограниченный полный доступ ко всем историям на Medium. Я получу часть ваших членских взносов в качестве реферала.

Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.