Публикации по теме 'speech-recognition'
Обработка звука в TensorFlow
Реализация кратковременного преобразования Фурье
Я обнаружил, что обработка звука в TensorFlow затруднена, вот мое решение
Есть бесчисленное множество способов выполнить обработку звука. Обычный процесс проведения экспериментов с искусственными нейронными сетями в TensorFlow с аудиовходами - это сначала предварительно обработать звук, а затем передать его в нейронную сеть.
Но что происходит, когда кто-то хочет выполнить обработку звука где-то в середине графа вычислений?..
Учебное пособие по Google Speech-To-Text API с Python
Недавно у меня была возможность изучить один из лучших алгоритмов глубокого обучения, преобразование речи в текст, для проекта моей компании по расшифровке звукового сигнала и удалению конфиденциальных и личных данных.
Если вы, как и я, впервые пользуетесь Google API, я расскажу вам, и гарантирую, что из этой статьи вы сможете использовать Google API.
Что такое API? Согласно Википедии API
Интерфейс прикладного программирования ( API ) - это связь между« компьютерами или между..
Интерспек Серия 2017 | Акустическая модель для технологии распознавания речи
1. Введение в автоматическое распознавание речи
1.1. Что такое автоматическое распознавание речи
Исследования в области автоматического распознавания речи (ASR) направлены на то, чтобы компьютеры могли «понимать» человеческую речь и преобразовывать ее в текст. ASR - это следующий рубеж в интеллектуальном человеко-машинном взаимодействии, а также предварительное условие для совершенствования машинного перевода и понимания естественного языка. Исследования ASR можно проследить до..
Моя первая встреча, GCP и ML API…
Я слышал и видел, как много людей публикуют и рассказывают о встречах или хакатонах, организованных рядом технологических компаний, наиболее известными из которых являются Google, Facebook, PayTM и т. Д.
Это была моя первая встреча, на которой я встретил множество людей, работающих с различными технологиями и компаниями, в основном это была небольшая встреча, на которой я узнал о новых API машинного обучения, запущенных Google. Также это мой первый средний рассказ! Приносим извинения за..
Создание файла SRT (субтитров) с помощью API преобразования речи в текст Google Cloud
Код, использованный в этой статье, можно найти здесь .
Смотрели фильм / сериал с субтитрами и удивлялись тому, как они волшебным образом всплывают? Или интересно, как можно добавлять субтитры к своим видео? К концу этой статьи вы сможете создавать субтитры программным способом.
Перво-наперво - почему для субтитров предпочтительнее формат файла SRT?
SRT - это широко распространенный формат субтитров, совместимый с большинством медиаплееров и имеющий огромные преимущества для SEO...
Обучение пользовательской модели преобразования речи в текст с использованием CMU Sphinx4 — Часть 1 — Настройка CMU Sphinx и…
В этой статье мы настроим CMU Sphinx в нашей системе Linux. Мы используем Ubuntu 20.04 в качестве подсистемы Windows.
Вот некоторые подробности о дистрибутиве, который мы используем.
Большинство команд, которые мы будем использовать, теперь могут работать в вашей версии n. В таком случае используйте Google или StackOverflow, чтобы найти альтернативные зависимости или пакеты.
Давайте начнем. 😄
Чтобы установить CMU Sphinx, нам нужно установить несколько пакетов в нашей..