Публикации по тегам speech-recognition

Публикации по теме 'speech-recognition'

Обработка звука в TensorFlow

Реализация кратковременного преобразования Фурье Я обнаружил, что обработка звука в TensorFlow затруднена, вот мое решение Есть бесчисленное множество способов выполнить обработку звука. Обычный процесс проведения экспериментов с искусственными нейронными сетями в TensorFlow с аудиовходами - это сначала предварительно обработать звук, а затем передать его в нейронную сеть. Но что происходит, когда кто-то хочет выполнить обработку звука где-то в середине графа вычислений?..

Учебное пособие по Google Speech-To-Text API с Python

Недавно у меня была возможность изучить один из лучших алгоритмов глубокого обучения, преобразование речи в текст, для проекта моей компании по расшифровке звукового сигнала и удалению конфиденциальных и личных данных. Если вы, как и я, впервые пользуетесь Google API, я расскажу вам, и гарантирую, что из этой статьи вы сможете использовать Google API. Что такое API? Согласно Википедии API Интерфейс прикладного программирования ( API ) - это связь между« компьютерами или между..

Интерспек Серия 2017 | Акустическая модель для технологии распознавания речи

1. Введение в автоматическое распознавание речи 1.1. Что такое автоматическое распознавание речи Исследования в области автоматического распознавания речи (ASR) направлены на то, чтобы компьютеры могли «понимать» человеческую речь и преобразовывать ее в текст. ASR - это следующий рубеж в интеллектуальном человеко-машинном взаимодействии, а также предварительное условие для совершенствования машинного перевода и понимания естественного языка. Исследования ASR можно проследить до..

Моя первая встреча, GCP и ML API…

Я слышал и видел, как много людей публикуют и рассказывают о встречах или хакатонах, организованных рядом технологических компаний, наиболее известными из которых являются Google, Facebook, PayTM и т. Д. Это была моя первая встреча, на которой я встретил множество людей, работающих с различными технологиями и компаниями, в основном это была небольшая встреча, на которой я узнал о новых API машинного обучения, запущенных Google. Также это мой первый средний рассказ! Приносим извинения за..

Создание файла SRT (субтитров) с помощью API преобразования речи в текст Google Cloud

Код, использованный в этой статье, можно найти здесь . Смотрели фильм / сериал с субтитрами и удивлялись тому, как они волшебным образом всплывают? Или интересно, как можно добавлять субтитры к своим видео? К концу этой статьи вы сможете создавать субтитры программным способом. Перво-наперво - почему для субтитров предпочтительнее формат файла SRT? SRT - это широко распространенный формат субтитров, совместимый с большинством медиаплееров и имеющий огромные преимущества для SEO...

Обучение пользовательской модели преобразования речи в текст с использованием CMU Sphinx4 — Часть 1 — Настройка CMU Sphinx и…

В этой статье мы настроим CMU Sphinx в нашей системе Linux. Мы используем Ubuntu 20.04 в качестве подсистемы Windows. Вот некоторые подробности о дистрибутиве, который мы используем. Большинство команд, которые мы будем использовать, теперь могут работать в вашей версии n. В таком случае используйте Google или StackOverflow, чтобы найти альтернативные зависимости или пакеты. Давайте начнем. 😄 Чтобы установить CMU Sphinx, нам нужно установить несколько пакетов в нашей..