Публикации по теме 'speech-recognition'


HTML5 API распознавания речи
Автор Кай Ведекинд «Я не вижу причин, по которым мы (не) использовали бы API распознавания речи, мы могли бы использовать и другие API, существует множество API». - Д.Т. Вы когда-нибудь задумывались, можно ли использовать и перемещаться по веб-сайту только с помощью голосовых команд? - Нет? - Это возможно? - Да! В 2012 году сообщество W3C представило Спецификацию Web Speech API . Целью было включить распознавание и синтез речи в современных браузерах. На дворе июль 2018..

Аудиоаннотация для моделей НЛП, направленная на улучшение качества обслуживания клиентов. Изобретательские и автономные
От автомобильной навигации до виртуальных помощников, от анализа естественных звуков до обнаружения звукоподражаний — эти изобретательные и автономные настройки требуют высокосегментированных и тщательно отобранных обученных данных из форматов MP3, FLAC, WAV и других форматов. Проще говоря, аудио/речевая аннотация для НЛП — это маркировка записей в формате, который впоследствии понимается настройками машинного обучения. Annoberry предоставляет комплексные услуги аудиоаннотации, охватывающие..

Делимся нашим общим голосом - Mozilla выпускает второй по величине набор общедоступных голосовых данных
С момента запуска Common Voice мы собрали сотни тысяч образцов голоса через наш сайт и приложение для iOS . Сегодня мы выпускаем первую версию этой голосовой коллекции в общественное достояние . С самого начала Mozilla полагалась на творчество, сострадание и находчивость людей во всем мире, чтобы помочь нам создать и продвигать Интернет как глобальный общедоступный ресурс, доступный для всех. Это стало основой нашей экспериментальной работы в области машинного обучения и..

Распознавание речи для чайников
В этой статье мы хотим взглянуть на основы такой захватывающей области разработки программного обеспечения, как распознавание речи. Однако основная цель этой статьи, как можно понять из названия, - это описание основных понятий, проблем и способов их решения. Пролог Начнем с того, что наша речь - это последовательность звуков. Звук в свою очередь - это суперпозиция (наложение) звуковых колебаний (волн) разных частот. Волны, как мы знаем из физики, характеризуются двумя атрибутами -..

Преобразование речи в текст на амхарском языке
Абстрактный Этот проект направлен на преобразование звуков амхарской речи в текстовый формат. Этот отчет поможет нам понять методы, используемые для достижения и создания модели. Мы создадим образцы транскрипций на обучающем наборе аудиофайлов после создания модели. Введение Всемирная продовольственная программа планирует использовать интеллектуальную форму для сбора информации о пищевой ценности продуктов, купленных и проданных на трех африканских рынках. Дизайн этой..

Запуск приложения искусственного интеллекта и API «Речь в текст» на платформе CellStrat Hub
#CellStratAILab #disrupt4.0 #PAAS #AIAsAService #MLOps #AI #SpeechToText #TexToSpeech #TTS #STT #AIApp #API #Audio CellStrat AI Lab рада представить замечательное приложение и API для преобразования речи в текст на платформе CellStrat Hub! Преобразование речи в текст (STT)  – это транскрипция речи в текст. Он находит применение в десятках бизнес-приложений, таких как транскрипция аудио или видео, анализ речи, консультации врачей, преподавание в классе, юридические обсуждения,..

ИИ: что это такое и как его использовать
Существует 3 основных типа машинного обучения Искусственный интеллект (ИИ) уже много лет является модным словом, поскольку он может произвести революцию в широком спектре отраслей, от здравоохранения до финансов. Многие лидеры технологической отрасли превозносят его достоинства и обещают ИИ светлое будущее. Но с шумихой приходит много путаницы, особенно среди сотрудников, которые задаются вопросом, будут ли их рабочие места заменены машинами. Правда в том, что ИИ не заменит все..