Публикации по теме 'voice-recognition'
Mozilla DeepSpeech против Бэтмена
Нет, я не разработчик «машинного обучения», но мне интересно узнать, на что оно способно. Все это означает, что это не статья о кровавых технических подробностях Mozilla DeepSpeech. Скорее, я пишу о своем опыте после того, как провел с ним пару часов, был прилично впечатлен и обнаружил, что с нетерпением ожидаю, что этот проект со временем улучшится.
Я уже некоторое время поверхностно знаком с технологией голосового ввода. Называть Google Web Speech API «первым» оказывает медвежью услугу..
Привет сэр,
Привет сэр,
Я пытался исследовать приложения на основе ИИ с момента окончания учебы. В настоящее время я пытаюсь создать программу на Python, которая могла бы использовать любые методы машинного обучения для реализации распознавания голоса (что похоже на распознавание лиц). Он должен распознавать владельца голоса (сравнивать с базой данных и распознавать) и извлекать содержимое речи.
Было бы полезнее, если бы он мог обеспечить подавление шума позже (избегая/игнорируя другие голоса,..
Голосовой помощник Hound превысил 1 миллион загрузок
Голосовой помощник Hound превысил 1 миллион загрузок
В марте 2016 года мы выпустили Hound для пользователей в США. Мы знали, что наткнулись на что-то удивительное, основываясь на реакции, которую мы получили. The Verge назвал Hound самым умным и быстрым голосовым помощником , а Engadget назвал его интуитивным и странно знакомым, как настоящий разговор . Многие из наших новых поклонников поддержали ту же точку зрения и быстро стали сторонниками нашего приложения Hound...
Руководство по преобразованию речи в текст DeepSpeech
Обработка естественного языка
Руководство по преобразованию речи в текст DeepSpeech
Расшифруйте свои аудиофайлы локально с помощью DeepSpeech
Нет, мы не говорим о тебе, Ктулху. Это другой тип DeepSpeech. DeepSpeech, о котором мы говорим сегодня, представляет собой библиотеку Python для преобразования речи в текст. Преобразование речи в текст является частью обработки естественного языка (NLP) . Автоматизированная речь…
Интернет аудио
Ваш голос — суперсила в сети
Интернет был создан для соединения текстовых документов, но с последними достижениями в веб-платформе и машинном обучении звук улучшает и заменяет текст.
Теперь на современной веб-платформе (без использования Flash) можно создавать впечатляющие звуковые эффекты благодаря набору API-интерфейсов, разработанных сообществом открытого исходного кода и поставщиками браузеров за последние несколько лет.
Интернет Аудио и MIDI WebRTC и WebSockets..
Распознавание речи для чайников
В этой статье мы хотим взглянуть на основы такой захватывающей области разработки программного обеспечения, как распознавание речи. Однако основная цель этой статьи, как можно понять из названия, - это описание основных понятий, проблем и способов их решения.
Пролог
Начнем с того, что наша речь - это последовательность звуков. Звук в свою очередь - это суперпозиция (наложение) звуковых колебаний (волн) разных частот. Волны, как мы знаем из физики, характеризуются двумя атрибутами -..
Система обнаружения звука (SDS)
Обнаружение звука или голоса стало популярной и важной задачей в области обработки аудиосигналов. Применение обнаружения звука широко используется в различных областях, таких как автоматическое распознавание речи, обнаружение аудиособытий, распознавание говорящих, классификация музыки и т. д. В этом блоге демонстрируется использование глубоких нейронных сетей для обнаружения звука с использованием широко используемого набора данных UrbanSound8k в область обработки звукового сигнала...