Публикации по теме 'voice-recognition'


Mozilla DeepSpeech против Бэтмена
Нет, я не разработчик «машинного обучения», но мне интересно узнать, на что оно способно. Все это означает, что это не статья о кровавых технических подробностях Mozilla DeepSpeech. Скорее, я пишу о своем опыте после того, как провел с ним пару часов, был прилично впечатлен и обнаружил, что с нетерпением ожидаю, что этот проект со временем улучшится. Я уже некоторое время поверхностно знаком с технологией голосового ввода. Называть Google Web Speech API «первым» оказывает медвежью услугу..

Привет сэр,
Привет сэр, Я пытался исследовать приложения на основе ИИ с момента окончания учебы. В настоящее время я пытаюсь создать программу на Python, которая могла бы использовать любые методы машинного обучения для реализации распознавания голоса (что похоже на распознавание лиц). Он должен распознавать владельца голоса (сравнивать с базой данных и распознавать) и извлекать содержимое речи. Было бы полезнее, если бы он мог обеспечить подавление шума позже (избегая/игнорируя другие голоса,..

Голосовой помощник Hound превысил 1 миллион загрузок
Голосовой помощник Hound превысил 1 миллион загрузок В марте 2016 года мы выпустили Hound для пользователей в США. Мы знали, что наткнулись на что-то удивительное, основываясь на реакции, которую мы получили. The Verge назвал Hound самым умным и быстрым голосовым помощником , а Engadget назвал его интуитивным и странно знакомым, как настоящий разговор . Многие из наших новых поклонников поддержали ту же точку зрения и быстро стали сторонниками нашего приложения Hound...

Руководство по преобразованию речи в текст DeepSpeech
Обработка естественного языка Руководство по преобразованию речи в текст DeepSpeech Расшифруйте свои аудиофайлы локально с помощью DeepSpeech Нет, мы не говорим о тебе, Ктулху. Это другой тип DeepSpeech. DeepSpeech, о котором мы говорим сегодня, представляет собой библиотеку Python для преобразования речи в текст. Преобразование речи в текст является частью обработки естественного языка (NLP) . Автоматизированная речь…

Интернет аудио
Ваш голос — суперсила в сети Интернет был создан для соединения текстовых документов, но с последними достижениями в веб-платформе и машинном обучении звук улучшает и заменяет текст. Теперь на современной веб-платформе (без использования Flash) можно создавать впечатляющие звуковые эффекты благодаря набору API-интерфейсов, разработанных сообществом открытого исходного кода и поставщиками браузеров за последние несколько лет. Интернет Аудио и MIDI WebRTC и WebSockets..

Распознавание речи для чайников
В этой статье мы хотим взглянуть на основы такой захватывающей области разработки программного обеспечения, как распознавание речи. Однако основная цель этой статьи, как можно понять из названия, - это описание основных понятий, проблем и способов их решения. Пролог Начнем с того, что наша речь - это последовательность звуков. Звук в свою очередь - это суперпозиция (наложение) звуковых колебаний (волн) разных частот. Волны, как мы знаем из физики, характеризуются двумя атрибутами -..

Система обнаружения звука (SDS)
Обнаружение звука или голоса стало популярной и важной задачей в области обработки аудиосигналов. Применение обнаружения звука широко используется в различных областях, таких как автоматическое распознавание речи, обнаружение аудиособытий, распознавание говорящих, классификация музыки и т. д. В этом блоге демонстрируется использование глубоких нейронных сетей для обнаружения звука с использованием широко используемого набора данных UrbanSound8k в область обработки звукового сигнала...