Более общие голоса

Сегодня мы рады сообщить, что Common Voice, инициатива Mozilla по краудсорсингу большого набора данных человеческих голосов для использования в речевых технологиях, становится многоязычной! Благодаря огромным усилиям сообществ Mozilla и наших активных языковых партнеров, теперь вы можете пожертвовать свой голос на немецком, французском и валлийском языках, и мы работаем над тем, чтобы запустить еще 40+, пока мы говорим. Но это только начало. Мы хотим, чтобы Common Voice стал для любого сообщества инструментом, делающим речевые технологии доступными на их родном языке.

С момента запуска Common Voice в июле прошлого года мы собрали сотни тысяч образцов голоса на английском языке через наш сайт и приложение для iOS. В ноябре прошлого года мы опубликовали первую версию набора данных Common Voice. Эти данные были загружены тысячи раз, и мы видели, как данные используются в коммерческих голосовых продуктах, а также в программном обеспечении с открытым исходным кодом, таком как Kaldi и нашей собственной системе распознавания речи, проекте Deep Speech.

До сих пор Common Voice был доступен только для голосовых сообщений на английском языке. Но целью Common Voice всегда была поддержка многих языков, чтобы мы могли реализовать наше видение о том, чтобы сделать речевые технологии более открытыми, доступными и инклюзивными для всех. Вот почему наши основные усилия в последние несколько месяцев были направлены на рост и расширение возможностей отдельных языковых сообществ для запуска Common Voice в своих частях мира, на их местных языках и диалектах.

Помимо локализации веб-сайта, эти сообщества заполняют Common Voice предложениями без авторских прав, которые люди могут прочитать и которые обладают необходимыми характеристиками для высококачественного набора данных. Они также помогают продвигать сайт в своих странах, создавая сообщество участников с целью увеличения общего количества часов данных, доступных на каждом языке.

Помимо английского, мы сейчас собираем образцы голоса на французском, немецком и валлийском языках. И на подходе уже более 40 других языков - не только большие, такие как испанский, китайский или русский, но и более мелкие, такие как фризский, норвежский или чувашский. Для нас эти небольшие языки важны, потому что они часто не обслуживаются существующими коммерческими службами распознавания речи. Таким образом, делая эти данные доступными, мы можем дать предпринимателям и сообществам возможность самостоятельно устранить этот пробел.

Переход на многоязычие - большой шаг для Common Voice, и мы надеемся, что это также большой шаг для речевых технологий в целом. Демократизация голосовых технологий не только снизит барьер для глобальных инноваций, но и снизит барьер для доступа к информации. Особенно это касается людей, которые традиционно не имели такого доступа - например, людей с ослабленным зрением, людей, которые так и не научились читать, детей, пожилых людей и многих других.

Мы очень рады видеть растущую поддержку, которую мы получаем в создании крупнейшего в мире общедоступного многоязычного набора голосовых данных. Вы можете помочь нам его вырастить прямо сейчас, пожертвовав свой голос. Вы также можете использовать приложение для iOS. Если вы хотите помочь перенести технологию Common Voice и речи на свой язык, посетите нашу языковую страницу. А если вы являетесь частью организации и у вас есть идея принять участие в этом проекте, свяжитесь с нами ([email protected]).

Наш Форум дает больше информации о том, как помочь, а также является отличным местом, чтобы задать вопросы и познакомиться с сообществами.

Особая благодарность

Мы хотели бы поблагодарить нашу Консультативную группу по речи, людей, которые были экспертами-консультантами и внесли вклад в проект Common Voice:

Фрэнсис Тайерс - доцент кафедры компьютерной лингвистики Высшей школы экономики в Москве
Жиль Адда - специалист по речи
Томас Гриффитс - специалист по цифровым услугам, Управление Законодательного собрания, Австралия
Джошуа Мейер - докторант в области распознавания речи
Делит Прайс - языковые технологии в исследовательском центре Бангорского университета
Деви Брин Джонс - языковые технологии в исследовательском центре Бангорского университета
Ваэль Фархан - магистр машинного обучения из UCSD, в настоящее время занимается исследованием арабского НЛП на Mawdoo3.com.
Эрен Гёльге - специалист по машинному обучению, который в настоящее время работает над TTS для Mozilla
Алаа Сааде, старший научный сотрудник по машинному обучению @ Snips (Париж)
Лоран Безасье - профессор Университета Гренобль-Альпы, НЛП, обработка речи, языки с ограниченными ресурсами
Дэвид ван Леувен - технолог по речи
Бенджамин Мильде - кандидат наук в области НЛП / обработки речи
Шай Палачи - M.Sc. Кандидат компьютерных наук, ведущий специалист по данным в стартапе

***

Common Voice дополняет работу Mozilla в области распознавания речи, которая работает под названием проекта Deep Speech, модель механизма распознавания речи с открытым исходным кодом, которая приближается к человеческой точности, которая была выпущен в ноябре 2017 года. Вместе с растущим набором данных Common Voice мы считаем, что эта технология может и будет способствовать появлению целой волны инновационных продуктов и услуг, и что она должна быть доступна всем.

Более общие голоса

Вопросы по теме