Google - интересная организация в мире технологий. Нам нравится то, что они нам дают, но в наши дни мы хорошо знаем, как наша информация используется для их финансовой выгоды. Но даже в этом случае нельзя отрицать две истины: у них есть экономические и технологические возможности для создания инновационных продуктов, и они стремятся сделать эти достижения доступными для нас, простых крестьян. Самым последним выпуском, который представляет моральные дилеммы для американских хакеров, является набор данных для обучения распознаванию речи на их платформе TensorFlow.

Набор данных, по сути, учебник для ускорения искусственного интеллекта о том, как общаться с людьми, технически может быть использован для любого приложения ИИ. Он построен на Flask, среде Python с открытым исходным кодом, поэтому его можно использовать на любой совместимой платформе. Но, если честно, вы, вероятно, захотите использовать его с системой Google TensorFlow.

Согласно их веб-сайту, TensorFlow - это «программная библиотека с открытым исходным кодом для численных вычислений с использованием графов потоков данных». Это дает пользователям возможность использовать преимущества глубокого обучения нейронных сетей для улучшения результатов в любой отрасли, в которой работают пользователи. Не поймите нас неправильно - такое узкое использование ИИ широко распространено, и в целом это хорошо для потребителей. Подобный узкий ИИ помогает компьютерам, с которыми мы работаем, лучше понимать, что мы от них просим.

Если этот набор данных имеет открытый исходный код и может использоваться для обучения любого ИИ, в чем именно его значение? Существует множество ресурсов по обучению естественному языку. Ответ кроется в самих речевых (или текстовых) моделях. Чтобы научить ИИ, особенно такой узкий, как этот, говорить с нами, мы должны дать ему чему-то, чему можно научиться. Обработка естественного языка (огромная часть исследований ИИ) полагается на подачу ИИ примеров естественного языка (как следует из названия). Проблема в том, что большинство текстовых наборов данных, к которым у нас есть легкий доступ, не являются «естественным языком».

Традиционно эти наборы данных поступают из открытых источников, таких как книги, которые больше не защищены авторским правом. Проблема, конечно, в том, что это не отражает того, как на самом деле сегодня разговаривает нормальный человек. Для этого набора данных Google взял всего 30 слов, но записал их в виде огромных 65 000 высказываний, чтобы охватить весь спектр человеческой речи на одном языке.

Этот набор данных нельзя назвать беспрецедентным - это именно то, что исследователи ИИ используют для обучения своих нейронных сетей. Но ключевым моментом здесь является то, что это открытый исходный код, и он готов к подключению к вашему TensorFlow (или другому) ИИ. Мы с нетерпением ждем возможности увидеть, как исследователи искусственного интеллекта, как любители, так и профессионалы, смогут использовать его для расширения понимания естественного языка их творениями.