Было время, когда наука о данных была совершенно недоступна для большинства продуктов. Как владелец продукта, вам понадобятся специалисты по работе с данными, которых у вас не было, если только вы не являетесь крупной или нишевой компанией. Даже если бы они у вас были, у них редко были бы ресурсы, чтобы помочь продуктовому племени с нашими сумасшедшими и амбициозными запросами.

Затем что-то произошло. Несколько лет назад, когда я впервые изучил R, установка базовых пакетов на Mac была кошмаром. Ничего не сработало. Пару месяцев назад меня позвали сделать то же самое на моем блестящем новом M1. В процессе, который можно описать только как «молниеносный», я превратился из ничего во всевозможные крутые штуки за считанные минуты.

Вы помните, как предыдущие проекты данных каждый раз занимали намного больше времени, чем ожидалось? И специалист по данным, работающий над проектом, часто изо всех сил пытался объяснить, почему? Увидев это, теперь я понимаю.

Итак, что случилось?

Революция в науке о данных: этап 1 (c 2010–2020 гг.)

Короткий ответ: «много времени и денег». Инвестированные компании. Как и прежде, проекты часто выходили из-под контроля. В основном это было решено теми же компаниями, которые превышали свои бюджеты, и учеными, работающими с данными, потеющими кровью, чтобы уложиться в сроки. Результатом этого было то, что я видел несколько месяцев назад: крупномасштабная эволюция.

И это еще до того, как вы примете во внимание, что R и Python, краеугольные камни науки о данных, имеют открытый исходный код. И, кроме того, огромное количество рекламы DataCamp, с которой мы все столкнулись за это время.

Я не тот, кто первым использовал фразу «революция данных». Помимо того, что я видел его в другом месте, я полагаю, что он появился в другой рекламе DataCamp. Это хорошо описывает. Совокупные инвестиции были огромными, и мы только начинаем достигать точки, когда они начинают окупаться и становятся действительно надежными на практике. Это означает огромное количество новых возможностей для цифровых продуктов.

Это своего рода конец, но настоящая революция только начинается.

Возможности огромны и страшны

Возможности, вышедшие из этого периода, огромны и даже немного пугают. Используйте их осознанно и с осторожностью. Даже если специалист по обработке и анализу данных больше не занимается внедрением, убедитесь, что он у вас есть под рукой, чтобы помочь определить, что может пойти не так, и заранее принять меры. Никто не хочет проблем с безопасностью данных или предвзятости алгоритмов (что интересно, в последнее время я много видел организаций, назначающих за это награду).

Подумайте о людях, которые в настоящее время работают над вашими проектами, и помните, что для многих людей передача вашей работы компьютеру является реальным и оправданным страхом.

И, прежде всего, никогда не забывайте о крови, поте и неудачных установках пакетов, которые привели нас к этому.

Вы бы рассмотрели что-нибудь из этого?

Новейшие инструменты машинного обучения

Core ML (2017 г.) и Create ML (2018 г.)

Обращение ко всем мобильным PM (iOS). Если вы еще не сели и не поговорили с разработчиками вашего продукта для iOS о том, что Core ML может сделать для вас, сейчас самое время.

В последние годы Apple делала большие ставки на Core ML, и это хвастается. С помощью платформы Create ML, например, прогнозировать новые значения на основе тех, которые ранее вводили пользователи, так же просто, как определить, чего вы хотите достичь, и передать ему некоторые данные. Он занимает буквально 3 строки кода и может работать как с изображениями, так и с текстом.

Это позволяет вам персонализировать взаимодействие с пользователем. Хорошим примером использования, предложенным Полом Хадсоном, является приложение Лучший отдых, которое предсказывает, сколько сна вам нужно, на основе ввода определенных переменных. Apple также предлагает предложение тегов в своем официальном видео. Если вы хотите узнать больше, рекомендую Пола Хадсона Создайте ML для всех.

Классификация нулевого выстрела (2019)

Нулевая классификация позволяет классифицировать текст по разным категориям. Новизна этого метода заключается в том, что он не требует большой базы данных. Таким образом, вы все равно можете использовать его, даже если у вас нет огромного объема существующих данных. Новые/небольшие продукты и продукты B2B с меньшей пользовательской базой, я смотрю на вас.

В настройках продукта нулевая классификация, по-видимому, в основном используется для анализа настроений и классификации новостей. Надеюсь, мы услышим о других приложениях в ближайшие годы.

ГПТ-3 (2020)

GPT-3 — это новый продукт глубокого обучения, разработанный OpenAI. Я уверен, что все мы слышали о тесте Тьюринга. GPT-3 в настоящее время является лучшей попыткой человечества пройти его, и он быстро развивается. (Хотя некоторые выдвигают забавную гипотезу о том, что то, что отличает его от людей, — это неспособность признать, что он не знает ответа). Его способность создавать естественно звучащий текст или рабочий код из серии входных данных — это безумие.

В настоящее время много говорят о вариантах использования, таких как чат-боты и базовое программирование, но сильное применение продукта, которое я вижу для GPT-3 в будущем (как показано здесь), — это написание описаний продуктов и SEO-контента (или даже создание оригинальных изображений и иллюстраций, как здесь). Я могу назвать несколько компаний, которые выиграют от этого. Цена по-прежнему довольно высока, но я уверен, что она снизится по мере роста конкуренции.

Как и прежде, говоря об автоматизации, важно понимать, что на карту может быть поставлена ​​работа людей. Пожалуй, здесь это особенно актуально. Если вы подумываете об автоматизации задач, упомянутых выше, ищите способы превратить это в новые возможности для команд и отдельных лиц, а не наоборот.

Преобразование текста в речь и субтитры

Я не буду называть здесь какие-то конкретные продукты или фреймворки, так как их несколько.

Достаточно сказать, что автоматически генерируемый текст в речь и субтитры значительно ушли от роботизированных, неразборчивых комментариев и отсутствия разнообразия десятилетней давности. Теперь все, от роботов-помощников в чате до помощников по чтению, доступно на разных языках и с разными акцентами.

Один из вариантов использования, который мне особенно нравится, — это доступность. Раньше продукты с большим количеством видео не могли быть доступны для пользователей с нарушениями зрения. Теперь, хотя я не хочу говорить «легко» (ничто никогда не бывает легким), это гораздо более осуществимо.

Большое спасибо Alex Labram и Álvaro San José Feijóo за их вклад в эту статью.