Не слишком короткий, чтобы кастрировать их творческий потенциал, но достаточно короткий, чтобы сохранить вашу производственную среду и, в конечном счете, вашу организацию.

Наука о данных может быть мощным ресурсом для любой организации и их шансов победить в конкурентной борьбе. В мире, управляемом данными, возможность считывать изменения посредством анализа данных является большим преимуществом. Компании могут перехватывать клиентов, удерживать их, предлагать товары и услуги в соответствии с их интересами.

Тем не менее, у специалистов по данным очень широкий кругозор, и они, как правило, раскрывают слишком много своего творчества, ища закономерности там, где их нет, и идеи, которые, как правило, ошибочны, что приводит к ложным выводам.

Дело не в ценности специалистов по данным

Результат не зависит от способности специалистов по данным моделировать мир. В 99,9% случаев проблема не в этом. Специалисты по данным очень опытны, компетентны и способны определить лучшие модели для предсказания чего угодно. Они могут быть более чем компетентными, но в то же время неспособными определить, что лучше всего отвечает интересам организации, в которой они работают.

Управление их работой — это не акт вероломства, а всего лишь способ лучше определить периметр их моделирования. Иначе что-то может пойти не так, как я тут полусерьезно расписываю.

Первая проблема: неуправляемое творчество

Представьте себе ситуацию, когда бизнес-пользователь сидит перед специалистом по данным, который просит определить конкретный набор клиентов, которые хотят купить продукт. Звучит как детская игра для Data Scientist, который смотрит на парня перед собой, толком не глядя, поглощенный тысячей мыслей о том, что он может сделать. «Только набор клиентов? Да ладно, серьёзно… как минимум 127 разных кластеров». «Эти пользователи купят весь наш каталог на основе моих рекомендаций». И так далее.

В конце дня результат будет таким:

  • Data Scientist получит 83 422 кластера, но не тот, который нужен
  • Data Scientist найдет нужный кластер, устанет от него и будет искать следующий наилучший кластер клиентов, ожидаемый как минимум через 2 года.
  • Бизнес-пользователь будет ждать группы клиентов слишком долго, чтобы оставаться сосредоточенным и заинтересованным

Урок. Творчество — это хорошо, но только если оно применимо к реальности.

Вторая проблема: неуправляемые модели

Специалисты по данным хороши. Они учатся из любого возможного источника: магистратура, докторантура, вечера в пабах, кино! Все считается. Таким образом, после десятка обменов данными с бизнесом Data Scientist может определить правильный кластер клиентов. Это держит бизнес счастливым на некоторое время. Больше вечеров в пабе, выпивки и размышлений о следующих шагах.

До тех пор, пока самым обычным (на вид!) утром Data Scientist не возвращается к своему рабочему столу, не пьет любимый чай и не думает о новых идеях. Модель, предсказывающая правильный кластер для бизнеса, исчезла, затерявшись где-то в чьем-то ноутбуке. Математика, функции, обучение, тонкая настройка. Новая модель готовится к производству… жаль, что старая полностью забыта.

Что произойдет дальше:

  • Data Scientist забыл о первой модели
  • Бизнес продолжает продвигать «автоматический» прогноз (кто-то, кто запускает код) пару раз, а затем отказывается от него.
  • Больше никаких прогнозов, никаких выпивок, никаких мыслей.

Урок. Специалисты по данным хороши, но не слишком на них полагайтесь.

Третья проблема: специалисты по данным делают это лучше

Представьте себе красивый конференц-зал с видом на океан. Команда Data Science с одной стороны стола, команда маркетинга с другой. Маркетинговая команда говорит, команда Data Science слушает, раздраженная и разочарованная. Это продолжается часами. Маркетинг объясняет, чего они хотят, группе людей, яростно убежденных, что они могут добиться большего. «Мы слушаем данные, мы позволяем им говорить», — наконец кричит Data Scientist.

Что произойдет дальше:

  • Специалистам по данным требуются месяцы, чтобы разработать самые сложные модели, отвечая на вопрос, который они на самом деле не поняли.
  • Команда маркетинга продолжает работать над запутанными файлами Excel
  • На последней встрече никто никого не будет слушать. Чтобы остановить эту ситуацию, кто-то предлагает пойти выпить.

Урок:прежде чем делать, дайте специалисту по данным понять, что вы думаете.

Это конечно для шутки. Или, может быть, это не так, не так ли?