Сложные моменты работы маркетологом в области данных

Подсказка: не код.

Большинство должностных инструкций Data Scientist все чаще содержат требования к техническим навыкам, охватывающим области машинного обучения, программирования, инструментов и статистических знаний. Кандидаты постоянно пытаются догнать эти требования, загружая в свои резюме все известные термины из лексикона науки о данных, чтобы повысить свои шансы на совпадение, что, по иронии судьбы, с помощью программы, основанной на машинном обучении.

В моем ограниченном опыте практики в этой области работы, задачи, которые мне показались наиболее трудными, заключались в том, чтобы не выбирать метод моделирования или писать код, соответствующий модели, или визуализировать полученные результаты. Это другой набор компетенций, которые могут повысить или снизить шансы на успех в проекте.

Так что же сложного в том, чтобы быть специалистом по анализу данных в маркетинге, о котором я говорю?

Формулировка бизнес-вопросов

Для тех, кто какое-то время занимается этим ремеслом или для просвещенных душ в целом, это, вероятно, звучит очевидно. И все же очень легко начинать проекты с владельцами бизнеса, не задавая таких вопросов, как:

  • Какая гипотеза?
  • Каков окончательный вариант использования?
  • Какие рекомендации мы можем дать на основании этого анализа?

Бренд-менеджеры, планировщики и стратеги обычно приходят с конкретными запросами. Для них контекст, бизнес-цель и критический путь к ответу могут быть ясны. А может и нет. В любом случае извлечение этого контекста, повторение и фиксация бизнес-вопросов и использование их в качестве ориентира на протяжении всего выполнения проекта, безусловно, являются наиболее важными шагами для успеха проекта в области науки о данных. По крайней мере, это сводит к минимуму шансы произвести что-то несущественное. В лучшем случае это значительно улучшает результативность работы. В этом разница между «О, спасибо, полезно знать» и «Это фантастика! Мы учимся здесь новому ».

Сборка данных

Недавно разработанные специалисты по данным иногда считают, что идеальные данные для построения моделей находятся на расстоянии одного sql-запроса или просто существуют в ионосфере и могут быть загружены с помощью API, или это то, чем профессор поделится по электронной почте до того, как задание будет сдано. Маркетинг и понимание потребителей, оцениваемые по шкале качества данных, являются одной из самых сложных областей для работы аналитика. Я почти уверен, что немного самокритикуюсь, когда говорю это, но у меня есть веские причины.

Причина 1. Где данные?

В отличие от контролируемых исследовательских проектов и опросов, владельцы конвейера данных обычно не являются пользователями данных в маркетинговой функции. Если вам повезет, вы можете сидеть очень близко к ним (как и я), но у вас все равно разные приоритеты. Если вам не повезло, вы можете работать с синдицированными данными, агрегированными на ежемесячном уровне - так вы получите 12 точек данных для бренда за один год! Удачи вам в получении впечатляющих идей. Если вам действительно не повезло, вы услышите плавающий миф о том, что идеальные данные для вашего проекта существуют, но похоронены глубоко в забытой части корпоративной вселенной на стороне клиента (обычно это первые сборщики данных) и будут принимать 200 электронных писем и один много лоббирования, чтобы получить. Нет, я не циничен. Когда вы добавляете к этой территориальности, корпоративной разобщенности и естественной человеческой склонности к собственничеству в отношении ценных вещей, эта проблема становится очень реальной.

Причина 2: иерархий и таксономий

Сценарии использования в маркетинге предполагают объединение данных из различных источников (собственные и сторонние, в реальном времени и исторические, опросы и рекламные серверы), которые, как правило, не имеют универсального ключа. В мире маркетинга также нет универсальной таксономии, которая позволяет нам объединять различные наборы данных - от секторов до категорий верхнего уровня и подкатегорий до вариантов брендов и суббрендов - каждый поставщик данных / внутренняя команда следует различным соглашениям, которые явно не подходят для варианты использования, которые требуют объединения этих наборов данных вместе. Не существует единого поставщика иерархий категорий, брендов и их продуктов, и, как следствие, нет единого определения того, как можно сравнивать две вещи. Контекст, в котором можно сравнивать два бренда по метрике производительности, может быть согласован только с пользователями вашей работы. Этого можно избежать, убедившись, что "Что сопоставимо?" тщательно задокументирован. Это означает много работы по организации проекта и времени, затрачиваемого на повторную агрегацию наборов данных для вычисления показателей. Иногда это может занять дни, недели или даже месяцы. Единственное, что вы можете сделать, - это оставаться практичным с точки зрения графика. Это подводит меня к следующему сложному моменту в работе специалиста по данным в целом, но в большей степени в области маркетинга.

Правильное время и объем

Я называю это «зыбучими песками анализа». Это восходит к конфликту между идеальным и практичным! Попытка получить актуальную для бизнеса информацию, работая на время с использованием не очень совершенных наборов данных в заряженной офисной атмосфере, где у специалистов по данным чаще всего используется самый низкий уровень децибел, сама по себе является серьезной проблемой. В этих обстоятельствах крайне важно использовать суждения и общаться с другими заинтересованными сторонами, чтобы знать, как далеко вам нужно продвинуться в своей работе, чтобы сделать ее эффективной. Вернемся к пословице о том, что разумное приближение во времени стоит намного больше, чем идеальный ответ, который приходит слишком поздно. Несколько советов, которые помогут избежать зыбучих песков анализа:

  • Всегда следите за исходными вопросами и вариантами использования в ходе поиска и уменьшайте размер данных в зависимости от того, что требуется для получения ответов.
  • Определите детализированную структуру проекта, то есть дерево решений, основанное на выводах на каждом этапе анализа. Хотя это звучит совершенно несложно, мы часто пропускаем это. Как следствие, чрезмерное количество времени тратится на изучение тем и веток, которые не помогают нам лучше отвечать на вопросы бизнеса. Простой мысленный эксперимент, который выглядит примерно так:
  • а) Что вы ожидаете найти на высшем уровне? (б) Что следует изучить на основе результатов исследования верхнего уровня? © Что произойдет, если результат не согласуется с гипотезой? (г) Когда менять рельсы или прекращать проект?
  • Если не в самом начале, где-то после первоначального исследования данных, составьте скелетную презентацию или раскадровку для анализа в соответствии с объемом, обсуждаемым с владельцами бизнеса.

Конечно, есть и другие сложные вещи, такие как выбор правильной аналитической основы, моделей и статистической техники, настройка параметров, интерпретация результатов, задачи кодирования на этом пути, использование множества API-интерфейсов и сложного SQL, масштабирование больших наборов данных, которые не помещаются в памяти, отображение вывода, создание повторно используемого кода, работа с командной строкой Linux и т.д. Но в том, что я упоминал ранее, ключевыми факторами являются опыт, рассудительность и хорошие менеджеры. Мой совет специалистам по обработке данных, которые хотят сделать карьеру в индустрии маркетинга: продолжайте обновлять кодирование и технические навыки, но, что более важно, начните говорить на языке маркетинга, научитесь задавать правильные бизнес-вопросы, потренируйтесь работать с организационной структурой, чтобы определить и получить правильные данные. Эти часто упускаемые из виду навыки будут лучше служить нам в настоящее время, но, что более важно, в долгосрочной перспективе. Согласен?