Один из вопросов, который мне задавали мои друзья, компании которых начинают набирать обороты: как нанять специалиста по обработке и анализу данных?

Многие компании еще не уверены, нужен ли он им и с чего вообще начать. В этом посте я расскажу, какое название должности использовать и в чем различия.

Первое, что нужно понять при найме специалиста по данным, — это тип навыков, которые вы ищете. В Microsoft большая часть кода, который мы писали как специалисты по обработке и анализу данных, была написана на языке, производном от SQL, для работы с большими данными. Мы также использовали Python, иногда C#, Javascript, CSS/HTML.

Это вполне соответствует общепринятому определению специалиста по данным:

Что во многом совпадает с работой аналитика данных:

Обратите внимание, что аналитик данных о должностях похож на бизнес-аналитика, но отличается от него. Аналитики данных обычно более техничны, лучше знают и используют статистику.

Определение аналитика данных может меняться в зависимости от компании и команды. Например, в Microsoft команда экспериментаторов использовала название должности аналитик данных, хотя они активно использовали расширенную статистику, а многие члены команды имели ученые степени.

Сравните специалиста по данным с инженером данных. Инженер данных отвечает за то, чтобы ученые и аналитики данных могли выполнять свою работу. Инженер данных — это особый тип инженера-программиста, обладающий навыками как в конвейерах данных, так и в реализации баз данных.

На другом конце технического спектра аналитика данных находится ученый-исследователь, иногда также называемый ученым-прикладником:

Хотя специалисты по данным используют инструменты статистики и машинного обучения, в отличие от ученых-исследователей, работа специалистов по данным требует более тесной связи с принципами продукта, такими как исследования пользователей и сегментация рынка.

Ученые-исследователи, как правило, имеют ученую степень и активно работают над продвижением новейших достижений в прикладной науке. Подумайте о беспилотных автомобилях, распознавании лиц и глубоком обучении. Если работа связана с какой-либо приборной панелью, то она не для ученого-исследователя.

Большая часть кода, написанного учеными-исследователями, может быть одноразовой или предназначена для одного анализа. Сравните это с инженером данных, который пишет код, который можно использовать в производстве и в масштабе. Ученые-исследователи обычно работают с определенным типом инженера данных, который называется инженером по машинному обучению, когда запускают модели в производство.

Следующее, на что стоит обратить внимание, — это иерархия потребностей в науке о данных от Моники Рогати:

Для производственных систем иерархия науки о данных требует прочной базы надежной обработки данных. С другой стороны, для новых проектов может потребоваться исследование, чтобы определить, технически осуществимы ли идеи.

Наем на неправильную должность для нужд вашей организации является распространенной ошибкой и приводит к снижению морального духа и неэффективности сотрудников. Вы бы не наняли эксперта по маркетингу на должность продавца, не так ли?

При этом ранний наем должен быть кем-то, кто может носить много шляп. Хорошие кандидаты встречаются очень редко, поэтому ничего страшного, если их поиск займет некоторое время. У хороших кандидатов есть много вариантов, поэтому, когда предложение будет расширено, ожидайте, что оно будет одним из многих, которые они получат.

Когда мы впервые начали искать специалиста по данным в Microsoft, нам потребовалось около 9 месяцев, чтобы нанять кого-то, несмотря на то, что мы продлили 5 предложений!

В следующем посте я рассмотрю несколько простых вопросов по науке о данных.

Ваше здоровье,

Адриан

Первоначально опубликовано на http://www.datascientistinterview.com 14 мая 2019 г.