Один из вопросов, который мне задавали мои друзья, компании которых начинают набирать обороты: как нанять специалиста по обработке и анализу данных?
Многие компании еще не уверены, нужен ли он им и с чего вообще начать. В этом посте я расскажу, какое название должности использовать и в чем различия.
Первое, что нужно понять при найме специалиста по данным, — это тип навыков, которые вы ищете. В Microsoft большая часть кода, который мы писали как специалисты по обработке и анализу данных, была написана на языке, производном от SQL, для работы с большими данными. Мы также использовали Python, иногда C#, Javascript, CSS/HTML.
Это вполне соответствует общепринятому определению специалиста по данным:
Что во многом совпадает с работой аналитика данных:
Обратите внимание, что аналитик данных о должностях похож на бизнес-аналитика, но отличается от него. Аналитики данных обычно более техничны, лучше знают и используют статистику.
Определение аналитика данных может меняться в зависимости от компании и команды. Например, в Microsoft команда экспериментаторов использовала название должности аналитик данных, хотя они активно использовали расширенную статистику, а многие члены команды имели ученые степени.
Сравните специалиста по данным с инженером данных. Инженер данных отвечает за то, чтобы ученые и аналитики данных могли выполнять свою работу. Инженер данных — это особый тип инженера-программиста, обладающий навыками как в конвейерах данных, так и в реализации баз данных.
На другом конце технического спектра аналитика данных находится ученый-исследователь, иногда также называемый ученым-прикладником:
Хотя специалисты по данным используют инструменты статистики и машинного обучения, в отличие от ученых-исследователей, работа специалистов по данным требует более тесной связи с принципами продукта, такими как исследования пользователей и сегментация рынка.
Ученые-исследователи, как правило, имеют ученую степень и активно работают над продвижением новейших достижений в прикладной науке. Подумайте о беспилотных автомобилях, распознавании лиц и глубоком обучении. Если работа связана с какой-либо приборной панелью, то она не для ученого-исследователя.
Большая часть кода, написанного учеными-исследователями, может быть одноразовой или предназначена для одного анализа. Сравните это с инженером данных, который пишет код, который можно использовать в производстве и в масштабе. Ученые-исследователи обычно работают с определенным типом инженера данных, который называется инженером по машинному обучению, когда запускают модели в производство.
Следующее, на что стоит обратить внимание, — это иерархия потребностей в науке о данных от Моники Рогати:
Для производственных систем иерархия науки о данных требует прочной базы надежной обработки данных. С другой стороны, для новых проектов может потребоваться исследование, чтобы определить, технически осуществимы ли идеи.
Наем на неправильную должность для нужд вашей организации является распространенной ошибкой и приводит к снижению морального духа и неэффективности сотрудников. Вы бы не наняли эксперта по маркетингу на должность продавца, не так ли?
При этом ранний наем должен быть кем-то, кто может носить много шляп. Хорошие кандидаты встречаются очень редко, поэтому ничего страшного, если их поиск займет некоторое время. У хороших кандидатов есть много вариантов, поэтому, когда предложение будет расширено, ожидайте, что оно будет одним из многих, которые они получат.
Когда мы впервые начали искать специалиста по данным в Microsoft, нам потребовалось около 9 месяцев, чтобы нанять кого-то, несмотря на то, что мы продлили 5 предложений!
В следующем посте я рассмотрю несколько простых вопросов по науке о данных.
Ваше здоровье,
Адриан
Первоначально опубликовано на http://www.datascientistinterview.com 14 мая 2019 г.