В чем секрет превращения в единорога в науке о данных?

Роли в аналитике и приобретение навыков, чтобы стать «бесценными»

У каждого соискателя науки о данных возникает вопрос «Какие навыки мне нужны для работы в отрасли?», за которым следует «Как я могу стать востребованным на этом рынке труда?» В то время как в отрасли наблюдается перекос спроса и предложения в пользу подготовленных профессионалов, добиться правильного сочетания навыков непросто.

Теперь всем известно, что «специалист по данным - самая сексуальная работа века». Но к какой роли это относится? Само упоминание этого названия вызывает в воображении образы волшебников-математиков, изучающих многомерное исчисление и линейную алгебру, или компьютерных гиков, создающих следующий общий искусственный интеллект.

Кроме того, на вас нападают загруженные диаграммы Венна, которые требуют овладения обширным списком навыков. Все это складывается из областей, которые команда людей могла освоить среди них на протяжении многих лет. Специалист по анализу данных - это широко используемый термин, который широко используется в отрасли. Совсем как Big Data или, скажем, AI.

На практике это название часто используется в качестве обобщающего термина для связанных ролей и по-разному интерпретируется компаниями в отрасли. Я встречал много людей, которые признавались мне наедине: «Дайте мне любую работу и роль, но, пожалуйста, дайте мне название должности с игрой этих двух слов -« данные »и« ученый »!

Итак, что нужно, чтобы войти в науку о данных и преуспеть в ней?

Разжигаемые такой путаницей, люди задаются вопросом, должны ли они изучать программирование, чтобы сделать карьеру в области науки о данных. Для других статистика или машинное обучение могут не быть их уделом. Тогда они кажутся камнями преткновения для любых достижений в области аналитики.

Это особенно ставит в тупик латералов, которые проявили интерес к данным, но, скажем, 10 лет проработали на посторонней должности в другой отрасли. Их ставит в тупик предположение о необходимости заново изучить кодирование или дизайн, чтобы начать карьеру. Эти заблуждения должны быть решительно развеяны, иначе они продолжат разрушать мечты о карьере в области науки о данных.

Итак, каковы реальные ожидания от навыков, необходимых для карьеры в области науки о данных? И могут ли кандидаты выбирать навыки, представляющие интерес, чтобы получить желаемую роль, основанную на сильных сторонах и пользующуюся спросом?

Да!

Сначала мы расскажем о спектре навыков, которые необходимы в науке о данных, например о меню шведского стола. Затем мы построим ключевые отраслевые роли, которые обеспечивают ценность аналитики, выбирая из этих навыков, например, индивидуальный обед. И да, мы также раскроем секрет того, как стать единорогом в этой индустрии.

Спектр навыков в области науки о данных

Есть 5 навыков, которые занимают центральное место в науке о данных. Чтобы еще раз подчеркнуть это, нет, не нужно изучать их все. В следующем разделе мы рассмотрим роли и набор навыков, которые предполагает каждая роль. Во-первых, давайте поговорим о полном списке компетенций, необходимых в проекте, чтобы обеспечить ценность для бизнеса.

1. Навыки Data Bootstrap (или) Информационная грамотность

Страсть к цифрам - предпосылка успеха в науке о данных и большое преимущество. Чтобы получить представление о данных, необходимо овладеть навыками обработки данных - вычислять средние значения, составлять кросс-таблицы и извлекать базовые идеи с помощью исследовательского анализа. Это подход, который имеет значение, и подойдет любой инструмент, например, Excel, R или SQL.

Выводы из анализа и результатов методов обработки данных подобны нешлифованному алмазу. Они ценны для натренированного глаза, но бесполезны на рынке. Бесценно овладеть навыками презентации и базовыми навыками дизайна, чтобы отточить эти крупицы идей. Это делает ваши усилия эффективными и стоящими.

Обработка данных и базовый дизайн должны дополняться хорошей ориентацией выбранной области. Методы работы с данными хороши лишь в том случае, если они адаптированы к бизнес-задачам. Эти базовые знания нельзя передать бизнес-аналитику, поэтому любой, кто серьезно относится к науке о данных, должен изучить основы предметной области.

Короче говоря, этот навык требует, чтобы человек подружился с данными и научился распознавать закономерности в числах. Это фундаментальный навык, который не подлежит обсуждению в аналитике.



2. Информационный дизайн и презентация

Информационный дизайн - это представление данных таким образом, чтобы способствовать эффективному и действенному пониманию. Акцент делается на визуальном дизайне, который позволяет использовать данные, а не просто на украшении. Визуализация - это последняя миля коммуникации, которая позволяет пользователям получать пользу от аналитики.

Чтобы стать экспертом в этой области, необходимо овладеть навыками проектирования, охватывающими области дизайна взаимодействия, взаимодействия с пользователем и визуализации данных. Это требует опыта в картографировании пользователей, информационной архитектуре, представлении данных, каркасных схемах, высокоточном дизайне и визуальной эстетике.

Наибольшая ценность картины - это когда она заставляет нас замечать то, что мы никогда не ожидали увидеть - Джон Тьюки



3. Статистика и машинное обучение

В большинстве курсов по науке о данных этой области уделяется львиная доля внимания. Основное внимание здесь уделяется статистике и моделированию, в то время как создание сценариев или программирование является второстепенным навыком. Хотя это ключевая область для извлечения ценности из данных, чрезмерный акцент здесь может отвлечь внимание от других 4 ключевых навыков в области науки о данных.

Опираясь на базовые навыки обработки данных, нужно глубже погрузиться в статистику, вероятность, а затем перейти к методам и алгоритмам машинного обучения. Глубокое обучение и другие современные методы искусственного интеллекта также попадают в это ведро, но они требуют более обширных навыков программирования.



4. Глубокое программирование

Люди с базовым опытом программирования хорошо разбираются в науке о данных, и им не обязательно приобретать навыки машинного обучения. Приложения для обработки данных требуют внутреннего кодирования для подключения и обработки данных, требуют тяжелой работы с обработкой данных и построением внутренних компонентов приложений для анализа данных.

Также существует острая потребность в навыках внешнего программирования, чтобы продемонстрировать пользователям понимание данных, и именно здесь резина действительно встречается с дорогой. Необходимо освоить обработку и представление данных в различных пользовательских интерфейсах и форм-факторах. Популярны такие языки, как Python, Java, Javascript, R, SQL.



5. Экспертиза в предметной области

Навыки в глубокой предметной области помогают придать аналитике смысл, интерпретируемость и действенность. Невозможно переоценить важность сочетания опыта в предметной области с навыками работы с данными. Недостаток внимания к этой области на протяжении всего проекта является наиболее частой причиной неудач инициатив.

Первым шагом здесь является углубление в выбранной области и освоение бизнес-потоков. Затем необходимо сосредоточиться на информационной грамотности и концептуальном понимании аналитических методов. Это дает ноу-хау, чтобы сплести плотную ткань, комбинируя навыки предметной области с обработкой данных, чтобы получить превосходную ценность.

«Если вы не знаете, как задать правильный вопрос, вы ничего не обнаружите. - У. Эдвард Деминг »

Роли в науке о данных

Теперь, когда мы увидели распространение навыков, они объединяются, чтобы сформировать следующие 4 основные роли в аналитике. Эти роли можно найти в каждом магазине, который серьезно относится к предложениям в области науки о данных. Обычно они выделяются как отдельные роли, как описано здесь, или смешиваются в некоторые перекрывающиеся комбинации.

Учитывая развивающееся состояние отрасли, назначение должностей довольно гибкое. Хотя мы уже видели, что "специалист по данным" - это широко используемое название, часто используемое для привлечения талантов, что может означать такая роль, как "ниндзя данных", остается только догадываться! Здесь я использовал названия, близкие к тем, которые мы разработали за последние 7 лет, в Gramener.

1. Инженер по обработке и анализу данных (или) инженер по машинному обучению

Под этим названием подпадают люди, сочетающие навыки начальной загрузки данных с глубоким программированием (интерфейсное, внутреннее или полное). Эти роли имеют решающее значение при программировании приложений, интеграции и облачной реализации приложений для обработки данных. Помимо глубоких навыков программирования, это требует мастерства в обработке данных, автоматизации анализа и сквозной реализации приложений. В некоторых организациях на этом карьерном пути ведущая роль отводится специалисту по данным.

2. Специалист по анализу данных (или) специалист по данным

Это люди, которые дополняют основной объем данных навыками статистики и машинного обучения. Хотя они являются авторитетом в разработке аналитического подхода и построении моделей, они используют свои базовые навыки программирования и ориентацию на предметную область для реализации и оценки интерпретируемости моделей.



«Что расстраивает специалистов по данным в проектах по машинному обучению?
Аналитические презентации часто обещают успех. В этом фантастическом мире ожиданий клиентов эти 8 мифов разрушают…



3. Информационный дизайнер или дизайнер визуализаций

Дизайнеры с базовыми навыками UI и UX, которые также обладают прочной базой в фундаментальных навыках работы с данными, соответствуют требованиям Information Designer. Они играют важную роль от концептуализации до создания историй данных. Удерживая пользователей в центре вселенной, они многократно управляют дизайном слоя визуального интеллекта.



4. Консультант по функциональным данным (или) переводчик данных

Консультанты по функциональным данным действуют как мост между бизнес-пользователями и командой специалистов по анализу данных, сочетая свои знания в предметной области с необходимыми навыками работы с данными. Оказывая сильное влияние на команду, они привлекают клиентов к вариантам использования на основе данных, сохраняя при этом аналитическое решение бизнес-ориентированным и действенным.

Превращение в единорога в науке о данных

Эти 4 ключевые роли в науке о данных показывают, как люди с разным опытом - программированием, статистикой, дизайном и предметной областью - могут превратить свои врожденные навыки в влиятельную роль в аналитических проектах. Именно прочная основа, дополненная страстью к данным и бизнес-приложениям, делает их бесценными для организаций.

Если специалисты по качеству на этих 4 должностях пользуются большим спросом в отрасли и их не хватает, что же тогда делает Unicorn в науке о данных? Что это за волшебная смесь, которая может сделать человека бесценным?

Воссоздавая наше меню «шведского стола» по науке о данных, эта превосходная способность рождается, когда отсюда можно проверить любые 3 навыка с исключительным уровнем мастерства в каждом. Как говорится, задним числом всегда кажется проще. Давайте рассмотрим несколько сочетаний навыков и посмотрим, в каких областях эти люди могут быть незаменимыми.

  • Загрузка данных + статистика, машинное обучение + глубокое программирование: эксперт, который делает тяжелую работу по созданию полностью упакованных продуктов для обработки данных.
  • Начальная загрузка данных + статистика, ML + домен Deep: эксперт, который разрабатывает и создает прототипы глубоких, вертикальных приложений для обработки данных.
  • Загрузка данных + информационный дизайн + глубокое программирование: мастер-рассказчик, создающий восхитительные приложения для обработки данных.
  • Начальная загрузка данных + информационный дизайн + углубленная область: эксперт, который занимается консультированием по UX на уровне предметной области для разработки корпоративных приложений для обработки данных.
  • Загрузка данных + Глубокая область + Глубокое программирование: атрибуты этого редкого техно-функционального эксперта в области науки о данных.

Как вы можете видеть выше, добавление еще одного навыка в области обработки данных с высоким уровнем знаний может изменить роль человека. Это имеет гораздо больший эффект, так как способности, вклад и ценность человека катапультируются за пределы парка.

Вы можете спросить, а что, если вы сможете набрать 4 или более из этих навыков? Что ж, тогда считайте себя полубогом в науке о данных. Или, как гласит знаменитая кампания MasterCard, ваша ценность в отрасли науки о данных становится "Поистине бесценной!"

Резюме

Проекты в области науки о данных требуют сочетания ключевых навыков для успешного решения проблемы клиента. Часто должностные инструкции компании для одной должности могут указывать на большую часть или все эти навыки. Учитывая огромный разброс способностей кандидатов, это всего лишь попытка получить как можно больше совпадений.

Один человек - не команда. Требуется одиннадцать. - Медведь Брайант, легендарный футбольный тренер

В действительности, проектные группы динамически укомплектовываются персоналом с различным набором ролей в зависимости от уровня основных навыков людей. Могут быть аналитические инициативы, которые позволят добиться такого сочетания среди 3 человек, в то время как другие могут привлечь 5 человек. Обычно организации предпочитают небольшие команды с междисциплинарными навыками для лучшей координации и более эффективных результатов.

Разве люди не входят в отрасль без предлагаемого набора навыков работы с базами данных или с недостатком знаний в ключевой области навыков? Да, но тогда их уровень вклада - это тень от других, и все сводится к вопросу выживания по сравнению с процветанием в области науки о данных.

Чем глубже кандидат владеет двумя или более из вышеперечисленных областей навыков, тем лучше он будет подготовлен к тому, чтобы внести важный вклад. Следовательно, это приводит к более высокой воспринимаемой ценности и, следовательно, к гораздо большей переговорной силе во время собеседований. Чтобы продвинуться дальше в игре, нужно сознательно выбрать другой навык и инвестировать в себя, действительно углубившись.

Для максимальной отдачи вложите кошелек себе в голову. - Бенджамин Франклин.

Если вам это показалось интересным, вам понравятся эти статьи, написанные мной:

Вы увлечены наукой о данных? Не стесняйтесь добавлять меня в LinkedIn и подписываться на мою Информационную рассылку.