Наука о данных быстро развивалась за последнее десятилетие, спрос на специалистов по данным резко возрос, а рынок труда рос с поразительной скоростью.

В современном мире, управляемом данными, компании во всех отраслях ищут квалифицированных специалистов, которые могут использовать всю мощь данных для принятия бизнес-решений и роста. Но по мере развития области данных обязанности и навыки, требуемые от специалиста по данным, также трансформировались. В этой статье мы рассмотрим, как изменилась роль и что нужно, чтобы стать Data Scientist 2.0.

1. Специализируйтесь в одной области

Важно специализироваться в конкретной области, а не пытаться быть мастером на все руки. Науку о данных можно сравнить с науками о жизни или медициной в том смысле, что они состоят из широкого круга практик. Важно сначала освоить основы, а затем сосредоточиться на конкретных платформах, инструментах и ​​областях знаний, чтобы стать специалистом в своей области. Это позволит вам преуспеть в выбранной вами области и оказать более значительное влияние на вашу организацию.

Учтите также тот факт, что компании нанимают специалистов по данным для решения конкретных, иногда даже нишевых задач. Это особенно может быть применено к специалистам по данным, стремящимся стать старшим уровнем с ориентацией на продуктовые компании, а не на услуги.

2. Понимание бизнес-целей

Специалисту по данным важно понимать бизнес-причины выбора, который вы делаете. Это одна из причин, почему Business Scientist является одной из ожидаемых профессий. Четкое понимание цели перед анализом данных невероятно ценно. Вместо бесцельного поиска закономерностей более эффективно использовать научный подход, формулируя гипотезы на основе формальных моделей человеческого поведения, экономики, систем и т. д. и проверяя эти гипотезы. Это приведет к более успешному применению науки о данных.

Попробуйте внедрить методы машинного обучения с четкими целями. Начните с рассмотрения того, как можно улучшить качество обслуживания клиентов на высоком уровне, и получите прямое описание, связывающее бизнес-проблему с выбранными вами алгоритмами.

3. Инвестируйте в межведомственный опыт и улучшайте межличностные навыки

Наличие межведомственного опыта очень полезно для специалистов по данным. Лучшие специалисты по данным выступают связующим звеном между техническими и нетехническими командами. Таким образом, в дополнение к солидному техническому опыту, специалисты по обработке и анализу данных должны также обладать знаниями в предметной области в отделе или области, на которой они сосредоточены, например, в области продуктов, маркетинга, продаж или финансов.

Я видел и обучал специалистов, которые сделали знание предметной области своим основным оружием, и у большинства из них это успешно работало. Ваш уникальный опыт и сочетание навыков могут стать сильной стороной в науке о данных.

Межведомственная экспертиза

Помимо знаний в предметной области, специалисты по обработке и анализу данных должны иметь базовое понимание разработки мобильных устройств, серверной части, интерфейса и операций. Это позволяет им лучше понимать и общаться с командами инженеров, с которыми они работают. Знание того, как кодировать и проектировать интерфейсы, также может позволить специалистам по данным создавать свои собственные инструменты и прототипы, которые можно использовать для тестирования и проверки своих моделей и идей. Кроме того, это позволяет нам понимать и предвидеть технические ограничения и возможности различных методов сбора данных и принимать более обоснованные решения о том, какие инструменты и технологии использовать в своих проектах.

Совместная работа и социальные навыки

Сотрудничество имеет важное значение для науки о данных, поскольку несколько отделов работают вместе над ИТ-проектами. Сотрудничество, компромисс и установление четких границ и ожиданий необходимы. Распространенная проблема, с которой я ранее сталкивался перед учеными по данным, — это содействие сотрудничеству между отделами в сборе и интерпретации данных. Прогностические модели и исторический анализ настолько эффективны, насколько сильна договоренность команды относительно достоверности исходных данных. Между инженерами и группами обработки данных часто возникают несоответствия, поэтому между ними должна быть гармония, чтобы группа обработки данных могла точно собирать и анализировать качественные данные.

То же самое касается результатов науки о данных. Заранее продумайте, как часто будет использоваться ваша модель и ожидаемый результат. Например, при разработке модели, которая должна была работать в режиме реального времени, я выбрал более легкий метод, поскольку это был правильный компромисс, который мы согласовали с несколькими командами.

4. Эффективно общаться с коллегами, не являющимися техническими специалистами.

Объяснение технических концепций нетехнической аудитории имеет решающее значение для специалистов по данным. Тем не менее, это может разочаровать ученых, привыкших к использованию технической терминологии, которых должно быть больше. Команда данных должна эффективно общаться с аудиторией из других отделов, а также с руководителями и заинтересованными сторонами, которые могут не иметь четкого представления о тонкостях работы. Имейте в виду, что заинтересованные стороны обычно меньше интересуются технологиями и вместо этого ищут ключевые выводы и действия.

Современный специалист по данным, который не может четко объяснить свою модель и ее ценность для заинтересованных сторон, скорее всего, столкнется с трудностями в достижении успеха. Чтобы улучшить эту область, может быть полезно практиковать объяснение проблем с данными в ясной и легкой для понимания манере, подобно тому, как вы объясняете это члену семьи за праздничным ужином или если бы их было пятеро.

5. Посвятите время обработке данных

Значительная часть работы специалиста по данным — это работа с необработанными данными. Одной из основных проблем является выяснение того, как использовать данные, иногда включая извлечение, очистку, анализ и получение информации или построение моделей на основе данных. Работа с необработанными данными часто является негласной частью работы по науке о данных. Усилия ученого данных заключаются в создании чистого набора данных с полезной информацией, прежде чем можно будет применить какое-либо машинное обучение или статистические модели, что часто считается искусством или ремеслом. Как и любой художник или ремесленник, для конечного продукта требуется много невидимых усилий. Данные могут быть неполными, непоследовательными или предвзятыми, что затрудняет получение точных выводов даже на этапах исследования.

С увеличением объема генерируемых данных специалисты по данным часто сталкиваются с проблемой обработки больших данных. Для этого требуются специальные инструменты и методы для быстрой и эффективной обработки и анализа данных.

6. Будьте адаптируемыми и учитывайте контекст

Жесткий подход к решению проблем может ограничить ваш потенциал успеха. Непредвзятость к различным методам и корректировка вашего подхода в зависимости от уникальных обстоятельств могут привести к наилучшему результату. Эффективные специалисты по данным знают о нескольких способах решения задачи, каждый из которых имеет свои преимущества и недостатки, поэтому они могут выбрать наиболее подходящий метод для конкретного контекста. Это одна из причин, по которой вам нужно обращать внимание на разные подходы при изучении или построении карьеры в области науки о данных. Некоторые из них могут вам не понадобиться в течение длительного времени, но это поможет вам сохранить варианты открытыми.

Следите за новыми технологиями. Область науки о данных постоянно развивается, постоянно появляются новые технологии и методы. Специалисты по данным должны быть в курсе последних событий, чтобы оставаться конкурентоспособными.

7. Регулярно поддерживайте и документируйте работу

Регулярно поддерживайте свою работу, так как небольшие ошибки могут дорого обойтись. Раннее их обнаружение имеет решающее значение. Потратьте время на рефакторинг кода, проверку источников данных и документирование внесенных изменений. Всегда следите за внесенными обновлениями, так как производство и сцена отличаются друг от друга, как практика и теория. Скрытые зависимости данных, нестабильные источники данных и недокументированные предположения могут привести к неожиданным изменениям результатов при переобучении моделей.

Это особенно важно для специалистов по данным, которые являются частью более крупных технических команд. В этих случаях вы можете быть единственным человеком, который занимается наукой о данных как частью решения.

8. Учитывайте этику

Обеспечение того, чтобы данные использовались таким образом, чтобы уважать конфиденциальность людей, является одним из наиболее важных этических соображений специалистов по данным. Это влечет за собой защиту частной информации от несанкционированного доступа и информирование пользователей о том, как используется их информация. Ученые, работающие с данными, также должны следить за тем, чтобы их работа не усиливала неравенство во власти и не благоприятствовала определенным группам людей. Подумайте о любых возможных неожиданных последствиях вашей работы.

Алгоритмы и модели, разрабатываемые учеными, должны быть справедливыми и беспристрастными, чтобы избежать, например, сохранения ранее существовавших предубеждений или дискриминации. Крайне важно регулярно анализировать производительность модели и при необходимости вносить коррективы, чтобы предотвратить непредвиденные результаты.

9. Займитесь наукой о данных

Я видел, что иногда после прочтения статей, подобных той, которую вы сейчас читаете, упускается из виду один аспект. Вы можете начать копать глубже в одном направлении, понимать потребности бизнеса и работать над коммуникативными и социальными навыками.

Но помните, что основная обязанность специалиста по данным — заниматься наукой о данных. Он включает в себя методы статистики, машинного обучения и анализа данных для извлечения идей, знаний, шаблонов и тенденций из данных: ориентация на результат является обязательной.

Еще одна роль чистого специалиста по данным заключается в разработке и применении моделей машинного обучения для прогнозирования данных. Это включает в себя выбор подходящих алгоритмов машинного обучения, моделей обучения и настройки, а также оценку их производительности. Вы также можете заняться разработкой и реализацией экспериментов для проверки гипотез.

Для многих компаний наука о данных все еще неизвестна и находится в экспериментальной фазе — «применим ли мы?» и «должны ли мы нанять?». Им потребуется специалист по данным, чтобы показать потенциал области для их конкретного случая, поэтому овладение чистой наукой о данных имеет важное значение.

Полученные результаты

Давайте создадим таблицу, отображающую результаты профессии Data Scientist 2.0.

Сегодня специалистов по данным оценивают не только по их коду или статистике и МО. Реальность такова, что специалисты по данным тратят много времени на обработку больших и сложных наборов данных, иногда очищая их больше, чем занимаясь чистым машинным обучением. Но не стоит недооценивать роль мягких навыков.

Ожидается, что специалисты по данным должны иметь четкое представление о бизнес-целях и контексте проблемы. Они должны эффективно общаться с другими техническими и нетехническими коллегами и нести ответственность за результаты, которые они обеспечивают, работая в команде.

Назад к истокам

За последнее десятилетие роль специалиста по данным заметно изменилась. В начале 2010-х наука о данных все еще была относительно новой областью, в которой больше внимания уделялось техническим аспектам: коду, статистике и методам машинного обучения для анализа данных. Исследования и эксперименты получили первый зеленый свет, поскольку одной из основных целей специалистов по данным было выявление идей, тенденций и закономерностей.

По мере того как наука о данных развивалась и становилась более широко распространенной, основное внимание в этой области сместилось в сторону бизнес-приложений. Компании начали понимать ценность науки о данных для принятия бизнес-решений и стали больше инвестировать в команды специалистов по обработке и анализу данных. В результате ожидается, что специалисты по данным должны иметь четкое представление о бизнес-целях и задачах. Эффективное общение с нетехническими коллегами и участие в принятии решений стали постоянными навыками.

Повышенное внимание к бизнесу привело к большему акценту на сотрудничестве и социальных навыках. Специалисты по данным теперь тесно сотрудничают с другими командами, такими как менеджеры по продуктам и отделы маркетинга, чтобы понять их потребности и разработать решения, основанные на данных.

Выводы

В целом роль специалиста по данным значительно изменилась за последнее десятилетие: он перешел от технического к бизнес-ориентированному с более широким набором навыков.

Есть ли другие навыки, которые, по вашему мнению, требуются от современного специалиста по данным? Оставьте комментарий ниже!

Первоначально опубликовано на Linkedin

Ссылка

https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-centre

https://venturebeat.com/social/these-are-the-skills-you-need-to-be-a-data-scientist-at-facebook/