Женщины в науке о данных

8 самых распространенных вопросов, которые мне задают как специалист по анализу данных

Отвечая на вопросы, меня чаще всего спрашивают при общении со студентами

В прошлом году я начал говорить со студентами колледжа о карьере в области науки о данных. Во время этих мероприятий я часто говорю о навыках, которые я приобрел во время учебы в магистратуре, и о том, как они были перенесены на рабочее место. Мне задают много вопросов от студентов, которые хотят попасть в область науки о данных, но некоторые вопросы встречаются чаще, чем другие. При этом я хотел бы поделиться с вами наиболее частыми вопросами, которые я получил в 2020 году, с соответствующими ответами.

Вот список из восьми наиболее часто задаваемых вопросов:

  1. Поскольку наука о данных - это в основном степень магистра, как вы думаете, насколько сложно будет найти работу со степенью бакалавра в области науки о данных?
  2. Сколько из того, что вы узнали в школе, вы регулярно используете?
  3. Является ли машинное обучение обычным явлением в вашей ситуации?
  4. Как выглядит обычный день специалиста по данным?
  5. Почему вы выбрали науку о данных в качестве карьерного пути?
  6. У вас есть интерес к самолетам, или вам было бы хорошо поработать специалистом по данным в другой области?
  7. С какими уникальными проблемами вы сталкиваетесь как специалист по данным?
  8. Как баланс между вашей карьерой специалиста по данным и другими частями вашей жизни?

1. Поскольку наука о данных - это в основном степень магистра, насколько сложно, по вашему мнению, будет найти работу со степенью бакалавра в области науки о данных?

Некоторое время назад я написал статью, более подробно отвечая на этот вопрос. В целом, исследования показывают, что вы можете начать свою карьеру со степени бакалавра или учебного лагеря по науке о данных, но для дальнейшего продвижения вам следует рассмотреть возможность получения ученой степени STEM. Требования будут отличаться от работы к работе и от компании к компании.

Я решил пойти в школу, чтобы получить степень магистра в области науки о данных, чтобы получить соответствующие знания в области науки о данных и бизнес-навыки в академической среде. Благодаря программе, в которой я участвовал, я приобрел опыт работы над исследовательскими проектами и написания статей для публикации. Я обнаружил, что это было полезно для меня, так как мне нравится больше ориентироваться на исследовательскую работу. В зависимости от программы вы можете работать над отраслевыми исследовательскими проектами, еще учась в школе. Программа, в которой я участвовал, позволила мне работать в компании в Бостоне в последний семестр. Проект заключался в разработке библиотек, которые помогут автоматизировать сбор, очистку и предварительную обработку данных. Я нашел этот проект полезным, поскольку он показал мне, какой тип работы возможен при работе с данными.

Получая степень в области науки о данных, многие люди могут думать о данных ученых как о главном пути своей карьеры. Тем не менее, вы можете выбрать множество других путей, например инженера данных, инженера-программиста, инженера по машинному обучению и т. Д. Основным недостатком получения еще одной степени для меня было время и деньги, которые я мог вложить. Если вам придется заплатить за свой счет или получить ссуду, обучение в колледже может быть дорогостоящим, а получение второй степени может занять еще 1-2 года. Для меня плюсы перевесили минусы, и я вернулся в школу.

Совет: найдите нишу, которая вам нравится в науке о данных, и сосредоточьтесь на развитии своих навыков в этой области.

2. Сколько из того, чему вы научились в школе, вы регулярно используете?

Первичные навыки, которые я приобрел во время учебы в бакалавриате, я получил на уроках информатики. Эти классы обсуждали объектно-ориентированное программирование, базы данных, алгоритмы и структуры данных. Когда я перешел из компьютерной инженерии в науку о данных, я вернулся в школу, чтобы получить степень магистра. На моей нынешней должности я использую многие навыки, полученные во время учебы в магистратуре. Основные из них, которые я использую ежедневно:

  • Базы данных. В зависимости от того, чем вы занимаетесь, навыки работы с базами данных могут различаться. По крайней мере, знайте, как считывать данные из базы данных во все, что вы используете. Используя такой инструмент, как Tableau, вам нужно будет научиться подключать источники данных. Но если вы пишете код на Python или R, знайте, как писать соединения, необходимые для получения ваших данных. Если вас больше интересует инженерия данных, вам следует больше узнать о создании и оптимизации источников данных, включая базы данных NoSQL и SQL.
  • Очистка и предварительная обработка данных - это обширная область навыков, которая включает в себя вменение значений, работу со значениями NaN / Null и преобразование или создание новых столбцов данных для извлечения значения из существующих столбцов. Обратите внимание на то, что вы изучаете здесь, и на то, как вы можете применить их к различным наборам данных. Вы действительно потратите много времени на проверку и очистку ваших реальных данных.
  • MapReduce - обработка больших данных может занять длительное время. MapReduce используется с большими данными для выполнения параллельных распределенных алгоритмов в кластерах. Я ежедневно работаю с данными не менее 10 ТБ и часто нахожу MapReduce очень удобным для ускорения анализа. Очень полезно научиться использовать MapReduce в Spark или Hadoop.
  • Визуализация данных. Создание информационных панелей, отчетов и ключевых показателей эффективности, полезных для бизнеса и дающих ценную информацию, является обязательным. Я часто узнаю о новых инструментах и ​​методах визуализации данных, с которыми работаю. Очень помогли занятия, посвященные этой теме. Визуализация данных и рассказывание историй так часто возникают в науке о данных.

Совет. Выберите навыки, на которых вы хотите сосредоточиться и чему научиться, в зависимости от того, какую работу вы хотите иметь. Например. Если вы собираетесь заниматься разработкой данных, сконцентрируйтесь на базах данных и научитесь создавать большие наборы данных.

3. Вы считаете машинное обучение обычным делом?

да. Машинное обучение - обычное дело в науке о данных. Поскольку я быстро развиваюсь, я трачу много времени на изучение новых методов, определение того, что применимо к моей работе, и чтение текущих опубликованных исследований. Моя философия заключается не в том, чтобы начинать с машинного обучения, а с проблемы. Когда я определил проблему, я могу приступить к ее решению. Вы можете быть удивлены, узнав, что машинное обучение - не всегда лучший вариант. Вам нужно выбрать технику, которая лучше всего подходит для выполняемой вами работы.

Урок: начните с проблемы. Определив проблему, вы можете приступить к разработке решения, которое ей подходит.

4. Как выглядит обычный день специалиста по данным?

Мой день, как правило, посвящен трем основным направлениям: спринт, планирование проектов / дорожная карта и исследования.

Работа в спринте. Эта работа относится к большинству задач, которые я выполняю во время спринта. Работа спринта может включать исправление ошибки в коде, создание новых функций в библиотеке или выполнение анализа некоторых данных на основе отзывов клиентов по проблеме. Спринт - это моя запланированная трехнедельная работа.

Планирование проекта и дорожная карта. Я возглавляю команду своей группы и поэтому трачу время на устранение отставания в работе, добавление новых концепций и дорожную карту того, как выглядят предстоящие месяцы. В течение этого времени я работаю с заинтересованными сторонами и другими членами команды, чтобы добавить информацию там, где это необходимо, и план действий на следующие несколько месяцев.

Исследование. Если я не занимаюсь одним из двух вышеперечисленных, то я изучаю, что есть на рынке, новые методы, которые появились, и способы решения проблем, с которыми мы сейчас сталкиваемся. Как упоминалось ранее, наука о данных - это вращающаяся дверь новых идей, концепций и учений. Вы потратите много времени на изучение того, что получилось, и применимо ли это к вашей работе или нет. Мое исследование может быть частью моей работы по спринту или планирования проекта. Это зависит от того, что я делаю на этой неделе.

Урок: ваш день будет зависеть от типа выбранной вами роли. Убедитесь, что вы выбрали то, что соответствует вашей должности.

5. Почему вы выбрали науку о данных в качестве своей карьеры?

Изначально я не выбрал науку о данных; он выбрал меня. Я поступил в колледж по специальности «Английский язык» и проучился в течение двух лет, прежде чем перейти в другой колледж и стать инженером-компьютерщиком. Именно на последнем курсе бакалавриата я начал исследовать свою любовь к данным. Я работал над исследовательским проектом, который требовал от меня приема данных с датчиков и ввода данных пользователем для анализа. Именно тогда я подумал, что изначально хочу стать инженером по встроенным системам. Некоторое время я исследовал эту идею, прошел еще несколько курсов по программированию встраиваемых систем и проектированию микросхем, а затем прошел стажировку.

Чем больше я изучал данные для встроенных систем, тем меньше мне хотелось стать встроенным инженером. Затем я поступил в магистратуру по науке о данных. По мере того, как я посещал больше занятий и работал с разными наборами данных, я начал получать удовольствие от задач, связанных с большими данными. Наука о данных - это развивающаяся область, которая позволяет вам взаимодействовать с людьми любого происхождения. Каждый день он ставит новые задачи, а с дополнительными данными приходится решать дополнительные проблемы. Изначально я не выбрал науку о данных, она выбрала меня, и я рад, что она сделала это.

Урок: жизнь - это не прямой путь. В нем будет много перипетий. Вы можете не знать, где окажетесь, и это нормально.

6. У вас есть интерес к самолетам или вам было бы хорошо поработать специалистом по обработке данных в другой области?

Изначально я интересовался Интернетом вещей (IoT) и домашней автоматизацией. Когда я начал искать другую работу, так случилось, что работа, которая меня заинтересовала, была в аэрокосмической сфере. С тех пор, как я начал работать в аэрокосмической отрасли, я получил огромное удовольствие и многое узнал о самолетах. Хотя я был бы не против поработать в другой области, я вижу, что пока что останусь в авиакосмической сфере.

Я смотрю на это так: вы можете либо обобщить, либо специализировать на том типе данных, с которым хотите работать. Если вы обобщаете, вы не против переключиться на другие области, но понимаете, что вы будете больше полагаться на экспертов в предметной области »(SME), чтобы понять ваши данные. Если вы специализируетесь, вы станете SME в этой области по мере того, как приобретете больше опыта работы с вашими данными.

Урок: ваши интересы могут со временем меняться. Вы можете начать с обобщения своих навыков, а затем специализироваться на конкретном типе данных. Это нормально. Найдите то, что работает для вас и что вам нравится делать.

7. С какими уникальными проблемами вы сталкиваетесь как специалист по данным?

С каждой работой связаны разные задачи. Три интересных проблемы, с которыми я столкнулся в области науки о данных, - это эволюция космоса, чистота данных и паралич анализа.

  • Эволюция методов. Всегда есть чему поучиться. Сосредоточьтесь на том, что вам нужно знать, а затем расширьте свой кругозор до того, что вас интересует. Я часто читаю исследовательские работы и смотрю различные выступления, чтобы узнать, что нового в этой области. Может быть непросто определить, какие новые идеи вам следует изучить и применить к вашей работе.
  • Чистота данных - идеального набора данных не существует, хотя я бы хотел, чтобы это было. Каждый набор данных сопряжен с уникальным набором задач по очистке, предварительной обработке и использованию для получения достоверной информации. Чем больше я работаю с данными, тем больше узнаю о том, как их очистить и что искать.
  • Аналитический паралич - легко увлечься анализом и размышлениями. Если я получу немного больше данных или немного подправлю свой внешний вид, я могу получить идеальный результат. Было бы хорошо, если бы вы узнали, когда это нужно сделать. Этому навыку сложно научиться, но со временем он придет.

Совет: наука о данных полна проблем. Примите вызовы и найдите полезные решения для них.

8. Как баланс между вашей карьерой специалиста по данным и другими частями вашей жизни?

Я тот, кто твердо верит в баланс между работой и личной жизнью, но не на каждой работе это возможно. Вам нужно понять, что вы ищете с точки зрения баланса, и определить это для себя. Если работа 80+ часов в неделю не для вас, не соглашайтесь на работу, которая требует этого. Независимо от того, какую должность я занимал, я искал компании, которые понимают, что их сотрудники живут вне работы. Я считаю, что моя нынешняя роль сбалансирована между свободным временем, чтобы жить своей жизнью, и временем, которое я вкладываю в работу. В зависимости от проекта я могу работать дольше ожидаемого времени, но это не обязательно.

Урок: вам нужно знать, какой баланс работы и личной жизни подходит вам, а затем найти работу, которая согласна с этим.

Последние мысли

Из всех вопросов, которые мне задают, я всегда люблю отвечать на пятый. Это показывает, что вы можете изменить свое мнение и попробовать что-то новое в своей карьере. Студенты задают мне много вопросов, но некоторые из них встречаются чаще, чем другие. Я надеюсь, что эти ответы помогут вам, когда вы придумываете свои следующие шаги.

Итак, мои советы и извлеченные уроки:

  1. Найдите свою нишу.
  2. Выберите свои навыки и изучите их.
  3. Начни с проблемы. Тогда найдите решение.
  4. Выберите роль, которая соответствует тому, чем вы хотите заниматься.
  5. Вы можете не знать, где окажетесь, и это нормально.
  6. Найдите то, что вам подходит, и наслаждайтесь.
  7. Примите вызовы.
  8. Разберитесь в своем балансе между работой и личной жизнью.

Есть ли еще какие-то вопросы, которые вам часто задают? Есть ли вопросы, которых нет в списке?

Дополнительное чтение

Если вы хотите узнать больше, ознакомьтесь с некоторыми другими моими статьями ниже!