Изучение перспективы карьеры в науке о данных может быть захватывающей и сложной перспективой, с неопределенностью во многих точках на протяжении всего пути.

Пишу, чтобы поразмыслить над некоторыми своими наблюдениями, поделиться опытом. Предупреждение: я ни в коем случае не пишу с большим опытом, но также в последнее время много думал и обсуждал эти идеи, так что некоторые из этих размышлений будут вам полезны.

У меня был опыт работы в области материаловедения, консультирования и работы в области актуарной науки в области здравоохранения, а совсем недавно я работал преподавателем, прежде чем изучать концепции машинного обучения и науки о данных.

  • Где ты был?

Какие прошлые места работы, опыт и образование вы можете использовать? Опыт в области компьютерных наук, математики и бизнеса обычно упоминается в качестве отправной точки, но не игнорируйте образование, психологию или любой другой набор навыков, который сочетает критическое мышление с коммуникацией. В конечном счете, вам понадобится (или создастся) прочная основа в программировании (по крайней мере, Python и SQL); и понимание того, как существующие данные могут быть использованы для прогнозирования будущих событий (например, вероятность и статистика), и, по крайней мере, некоторое знакомство с математикой, лежащей в основе моделей науки о данных (например, линейной алгеброй и исчислением), чтобы максимально использовать возможности данных. наука.

Каковы ваши ценности? Это может привлечь вас к различным приложениям науки о данных или отказаться от них. Если вы больше цените знания или открытия, чем экономическую эффективность, существует множество научных приложений для науки о данных и машинного обучения. (Если это так, я рекомендую посетить конференцию, например SciPy, для отличного обучения и общения). С другой стороны, вы можете быть более заинтересованы в оптимизации бизнес-процесса; компании изобилуют тем, что ищут тех, кто может применять научные методы данных.

  • Где вы сейчас?

В зависимости от вашего текущего наличия времени и денег, есть несколько вариантов. На свободном конце (просто доступ в Интернет) есть множество блогов и онлайн-видео, которые могут дать общий обзор того, что такое наука о данных, и дать некоторые темы для дальнейшего изучения. Любой учебный документ программы по науке о данных может предоставить общие ориентиры для обучения. Такие веб-сайты, как Kaggle, содержат множество наборов данных с открытым исходным кодом, с которых можно начать изучение или анализ.

Несколько более дорогие веб-платформы Coursera, Udemy и Codecademy предлагают несколько доступных вариантов. У Coursera есть несколько программ по науке о данных и машинному обучению, доступных за небольшую ежемесячную плату (многие лекции даже доступны бесплатно, но оценки и сертификаты платные). С этого я и начал, получив специализацию по глубокому обучению. Он погружается в математику, лежащую в основе методов, но если вы можете с этим справиться, он обеспечивает потрясающую основу для машинного обучения.

Если у вас есть время и немного денег, есть интенсивные программы в стиле «учебного лагеря» в таких организациях, как Flatiron School или Galvanize. Они предлагают программы на месте, которые требуют долгих дней, но вы можете закончить их за несколько месяцев; или программа неполного рабочего дня в течение более длительного периода времени. Они также предлагают удаленный вариант для самостоятельного обучения, который может отлично подойти для независимого ученика, который не может бросить все ради интенсивного варианта. Плата за эти программы, как правило, выше, что может быть препятствием для некоторых, хотя они могут предлагать некоторые творческие планы погашения.

  • Куда вы хотите пойти (далее!)?

LinkedIn назвал науку о данных одной из трех профессий с самым высоким ростом в 2020 году (инженер данных и специалист по искусственному интеллекту, связанные должности, также входят в топ-10). С этим ростом появляются разнообразные дома для специалистов по обработке и анализу данных. Традиционные отрасли, от страхования до издательского дела, развиваются с разным уровнем успеха, внедряя методы обработки данных. Научные исследования, от астрономии до науки об окружающей среде, стремительно развиваются, когда они охватывают способность извлекать новые идеи из собранных данных, хотя необъяснимая тенденция некоторых методов ставит под сомнение подход к научному процессу. Появляются новые компании, либо предлагающие продукт, основанный на науке о данных/ИИ, либо предлагающие его как свою услугу. Какой процесс или результат вам близок?

Вас больше интересует сторона AI/ML или сторона обработки данных (или что-то совсем другое)? Поскольку зонтик науки о данных охватывает широкий спектр специализаций, может быть полезно определить, какая часть называет ваше имя, поскольку многие роли будут сосредоточены на одной или другой.

Какой сеттинг нравится? От консультирования (часто синонимом поздних ночей, оплачиваемых часов, разнообразия и волнения — или высокого давления) до более статичного набора обязанностей в организации, чья миссия состоит в том, чтобы производить свой собственный продукт, эти различные условия могут иметь огромное влияние на то, как вы подходите в и процветать. Баланс между работой и личной жизнью — это фраза, которая жизненно важна для одних организаций, но над которой насмехаются в других. Поиск организации, набор ценностей которой согласуется с вашими, жизненно важен для долголетия, удовлетворения и целеустремленности.

Прошлый опыт каждого человека, текущая ситуация и будущие устремления будут разными, когда мы будем плыть по водам науки о данных. Я надеюсь, что эти размышления дадут полезный контекст вашему путешествию!