Когда я размышлял о различных способах, с помощью которых я могу ориентироваться в своей карьере в обширной области науки о данных и машинного обучения (DSML, в дальнейшем), я не могу не чувствовать себя ошеломленным параличом выбора по сравнению с другими. новые типы рабочих мест и новые навыки, которые я могу выбирать и развивать свой опыт. И мой смущающий # YOE (1,5 года) по сравнению с тем, что ожидают сегодняшние рабочие места, определенно не помогает!

Специализация и знание предметной области являются ключом к успеху в DSML, поэтому чем больше у нас многолетнего опыта, тем выше наши шансы получить работу своей мечты (при условии очевидного синергизма с необходимыми навыками).

Мне ясно, что, хотя я вижу огромный потенциал в сообществе DSML и несколько лет или десятилетий процветания для тех, кто в нем участвует, важно выбрать тип специалиста по данным или инженера по машинному обучению, которым я хочу стать, чтобы не рисковать получить потерял работу, переключаясь между неоптимальными вариантами по мере появления возможностей.А это означает, что я не решаю проблему, которую хочу решить.

Чтобы получить лучшее представление о топологии сообщества DSML, нам нужно уменьшить масштаб. После серии дебатов с двумя моими соседями по комнате, которые также являются специалистами по данным в области технологий и финансов, мы пришли к следующему выводу.

Задания DSML по существу сводятся к этим 4 категориям:

  1. Создание продукта на основе машинного обучения:обнаружение разжигания ненависти в Facebook
  2. Аналитика (внутренняя):выявление клиентов SaaS, подверженных риску оттока.
  3. Консалтинг (аналитика + внешние клиенты) и продажи:команда Google работает с правительством штата над оптимизацией транспортных потоков.
  4. Исследования: исследования компьютерного зрения в Tesla.

Здесь я включаю только те работы, которые фактически связаны с созданием модели машинного обучения. Вы можете возразить, что практикующий DSML ежедневно выполняет МНОЖЕСТВО других действий — я согласен — но это моя попытка упростить эту область до ее сути.

Позвольте мне объяснить каждый из них немного подробнее.

Создание продукта на основе машинного обучения

Здесь вы работаете с коммерческими продуктами, у которых на самом деле много пользователей. Вы работаете с основной командой машинного обучения, создавая модели, которые служат рекомендациям, фильтруют контент, автоматизируют работу с пользовательским интерфейсом и т. д.

Я лично нахожу это очень захватывающей областью — возможность работать с реальными пользователями вашего продукта, получать отзывы в режиме реального времени, тестировать новые функции с вашими пользователями, новые и лучшие модели, более быстрые итерации и, надеюсь, рост числа пользователей ( в идеале…). Вы вносите непосредственный вклад в удобство своих пользователей и, следовательно, в общий доход вашей компании… Впечатляющие результаты!

Такая близость к непосредственным пользователям также сопряжена с затратами на нахождение в зоне активного огня — ошибки обходятся дорого, а время ограничено. Если ваше решение машинного обучения доказало предвзятость или дало деликатные рекомендации, оно может дорого обойтись вашей компании (но работа с этим была бы ценным опытом).

Эта роль потребует гораздо большего взаимодействия с менеджерами по продуктам и разработчиками программного обеспечения. Будущий рост будет в сфере продуктов машинного обучения, так что предела нет. Существует множество продуктов машинного обучения, связанных с робототехникой, автомобилестроением, социальными сетями, космическими путешествиями и т. д., для которых потребуются хорошие менеджеры по продуктам машинного обучения. Стань этим человеком!

Идеально было бы получить здесь степень бакалавра, магистра компьютерных наук или математики, но я видел достаточно людей с самым разным опытом. Так что играйте на шансах.

Аналитика (внутренняя)

Работа в качестве внутреннего специалиста по данным может быть удачной или неудачной в зависимости от компании. Вы работаете с основными стратегическими командами компании и играете вспомогательную роль в управлении компанией. Может быть, не передовой герой, но важная часть стратегии компании, и вы работаете напрямую с руководством вашей компании.

Большие и малые компании сейчас уделяют много внимания пониманию своих клиентов, и наука о данных помогает им в этом. Вы будете работать над использованием данных клиентов для создания оптимальных моделей ценообразования, помогать продуктовым командам с отзывами пользователей и улучшениями, помогать финансовым командам с прогнозированием и обнаружением мошенничества, а также помогать отделам продаж и успеха клиентов с моделями оттока. Вы либо снижаете энтропию внутри своей компании, либо определяете упущенную возможность. У вас будет возможность работать над различными типами проблем, и вы сможете довольно быстро развить свой набор навыков.

Причина, по которой я сказал, что это будет успех или промах в зависимости от компании, заключается в том, что здесь важны 2 важных фактора:

  • Культура вашей компании в отношении аналитика:ваше руководство должно быть восприимчиво к использованию науки о данных, применять гибкие методы и способствовать созданию здоровой среды DS.
  • Данные вашей компании.Мой первый менеджер однажды сказал мне: аналитика хороша настолько, насколько хороши ваши данные. Это как нельзя более верно.

Те же требования, что и выше, с меньшим мастерством кодирования, по моему опыту. Здесь было бы полезно иметь некоторую деловую хватку, поскольку вы пытаетесь решить бизнес-проблемы, но это должно быть довольно просто.

Консалтинг + продажи

Есть много специалистов по данным, которые работают над внешними, ориентированными на клиента заданиями, в которых они участвуют в решении важной проблемы для компании (представьте, что помогают НАСА в классификации изображений) в форме подтверждения концепции или в виде консультационного контракта. . Например, Команда IBM Data Science Elite Team работает над 6-8-недельными PoC для клиентов из авиации, здравоохранения, правительств, телекоммуникаций и т. д., что дает их команде DSML поистине впечатляющий опыт. Вы сразу же приступаете к работе над важными проблемами, учитесь находить решения в соответствии с потребностями клиентов, получаете доступ к руководству высокого уровня, а если вам повезет и вы готовы, вы сможете путешествовать мир!

Это почти как предпродажная роль — вы либо продаете продукт (для IBM DSE вы продаете портфель программного обеспечения IBM-Red Hat), либо вы рассчитываете получить больше консультационных контрактов в будущем (как в случае с McKinsey). QuantumBlack или BCG Gamma). В зависимости от вашего стажа, часть продажи может показаться немного неприятной, если вы приверженец чистоты и ищете чисто техническую работу.

Учитывая, что эти встречи короткие и быстрые, они требуют хороших коммуникативных навыков и деловой хватки. Хорошо бы получить степень бакалавра в любой количественной области, предпочтительнее CS и/или математика.

Исследования

Это, вероятно, моя идеальная категория, но на самом деле она требует страсти и серьезных затрат времени для накопления опыта в предметной области.Здесь вы продвигаете человеческие знания дальше. Вы разрабатываете и создаете новые типы алгоритмов для решения проблем. Вы тонко понимаете свою систему, интуитивно и математически, в той мере, в какой вам удобно ею манипулировать.

Даже в рамках исследований вы можете пойти двумя разными путями:

  • Академические исследования. Вы работаете профессором или исследователем в академическом учреждении. Это было бы очень престижно с хорошей свободой выбора типа проблем, которые вы хотите исследовать. У вас будет финансирование, но у вас будут студенты для обучения (что хорошо или плохо, в зависимости от ваших предпочтений). Для этого вам обязательно понадобится докторская степень с хорошими годами исследований, чтобы добраться сюда.
  • Корпоративные исследования. Здесь вы активно участвуете в разработке возможностей ИИ в компании (например, исследования в области компьютерного зрения в Tesla, GPT-3 в OpenAI, AlphaFold в DeepMind и т. д.). Здесь происходят захватывающие открытия, но вы можете ожидать, что давление со стороны корпораций приведет к результатам (что, опять же, хорошо и плохо). Если вам повезет, достаточно степени магистра, в противном случае вам понадобится докторская степень в аналогичной области.

Один ключевой нюанс между корпоративными исследованиями и ролью Продукт на основе машинного обучения заключается в следующем:

  • Продукт на основе машинного обучения. Скорее всего, вы реализуете существующий метод машинного обучения с определенным уровнем настройки для существующего продукта.
  • Корпоративное исследование. Скорее всего, вы создаете совершенно новый алгоритм или систему для еще не выпущенного продукта.

Попытка пройти исследовательский путь может утомить вас — вам нужно начать публиковаться, посещать конференции, часами думать о своей проблеме и оптимизировать, справляться с неудачами, справляться с синдромом самозванца — но когда я оглядываюсь назад в историю на величайших физиков мира и математики, именно их страсть к поиску знаний, а не богатства или комфорта, оказала реальное влияние. И, утоляя этот голод, они наметили путь, по которому человечество могло бы двигаться дальше. Вы будете частью этой элитной группы, тех, кто работает над самыми узлами в глубинах древа знаний человечества.

Заключительные мысли

Целью этой статьи было помочь отфильтровать лишний шум и шумиху, а также помочь вам классифицировать работу в зависимости от типа проблемы, которую вы будете решать. Поскольку я видел, как многие специалисты по данным обсуждали свой следующий шаг в карьере, я обнаружил, что ясность мысли очень помогает в принятии оптимального решения, которое удовлетворит вас в долгосрочной перспективе. Очевидно, что человек приспосабливается к своим обстоятельствам, и люди находят новые захватывающие вещи в неожиданных местах, но я надеюсь, что эта статья упростит сложный мир DSML в 4 категориях и поможет вам в процессе принятия решений по мере развития вашей карьеры.

Теперь иди оптимизируй свой индекс счастья!