ML Engineering: прошлые и текущие отраслевые тенденции, открытый исходный код и будущее машинного обучения.

2020 год не был удачным почти во всех сферах, однако в одной области наверняка наблюдался огромный бум с точки зрения выпуска наборов инструментов с открытым исходным кодом, упрощающих создание приложений промышленного масштаба с использованием машинного обучения. Намного проще, чем это было бы в 2019 году. Как и на что это повлияет? И как вы, будучи студентом, должны быть к этому готовы?

Если вы являетесь человеком, заинтересованным в машинном обучении и следящим за ним, вам действительно кажется, что поток новых интересных разработок в этой области появляется каждый день. В 2020 году особенно выросло количество наборов инструментов для машиностроения для машинного обучения с открытым исходным кодом в масштабе производства, появилось множество новых организаций, основанных действительно умными людьми, и все они посвящены искусственному интеллекту, что сопровождалось ростом корпоративных наборов инструментов. . Совсем недавно позиции в области науки о данных претерпели сдвиг от «науки о данных / исследований» к «прикладному машинному обучению / инженерии», а также, большинство компаний в 2020 году участвуют в создании собственных платформ искусственного интеллекта.

В этой статье я дам небольшой совет, основанный на моем опыте работы в качестве инженера по машинному обучению и ежедневного общения с прикладными исследователями, специалистами по обработке данных, менеджерами по продуктам, инженерами. этой новой революции машинного обучения к тому времени, когда вы закончите учебу, независимо от ваших интересов?

Краткая история позиций ML с течением времени и обычный кадровый резерв

Исторически сложилось так, что компании процветали за счет наличия умной группы по анализу данных, а ведущие технологические компании конкурировали друг с другом за лучшие таланты. Говоря с моими наблюдениями за тенденциями найма в районе залива и в США в целом, большая часть этого кадрового резерва обычно относилась к людям с подтвержденным исследовательским опытом. Обычно это верно для крупных технологических компаний по всему миру. Когда вы посмотрите на типы должностей в ML в ведущих компаниях и кадровый резерв, мы можем разделить недавнюю историю на них.

Эра до TensorFlow (до 2015 года)

В эту эпоху наука о данных развивалась достаточно хорошо, и почти все технологические компании, возглавляющие отраслевые команды, имеют собственные сильные группы по обработке и анализу данных. И, как упоминалось ранее, их сила - в их data-science. Но с инженерной точки зрения, «облако» было модным словом, и почти все крупные компании имеют свои продукты / услуги в облачных экосистемах, собственных или на AWS, с растущим спросом на Azure и Google Cloud, а поставщики облачных услуг нанимают крупных количество инженеров-программистов. DevOps пережил огромный рост.

Когда вы говорите о должности специалиста по обработке данных сразу после колледжа, раньше она была открыта для избранных, включая аспирантов STEM или студентов MS с хорошими релевантными публикациями (NIPS, KDD и т. Д.), То есть компании в основном искали кандидатов с проверенными послужной список в исследованиях для работы над своими проблемами машинного обучения. Планка была высокой.

Группы специалистов по анализу данных обычно состоят из специалистов по данным и инженеров-программистов, работающих вместе с другими инженерами (разработчики, специалисты по качеству, DevOps). Специалисты по обработке данных обычно принадлежали к определенной команде (группа разработчиков платформы, группы разработки данных и т. д.), обслуживая потребности в разработке данных многих различных организаций, и только в том случае, если организация большая, у них есть их собственная команда инженеров данных. Обычно не было специализированного инженера по «машинному обучению» (в большинстве компаний MLE. В основном машинное обучение выполняли «инженеры-программисты» в сотрудничестве с специалистами по обработке данных и менеджерами по продуктам, а также инженерами из других стран). команды, не занимающиеся машинным обучением. И вот вкратце, как они обычно функционировали. В небольших компаниях / стартапах специалисты по данным обычно выполняют многие из этих вещей самостоятельно (исследования, управление продуктами, разработка, инженерия данных и т. д.).

Эпоха массовой адаптации глубокого обучения (2016–2019 гг.)

К настоящему времени (2016 г.) большинство крупных компаний (технических и нетехнических) начали адаптировать фреймворки машинного обучения / глубокого обучения в некотором масштабе, чтобы оптимизировать что-то где-то в своих конвейерах, в сопровождении изменений в их традиционной инфраструктуре, чтобы иметь возможность это сделать. . Многие из тех, кто начинал новые команды машинного обучения, делали это исключительно в облаке. Произошло это в основном по следующим причинам.

  1. Tensorflow, PyTorch и т. д. и их широкая адаптация во всех компаниях за счет улучшения архитектуры графического процессора и снижения стоимости вычислений. Это наряду с повсеместной доступностью бесплатных облачных вычислений, позволяющих проводить академические исследования с глубоким обучением, привело к некоторым революционным новым академическим исследованиям в эту эпоху, а также к революционной работе по глубокому обучению, которая стала доступной для использования.
  2. Бум самоуправляемых стартапов, стимулирующий исследования в области компьютерного зрения и прикладного глубокого обучения. Этим, конечно же, руководят такие компании, как Tesla, Uber и сотни AI-стартапов, работающих в сфере, многие из которых финансируются крупными автомобильными компаниями и крупными технологиями, иногда в партнерстве. Помимо Tesla, есть несколько десятков автомобильных компаний, которые работают над серийным электромобилем, который будет доставлен в течение нескольких лет.
  3. Бум адаптации и интереса к диалоговому ИИ (который, казалось, снизился с годами), стимулировал академические исследования, а также адаптацию диалоговых систем в продуктах системы для взаимодействия с клиентами. / пользователи. В этот период появился новый вид продуктов динамики с искусственным интеллектом, на которых работали Alexa, Cortana, Siri, Google Assistant и т. Д. Все основные производители устройств в основном имели своего собственного AI-чат-бота и т. Д., Что привело к революции в области обработки / понимания естественного языка. Аналогичный бум произошел в нескольких различных подобластях, и все они сделали шаг вперед в глубоком обучении.
  4. Революционные изобретения в области глубокого обучения, разработанные ведущими исследовательскими организациями и исследователями, позволили исследователям ИИ в ведущих университетах достичь статуса лучших баскетболистов в области технологий. Многие работают неполный рабочий день или перешли на полный рабочий день, чтобы руководить техническими лабораториями крупных технологических компаний, в то время как другие продолжали проводить грандиозные академические исследования, в основном финансируемые самими корпорациями, участвующими в исследованиях искусственного интеллекта. Этот век укрепил и расширил связи академических кругов с промышленностью в исследованиях машинного обучения. Многие продукты машинного обучения, которые мы используем сегодня, являются результатом партнерства отраслевых и академических кругов.
  5. Поколение генерирующих состязательных сетей (GAN): большая часть прорывных исследований проводилась на этом этапе, но я полагаю, что меня бы вызвали, если бы я не упомянул GAN и бесчисленные проблемы, которые она решила. Сегодня GAN - это новый предмет / тема вместе с полноценными университетскими классами, посвященными GAN. На самом деле GAN появился до 2016 года (2014), но это было время, когда GAN приобрела широкую популярность. Помимо GAN, все основные технологии глубокого обучения стали действительно распространенными, особенно благодаря достижениям в области компьютерного зрения (CNN, R-CNN и т. Д.), А также RNN, LSTM, автокодировщиков и других.

… и многие другие события, которые сформировали современный ландшафт машинного обучения. Я определенно пропустил много других важных событий…

Как изменился найм ML за этот период?

Все упомянутые выше факторы привели к быстрому изменению ландшафта машинного обучения и, в конечном итоге, к повсеместному найму людей, занимающихся машинным обучением. В эту эпоху наблюдался быстрый рост должностей, связанных с машинным обучением, а также числа кандидатов, знающих машинное обучение. Это происходит главным образом из-за повсеместного роста «программного обеспечения для онлайн-курсов» в предыдущие годы (примерно с 2010 г.) и растущей доступности учебных материалов, один из которых лучше другого, бесплатно. Следовательно, конкуренция за эти позиции в области науки о данных в ведущих компаниях оставалась высокой.

Группы специалистов по анализу данных по-прежнему специалисты по обработке данных и инженеры-программисты, работающие вместе с другими инженерами, но в целом групп по анализу данных намного больше . В крупных компаниях с разными командами, у которых обычно была одна центральная команда по науке о данных / ИИ, обслуживающая все подразделения, теперь есть отдельные группы ИИ во всех своих подразделениях, все оптимизирующие разные части решения, которые также начали нанимать сотрудников внутри компании в соответствии с их собственными командами. а не на уровне компании. Также произошел взрывной рост стартапов, ориентированных на машинное обучение, которые за это время наняли на множество должностей в области науки о данных. Короче говоря, из-за всплеска спроса команды по анализу данных стали более открытыми, т.е. неограничивающими.

  1. Требование создания масштабируемых продуктов машинного обучения привело к необходимости в специалистах по машинному обучению с инженерным опытом. Многие из опытных инженеров-программистов в то время действительно имели знания в области машинного обучения (на самом деле они из эпохи «открытого программного обеспечения», появившейся после 2010 г., и хотели получить должность после окончания учебы, но несколько лет назад перешел на должность SE). В настоящее время команды специалистов по анализу данных состоят из значительного числа специалистов по анализу данных, которые затем становятся специалистами по анализу данных с достаточным опытом работы.
  2. Это было огромным благом для студентов бакалавриата / магистратуры / докторантуры, занимающихся машинным обучением в академических кругах, потому что многие компании начали нанимать стажеров на разных уровнях. Многие из этих стажеров вернулись к работе на полную ставку. Следовательно, в относительно старой команде ML / DS в ведущей компании обычно можно увидеть: группу старших специалистов по данным, пару опытных инженеров-программистов , менеджеры по продуктам, только что окончившие колледж и т. д. В большинстве компаний, только что окончивших колледж, скорее всего, будут называть SE в большинстве компаний, и они будут в большинстве случаев никогда не могут называться дата-сайентистами, если у них нет докторской степени, но в большинстве случаев их обязанности также не будут отличаться от тех, кто имеет докторскую степень. Просто у разных компаний разные правила наименования должностей.
  3. В эту эпоху действительно выросло количество специалистов по данным, специализирующихся на данных, которые сосредоточились на одной области. Например, для рекламы. Большинство компаний, которые сейчас занимаются рекламой, вкладывают значительные средства в команду специалистов по анализу данных, поэтому, если вы работаете в сфере ML / DS в рекламе в компании, не составит большого труда найти аналогичную роль в области обработки данных в другой компании. потому что сейчас это довольно распространено. Домены и эксперты в предметной области увидели рост, например. Видение, чат-бот, реклама, рекомендации, поиск, риск / доверие, frontEnd / UX-ML повысили позиции в сфере доменов.

2020 год и далее: рост популярности «инженера по машинному обучению»

Что касается машинного обучения, в 2020 году произошел огромный скачок в инженерии с точки зрения бесплатных масштабируемых инструментов машинного обучения с открытым исходным кодом. Поскольку компании (как маленькие, так и большие) постоянно выпускают наборы инструментов и обновления, создавать полностью функционирующие продукты машинного обучения с использованием этих наборов инструментов стало проще, чем когда-либо, при условии, что есть постоянный приток умных инженеров, которые знают, как их использовать для этой цели.

Крупные технологические компании, которые потратили годы и миллионы долларов на инфраструктуру и таланты, чтобы создать производственные системы машинного обучения, обслуживающие сегодня миллионы / миллиарды потребителей. Однако означает ли наличие этих наборов инструментов машинного обучения с открытым исходным кодом их проблема? Я бы сказал нет, потому что

  1. Проблемы, с которыми сталкиваются в разных отраслях, по своей сути намного сложнее, со многими ограничениями и соображениями, и часто структура может не работать с точки зрения инженерии, даже если она лучший с точки зрения бизнеса. Следовательно, потребуются значительные вложения человеческих ресурсов (инженеров, ученых), чтобы создать конвейер (несмотря на использование доступных сейчас наборов инструментов с открытым исходным кодом) для достижения производительности, аналогичной их существующим системам машинного обучения.
  2. Компании с существующими устаревшими системами машинного обучения, безусловно, увидят возможность, но большинство из них прямо не сойдутся с корабля, т. е. проектировать совершенно новую инфраструктуру на недавно доступной платформе машинного обучения. Скорее, они с большей вероятностью будут использовать лучшие из нескольких доступных наборов инструментов для наилучшего решения своих проблем.
  3. Однако новая инфраструктура машинного обучения, разрабатываемая небольшими стартапами, или небольшими группами по анализу данных, или небольшими группами по анализу данных (в основном командами, не имеющими платформы машинного обучения десятилетней давности), с большей вероятностью разработают их инфраструктура машинного обучения основывалась на новых наборах инструментов, поскольку их гораздо проще использовать сразу с места в карьер, а затем потратить месяцы на создание платформы только для этого.

В идеале, чтобы привести пример, инженер, который хорошо разбирается в построении конвейеров данных с использованием AirFlow, Kafka и т. Д., Выполняет анализ и обучение / точную настройку моделей в Tensorflow / Torch , развертывание и обслуживание модели в Kubernetes, бэкэнд-разработка в Node.js и т. д., чтобы развернуть прототип для AB-test, который преобразует изменение фактических показателей эффективности продукта, вероятно, вызовет наибольший спрос на их навыки. Но должности начального уровня, скорее всего, будут подмножеством этого идеального инженера.

Ожидаемые тенденции в навыках

  1. «Применение машинного обучения» становится основным отраслевым навыком Инженеры, обладающие знаниями машинного обучения, способные проводить исследования в сотрудничестве с опытными специалистами по обработке данных и способные принимать участие в большей части инженерии данных / будет востребовано моделирование / развертывание. По сути, понятие «непрерывная комбинация» навыков будет цениться больше, чем просто исследования или просто инженерия.
  2. Тонкая настройка как инженерный навык в эпоху трансферного обучения. Рост числа инструментов с открытым исходным кодом будет сопровождаться появлением экспертов по инструментам с открытым исходным кодом, но лучшими из них. AI-инженер - это тот, кто сможет легко использовать большинство наборов инструментов, настраивая каждый, чтобы выяснить, решает ли он текущую проблему, а затем развернуть его. Трансферное обучение (TL) - это исследовательская проблема в машинном обучении (ML), которая фокусируется на хранении знаний, полученных при решении одной проблемы, и применении их к другой, но связанной проблеме. Например, знания, полученные в процессе обучения распознаванию автомобилей, могут применяться при попытке распознать грузовики. Большинство моделей машинного обучения, доступных на сегодняшний день, позволяют точно настроить предварительно обученную модель для оптимизации для конкретных задач, тем самым снижение требований к затратам усилий и времени на создание обширной и точной базы данных. Стартапы могут сразу начинаться с модели, доступной для развертывания (см. ml5js, tfHub). В TensorFlow есть готовые к развертыванию предварительно обученные и настраиваемые модели для Интернета (tf.js), для мобильных устройств (tfLite) и действительно простой способ тонкой настройки общих моделей для многих общих задач в изображении, речи, зрении и т. Д. NLU и т. Д. Даже создать автономную систему искусственного интеллекта не так сложно, как год назад. Nvidia, среди многих других, имеет искусственный интеллект для самостоятельного вождения и другие решения (Nvidia Drive AGX). В этот период будет наблюдаться огромный рост стартапов и признанных игроков, использующих все доступные решения, и, следовательно, спрос на инженеров, которые могут делать это с легкостью, будет расти. Стартапы будут охотиться за людьми, которые могут понять тонкости деталей исследовательской работы о новом решении, а затем могут запустить модель, чтобы использовать код и данные статьи, чтобы перенести обучение на свою собственную проблему, если его можно развернуть в существующей системе ci / cd (если у вас есть система, предназначенная для подключения моделей), а затем измерить влияние.
  3. Разработка платформы AI. На самом деле, роль разработчика платформы AI уже возрастает, и это в основном текущая роль «инжиниринга данных + инженера машинного обучения». Их сейчас называют инженерами по платформе ML, или SE- (платформа ML), или инженерами-программистами (платформа), что неоднозначно для разных компаний.
  4. Знания искусственного интеллекта / машинного обучения как обязательные в управлении продуктами и предлагаются в качестве нового «трека» в гораздо большем количестве специальностей. Знание ИИ помогает, и лучше всего, когда ваш менеджер по маркетингу точно знает, что вы предлагаете, и сам может представить новые подходы, что приведет к большему вовлечению.

Мой совет бакалаврам ML, которые сейчас учатся в университете.

Как студент, интересующийся машинным обучением, вам может быть интересно, как ориентироваться в море новой информации, которая появляется в вашей ленте каждый день? Что на удивление все актуально? Как извлечь максимальную пользу из новых наборов инструментов, которые выпускаются почти каждый день, вы что-то упускаете? Новые роли, которые внезапно открываются для студентов, но их требования кажутся конкурентоспособными. Это слишком много информации, чтобы обрабатывать и отслеживать ее среди классов, заданий и тратить эти часы на мемы в социальных сетях. Что вы делаете?

Исторически сложилось так, что даже если машинное обучение / наука о данных были только вакансиями, открытыми только для выпускников, у следующего поколения людей, работающих над машинным обучением, будет больше студентов, чем когда-либо, которые будут работать над машинным обучением сразу после колледжа. Конечно, входной барьер по-прежнему будет высоким.

С увеличением числа студентов, посещающих вводные классы машинного обучения, начиная с третьего года обучения в колледже, а также благодаря таким компаниям, как Coursera, edX и университетам, которые выпускают материалы своих курсов, что приводит к демократизации знаний ML / DL, у нас больше студентов, чем когда-либо прежде. , которые интересуются машинным обучением больше, чем их актуальная специализация.

Когда весь мир наблюдает за несколькими позициями по машинному обучению, независимо от того, в какой области они работают, вам необходимо выделиться среди миллиона других студентов, которые все называют себя экспертами в области машинного обучения / глубокого обучения / науки о данных. Конечно, участие в одних специальностях повысит ваши шансы по сравнению с другими (не все области, отмеченные STEM, имеют равное сродство с навыками, необходимыми в науке о данных), и с расслабленной классной работой сегодня легко получить высшее образование с основным и второстепенным, что может быть идеальной комбинацией позиционируется как победитель (CS + Stat, CS + Math, Stat + CS, Operations Research + CS, CS + Finance, Econ + Stat, Econ + CS и т. д.) для вакансий MLE, появляющихся в следующие несколько лет. Эти вакансии MLE станут ступеньками к должностям старшего инженера машинного обучения или Data Science, но вакансии DS потеряют свою привлекательность со временем, из года в год, поскольку компании понимают, что они могут получить аналогичный уровень умной работы, выполняемой студентами с опытом и под наставничеством. меньшего количества специалистов по данным.

В эпоху, когда миллионы выпускников STEM получают степень доктора философии каждый год, просто получить докторскую степень в области STEM будет недостаточно для докторов наук, стремящихся выйти на рынок труда, теперь перед лицом растущей конкуренции студентов / магистров, имеющих опыт машинного обучения, которые потратили 2–3 года работы с фактическим опытом работы в инженерии, несмотря на то, что в среднем намного моложе, чем аспирант.

Позвольте мне записать несколько советов, которые, я бы сказал, полезны для студентов, чтобы доказать, что вы достойны в конкурентном мире промышленного машинного обучения. Я бы посоветовал сформировать привычки вместо того, чтобы предлагать какие-то простые средства.

  1. Следите за последними достижениями и отраслевыми изменениями. Убедитесь, что вы хорошо осведомлены о соответствующих инструментах и ​​технологиях в вашей конкретной области / области. Будь то ML или ваша настоящая майор. Это век информации, один быстрый поиск на YouTube о том, как что-то работает, дает сотни релевантных видео. Когда исследование опубликовано, тысячи (как и я) пишут об этом, снимают об этом видео, люди обсуждают в Интернете, а через короткое время даже на официальных курсах упоминают об этом. Нет недостатка в ресурсах, чтобы чему-то научиться, если вообще чего-то не хватает, самое время. Вам просто нужно выделить время, чтобы быть в курсе событий каждый день.
  2. Прежде всего, основы. Может возникнуть соблазн сразу перейти к созданию продуктов со всеми доступными инструментами, особенно для новичков в этой области. Однако, независимо от того, насколько вы преданы машинному обучению, ни по какой причине не игнорируйте основы, которые вы должны изучать как инженер. Скорее всего, не будет ни одного бакалавра, который получает степень, специализирующуюся на ML (ML еще не существует как специализированная инженерная ветвь), подавляющее большинство студентов будут CS, за ними следуют CE / ECE, Mechanical / Civil и т. Д. на. Математика, статистика, кодирование по-прежнему являются основами для хорошего специалиста по данным, и все основные концепции CS (алгоритмы, структуры данных, базы данных, операционные системы, сети и т. Д.) По-прежнему важны для программиста. И вам по-прежнему нужно быть хорошим специалистом в области науки о данных, а также инженером-программистом, если вы хотите проникнуть в ML Engineering.
  3. Подход к инженерии, основанный на решениях и продуктах. В формальном академическом мире упор на оценки и средний балл ожидается, и это следует полностью уважать. Однако подход, основанный на решениях, - лучший выбор для хорошего инженера. Под этим я просто подразумеваю поиск проектов, которые могут решить практические проблемы, независимо от того, насколько они малы. Не думайте, что вы будете выделяться, выполняя множество «шаблонных» проектов, которые очень распространены. Человек с одним уникальным проектом всегда будет предпочтительнее того, кто выполнил несколько проектов, которые вы легко найдете в других резюме.
  4. Сосредоточьтесь на влиянии, правильном виде, а не на символических достижениях. Никого в индустрии машинного обучения не будет волновать, что вы были президентом комитета по трудоустройству в вашем колледже, даже если вы действительно можете этим гордиться, если вы этого не сделаете. иметь один проект машинного обучения. Вы можете подумать, что заняли влиятельную должность, но студент, который работал в стартапе, предлагая реальную «ценность» и получая «опыт», будет гораздо более ценным, чем студент, разместивший пять символических достижений в LinkedIn. Следовательно, во всех ваших академических и неакадемических проектах важно знать, сколько изменений и какое влияние вы оказали.
  5. Github, Docker, открытый исходный код и демонстрация Github - это ваш путеводитель по достоинству машинного обучения. Прежде всего, вам необходимы git (контроль версий) и Docker (контейнерные приложения). Все, что я должен сказать, это сделать их привычкой. Независимо от того, являетесь ли вы бакалавром компьютерных наук. Если вы студент бакалавриата, у вас обязательно должен быть профиль на Github, которым вы будете гордиться к моменту выпуска.
  6. Соревнования, кодирование, Kaggle и бесплатные наборы данных. Победа или лидерство в соревновании всегда приветствуются. Участие в соревнованиях на Kaggle также дает представление о реальных проблемах машинного обучения, с которыми приходится сталкиваться, поскольку компании, проводящие соревнования, публикуют данные. Многие соревнования проводятся на денежные призы или награды, однако само участие в них - это огромный опыт. Тоже почетный знак. Существует множество сайтов, на которых вы можете принимать участие в еженедельных, ежемесячных и ежегодных соревнованиях как в области разработки программного обеспечения, так и в области науки о данных.
  7. Хакатоны и общее стремление к созданию чего-то умного. Участвуйте в как можно большем количестве хакатонов, особенно если вы не участвовали раньше. Хакатоны важны главным образом потому, что они учит работать в команде в условиях ограниченного пространства и ограниченного времени и создавать жизнеспособный продукт. Компании очень ценят командную работу. Вы гораздо более ценны для компании, если продемонстрировали влияние в составе команды, а не в одиночку. Многие стартапы начинались как идея хакатона. Кроме того, это отличный способ познакомиться с другими людьми, интересующимися этой областью, которые впоследствии могут стать вашими соучредителями в ваших поисках создания следующего единорога.
  8. Исследования в рамках бакалавриата. Во время учебы вы можете участвовать в реальных исследованиях, сотрудничая с профессорами, докторами наук или аспирантами, работающими в этой области, в вашей группе стажировок или проходя стажировку в исследовательской группе университета. Если вы заинтересованы в исследованиях с целью получения ученой степени позже, вам, безусловно, будет полезно прочитать исследовательские работы в том виде, в котором вы планируете заниматься. И начиная с этого момента, под наставничеством ваших профессоров или других исследователей, если бы вы могли опубликовать замечательную статью. Публикация не является необходимостью, но, опять же, она значительно увеличивает ваше преимущество.
  9. Уверенность и хватка в той области, в которой вы, по вашему мнению, являетесь экспертом. Если вы планируете стать инженером по машинному обучению, просто иметь возможность реализовать модель тензорного потока недостаточно. Компании будут проверять вас на предмет ваших основ, и если вы упомянули ML или связанные с ним вещи в качестве своего опыта, вы сможете столкнуться с вопросами ML, как концептуальными, так и ситуативными / тематическими. Если вы специализируетесь на машинном обучении, вы должны быть в состоянии объяснить, как работают SVM и случайные леса, а также какой из них вы будете использовать в таких ситуациях, как обнаружение мошеннических платежей и т. Д. А также вы должны хорошо разбираться в решении 'данных -структурно-алгоритмические проблемы.
  10. Мягкие навыки, коммуникация и представление идей. Если вы студент бакалавриата и уделяете много времени машинному обучению, вы можете игнорировать общение как не столь важное. Но как инженер машинного обучения или специалист по обработке данных вы будете тратить много времени на объяснение своей идеи или работы аудитории. Лучше возьмите в привычку представлять и привыкать к этому (боязнь сцены - обычное дело), ​​пока вы еще учитесь в университете.
  11. Стажировки Стажировка - лучший способ войти в отрасль, поскольку входной барьер немного ниже, хотя конкуренция выше. При этом компании по-прежнему нанимают лучших кандидатов, чтобы провести с ними лето. Но они стараются сделать это проще, с меньшим количеством собеседований. Хорошая стажировка всегда ценится в отрасли, когда вы поступаете на полный рабочий день. Хорошая стажировка не обязательно означает работу в ведущей компании (спасибо, если хотите), но она должна быть эффективной. Если вы можете упомянуть то, что вы узнали, инженерные проблемы, которые вы решили или в которых участвовали, каковы были ваши обязанности, и если с вашей стороны была достигнута какая-либо значительная цель, это хорошо выглядит в вашем профиле. Кроме того, есть отличные предложения по возвращению, и значительная часть людей, поступающих на полный рабочий день, фактически перешла на стажировку.

Я подготовлю для студентов совершенно новую статью о том, как лучше всего подготовиться к карьере в сфере машинного обучения, но я считаю, что выполнение вышеуказанного, безусловно, принесет много конкурентных преимуществ.

Мир меняется, как и ландшафт машинного обучения, причем совсем недавно, особенно в 2020 году. Таким образом, еще предстоит увидеть, как новые инструменты адаптируются с течением времени, как отрасль и тенденции найма меняются с течением времени и что нового возможности, которые он приносит.

Изменения - единственное, что постоянно. Это утверждение более верно в случае промышленного машинного обучения. За этим сложно угнаться. В таком сценарии лучше и мудрее всего иметь собственную стратегию, позволяющую оставаться актуальной в постоянно меняющейся сфере.

Барьер для входа в эту очень конкурентную область высок, несмотря на взрывной рост вакансий и образовательных ресурсов. Таким образом, быть информированным, сосредоточиться на ценности и определить свою нишу - лучший совет, который я мог бы дать как профессионалам, так и студентам.

Спасибо!