Инженеры по машинному обучению — что они на самом деле делают?

Означает ли «инженер по машинному обучению» что-то новое в нашей области? Если да, то?

Название, конечно, вопрос с подвохом. Как и ранее Data Scientist, звание инженера по машинному обучению становится тенденцией на рынке труда для людей нашей профессии, но нет единого мнения о значении этого звания или функциях и навыках, которые оно должно охватывать. Я предполагаю, что новые участники рынка труда в DS / ML находят эту расшифровку сводящей с ума. (Даже опытные люди знают!) Итак, давайте поговорим о том, что это может означать в зависимости от того, кто говорит.

Когда я обсуждал это с другом на днях, я сформулировал это как МАШИННОЕ ОБУЧЕНИЕ инженер или машинное обучение ИНЖЕНЕР. По сути, из того, что я видел, в некоторых лагерях есть роли и ожидания под названием:

  • A. ожидайте обширных навыков разработки программного обеспечения с небольшим опытом или, по крайней мере, знакомством с ML, или
  • Б. Ожидается интенсивный опыт машинного обучения, часто включающий глубокое обучение или генеративный ИИ, и они хотели бы, чтобы вы могли написать функцию, когда это необходимо.

Первая группа, вероятно, была бы просто «инженерами-программистами» в предыдущие годы, в то время как вторая группа удобно относилась бы к «специалистам по данным» еще в тот день, когда я начал свою карьеру (хотя тогда генеративный ИИ определенно не был частью игры). ).

Это отражает интересную закономерность в развитии нашей профессии в более широком смысле. Нам никогда не удавалось разбить роли в нашей области на подкатегории, которые четко определяют набор навыков (или обязанностей) ролей. Это быстро развивающаяся, постоянно меняющаяся молодая область, так что это не шокирует! Это всегда относилось к званию Data Scientist, которое, по сути, долгое время обозначало «нечто более технически квалифицированное, чем Data Analyst». Некоторые люди называли специалистов по данным людьми, которые могут обрабатывать неструктурированные или дезорганизованные данные, и, насколько я вижу, это стало определяющим фактором.

Я сильно подозреваю, что рост MLE связан с тем, что люди, нанимающие людей типа SWE, были раздражены тем, что не получали кандидатов, которые разбирались в модели ML, в то время как люди, нанимавшие специалистов по данным, получали специалистов по аналитике, когда им нужны моделисты с наборами навыков ML. Они пересекались со всех сторон, образуя новое название, в котором есть внутренние разногласия по поводу важности каждого набора навыков. Итак, теперь у нас есть новое разделение пространства, о котором стоит подумать.

Хотя такое разделение области, вероятно, очень естественно, в качестве ответа на такого рода трудности я хочу отметить, что это означает для кандидатов и области. Каждый раз, когда происходит новый раскол и карьерный путь имеет новое возможное расхождение, двум маршрутам присваиваются статус и привилегии, которые чаще всего обнаруживаются по зарплате, предлагаемой для каждого направления. Теперь, когда область науки о данных становится формализованной с большим количеством возможностей для обучения и тому подобное, у людей есть более легкие пути к карьере. Сюда входят люди, находящиеся в неблагоприятном положении или маргинализированные в обществе в целом. Я считаю, что мы рискуем получить эффект розовых воротничков от специалистов по данным.

(Короче говоря, эффект розовых воротничков заключается в том, что женщины, в частности, становятся большей долей работников в данной области, а заработная плата и социальный статус тех ролей, где они преобладают, систематически снижаются из-за этого. Распространенным примером является ветеринария. Это происходит и в обратном направлении, поскольку женщины преобладали среди программистов в 1960-х и начале 1970-х годов, а когда мужчины стали более представлены в этой области, их зарплаты и престиж выросли.)

Это происходит на самом деле? Я действительно не знаю. Я вижу только неподтвержденные данные из отраслевых отчетов из таких мест, как Harnham и Burtch Works, а также просматриваю объявления о вакансиях в таких местах, как LinkedIn, которые создают впечатление, что между Data Scientist и ML Engineer начинает происходить расхождение в зарплате. Я определенно встречаю намного больше молодых женщин, POC и людей с разной гендерной идентичностью и сексуальной ориентацией в роли Data Scientist, чем даже пять лет назад.

Я очень надеюсь, что исследователи смогут выяснить, является ли это изменение заработной платы статистически значимым, и если да, то соответствует ли оно изменениям в демографии рабочих так, как я подозреваю.

В любом случае задача тех, кто занимается наймом в этой области, состоит в том, чтобы не допустить, чтобы более престижные, более «технические» наемные работники (например, инженеры по машинному обучению) стали доминировать мужчинами и теми, кто имеет социальное преимущество, и, как следствие, для данных Ученый нанимается, чтобы стать вариантом с более низким статусом, в который загоняют других в этой области, независимо от способностей. Конечно, платите за роли столько, сколько они стоят для вашего бизнеса, но не позволяйте этому влиять на демографию людей, которых вы рассматриваете или представляете в каждой роли. Это меньшее, что мы все можем сделать на данном этапе постоянно развивающейся игры.

Вы можете найти больше моих работ на www.stephaniekirmer.com.