Мне потребовалось много времени, чтобы разобраться в DevOps - это методология / подход к работе или это набор инструментов и технологий?

Группа инфраструктуры / сети берет на себя ответственность или это часть ответственности групп разработки программного обеспечения ?! Что ж, похоже, это зависит от того, кого вы спросите. Так что, может быть, я еще не осмелился ...

Теперь мы наблюдаем бурный рост операций машинного обучения или MLOps в мире науки о данных, и я вернулся к исходной точке.

Это тема, которая довольно часто всплывала в подкасте Как искусственный интеллект построил это - информационном подкасте, который ведет ваш искренний бесстыдный плагин - и мне посчастливилось много, очень много говорить с людьми. умнее меня - вроде команды Fuzzy Labs.

Вот краткое изложение того, что я понял:

Что такое MLOps?

Спросите 10 специалистов по данным, и вы вполне можете получить 11 ответов. Вот определение Nvidia: MLOps - это набор передовых методов, позволяющих компаниям успешно использовать ИИ.

Насколько я понимаю - и помню, что я простак, - MLOps является ключом к приведению проектов Data Science в соответствие, например, с передовой практикой разработки программного обеспечения и размышлениями о воспроизводимости как стандарте.

В еще не выпущенном эпизоде ​​How AI Built This - еще одного плагина 😉 - я побеседовал с Эриком Арне Матизен-Дрейфусом о том, что было бы неслыханно, если бы команда разработчиков программного обеспечения не использовала Контроль версий или даже просто не имея общей базы кода для будущих проектов.

Однако в Data Science это часто бывает. Суть работы заключается в том, чтобы собрать решения, посмотреть, что работает, и работать с ними, в конечном итоге что-то попадает в производство. А для следующего проекта вы начинаете все сначала.

Тем не менее, действительно двигаться вперед и оказывать влияние на бизнес, что, скажем прямо, является основной целью для большинства - MLOps будет ключевым фактором, или, безусловно, так кажется.

Кто отвечает за MLOps?

Ах, пресловутая банка с червями.

Некоторые говорят, что хорошая команда специалистов по анализу данных в какой-то мере внедрит эти методы в свою повседневную работу или, по крайней мере, будет отстаивать передовой опыт.

Некоторые говорят, что это совершенно другая работа, и рост числа инженеров машинного обучения или искусственного интеллекта стал подтверждением этой школы мысли.

Интересный комментарий, сделанный Эриком на шоу, заключался в том, что это работа, которую нужно выполнить прямо сейчас, и да, в идеале у вас была бы команда MLOps, но если вы не можете получить бюджет штата от бизнеса, вам нужно будет возьмите слабину. Со временем и по мере того, как инструменты станут лучше, вы с большей вероятностью сможете перетасовать колоду и организовать команду немного по-другому.

В конце концов, это определенно будет в компетенции команды Data Science, потому что это напрямую влияет на их модели.

Инструменты:

Как и в случае с DevOps 10 лет назад, мы все еще находимся в зачаточном состоянии инструментов MLOps. Есть несколько крутых компаний, таких как Valohai в Финляндии, которые делают интересные вещи, и я провел несколько замечательных бесед с компаниями в Великобритании, пытающимися решить некоторые из этих проблем.

По мере того, как мы получаем более сложные инструменты, я думаю, что MLOps станут нормой для большинства команд, занимающихся наукой о данных, и таких блогов, как этот, больше не будет!

Так что следите за этим пространством, я полагаю!

Структура команды и должности:

Об этом труднее написать в блоге, но, вероятно, стоит подумать, если вы отвечаете за команду по анализу данных или работаете специалистом по данным. Если вам нравится эта часть своей работы, ваши навыки будут очень востребованы, и это отличная новость.

Если вы управляете командой, было бы разумно подумать, как вы можете максимально использовать имеющиеся у вас навыки и, возможно, не ожидать, что они будут строителем моделей, инженером по данным, инженером по программному обеспечению и специалистом по MLOps.

По моему самому скромному мнению, нам нужно отказаться от названия «Data Scientist» - это слишком многообещающе. Инженер по MLOps, инженер по данным и, может быть, что-то вроде специалиста по данным о продукте или специалиста по анализу данных ?! Хорошо, когда они работают вместе и, может быть, даже с каким-то кроссовером, но понимая, что все они играют немного разные роли.

И вот оно - мой горячий взгляд на все, что касается MLOps. Дайте мне знать, что вы думаете!