Мне потребовалось много времени, чтобы разобраться в DevOps - это методология / подход к работе или это набор инструментов и технологий?
Группа инфраструктуры / сети берет на себя ответственность или это часть ответственности групп разработки программного обеспечения ?! Что ж, похоже, это зависит от того, кого вы спросите. Так что, может быть, я еще не осмелился ...
Теперь мы наблюдаем бурный рост операций машинного обучения или MLOps в мире науки о данных, и я вернулся к исходной точке.
Это тема, которая довольно часто всплывала в подкасте Как искусственный интеллект построил это - информационном подкасте, который ведет ваш искренний бесстыдный плагин - и мне посчастливилось много, очень много говорить с людьми. умнее меня - вроде команды Fuzzy Labs.
Вот краткое изложение того, что я понял:
Что такое MLOps?
Спросите 10 специалистов по данным, и вы вполне можете получить 11 ответов. Вот определение Nvidia: MLOps - это набор передовых методов, позволяющих компаниям успешно использовать ИИ.
Насколько я понимаю - и помню, что я простак, - MLOps является ключом к приведению проектов Data Science в соответствие, например, с передовой практикой разработки программного обеспечения и размышлениями о воспроизводимости как стандарте.
В еще не выпущенном эпизоде How AI Built This - еще одного плагина 😉 - я побеседовал с Эриком Арне Матизен-Дрейфусом о том, что было бы неслыханно, если бы команда разработчиков программного обеспечения не использовала Контроль версий или даже просто не имея общей базы кода для будущих проектов.
Однако в Data Science это часто бывает. Суть работы заключается в том, чтобы собрать решения, посмотреть, что работает, и работать с ними, в конечном итоге что-то попадает в производство. А для следующего проекта вы начинаете все сначала.
Тем не менее, действительно двигаться вперед и оказывать влияние на бизнес, что, скажем прямо, является основной целью для большинства - MLOps будет ключевым фактором, или, безусловно, так кажется.
Кто отвечает за MLOps?
Ах, пресловутая банка с червями.
Некоторые говорят, что хорошая команда специалистов по анализу данных в какой-то мере внедрит эти методы в свою повседневную работу или, по крайней мере, будет отстаивать передовой опыт.
Некоторые говорят, что это совершенно другая работа, и рост числа инженеров машинного обучения или искусственного интеллекта стал подтверждением этой школы мысли.
Интересный комментарий, сделанный Эриком на шоу, заключался в том, что это работа, которую нужно выполнить прямо сейчас, и да, в идеале у вас была бы команда MLOps, но если вы не можете получить бюджет штата от бизнеса, вам нужно будет возьмите слабину. Со временем и по мере того, как инструменты станут лучше, вы с большей вероятностью сможете перетасовать колоду и организовать команду немного по-другому.
В конце концов, это определенно будет в компетенции команды Data Science, потому что это напрямую влияет на их модели.
Инструменты:
Как и в случае с DevOps 10 лет назад, мы все еще находимся в зачаточном состоянии инструментов MLOps. Есть несколько крутых компаний, таких как Valohai в Финляндии, которые делают интересные вещи, и я провел несколько замечательных бесед с компаниями в Великобритании, пытающимися решить некоторые из этих проблем.
По мере того, как мы получаем более сложные инструменты, я думаю, что MLOps станут нормой для большинства команд, занимающихся наукой о данных, и таких блогов, как этот, больше не будет!
Так что следите за этим пространством, я полагаю!
Структура команды и должности:
Об этом труднее написать в блоге, но, вероятно, стоит подумать, если вы отвечаете за команду по анализу данных или работаете специалистом по данным. Если вам нравится эта часть своей работы, ваши навыки будут очень востребованы, и это отличная новость.
Если вы управляете командой, было бы разумно подумать, как вы можете максимально использовать имеющиеся у вас навыки и, возможно, не ожидать, что они будут строителем моделей, инженером по данным, инженером по программному обеспечению и специалистом по MLOps.
По моему самому скромному мнению, нам нужно отказаться от названия «Data Scientist» - это слишком многообещающе. Инженер по MLOps, инженер по данным и, может быть, что-то вроде специалиста по данным о продукте или специалиста по анализу данных ?! Хорошо, когда они работают вместе и, может быть, даже с каким-то кроссовером, но понимая, что все они играют немного разные роли.
И вот оно - мой горячий взгляд на все, что касается MLOps. Дайте мне знать, что вы думаете!