За последние несколько лет для практиков машинного обучения (ML) было разработано так много инструментов. В некоторых случаях то, что разработано, устаревает в удивительно короткий период времени, то есть от 6 до 12 месяцев.

Это инструменты. И если они все, что вас волнует, вы упускаете большую картину. Если вы создаете модель машинного обучения, которая мало или не приносит пользы вашим потребителям, выбор инструментов не имеет значения. Техническая зрелость машинного обучения должна быть на втором месте по сравнению с поиском ценности с помощью моделей машинного обучения. Некоторым практикующим это покажется немного похожим на курицу и яйцо. Итак, распакуем эту птицу.

С чего начать? Преодолеть эту стену между специалистом по обработке данных и инженером, то есть преодолеть разрыв между этими двумя ролями? Это полезно. Однако есть еще одна роль, которая еще не получила подобной известности - менеджер по продукту машинного обучения. Индустрия любит специалистов по данным, а теперь любит инженеров машинного обучения, но понравится ли им менеджер по продуктам машинного обучения? Я подозреваю, что эта роль не получит такой же известности, но, возможно, должна!

Сама роль не так важна, как то, что она представляет - сотрудничество между теми, кто разбирается в машинном обучении, и «бизнесом». Эта нечеткая роль хранит ключи к созданию ценности. Одним из аспектов моей работы является выполнение заданий по обнаружению, которые конкретно связаны с тем, что представляет собой эта роль.

Чтобы лучше проиллюстрировать цель этой роли, я собираюсь провести вас через то, что происходит на тех сессиях Discovery, которые стремятся сформулировать постановку проблемы, исследовать пространство решения и определить архитектуру решения и подход. В мире до COVID это, скорее всего, делалось в одной комнате с доской. Однако мы живем в мире работы из дома (WFH), поэтому тактика потребовала некоторой корректировки, о которой я также расскажу.

Это не претендует на то, чтобы быть исчерпывающим, но я надеюсь, что он даст вам представление о том, как проектировать и проводить семинары по открытию.

Постановка задачи

Команды могут с трудом сформулировать стоящие перед ними бизнес-задачи. Это преодолевает первое препятствие на пути к созданию ценности - этого просто невозможно сделать, если вы не понимаете этих проблем. И даже если вы понимаете их, все равно остро необходимо хорошо объяснить их группе людей, которые должны быть убеждены в общей цели.

Я провожу команды через семинар, созданный для того, чтобы помочь лицам, принимающим решения, сформулировать постановку проблемы, которая поможет в формулировании эффективных и послушных решений. Особое внимание уделяется пониманию статус-кво, например. корпоративные стратегии, стратегии машинного обучения и данных. Как правило, проекты, основанные на этих стратегиях, сосредоточены на одном из трех показателей золотого треугольника. Отсюда мы можем лучше понять, нужно ли сосредоточить внимание на существующем направлении или необходимо исследовать поворот в другом направлении.

По моему опыту, этот процесс может быстро усложниться, когда приоритеты смещаются в сторону задач, которые не основаны на знании конкретных наборов данных, а скорее концептуальны по своей природе. Это создает туман, который лица, принимающие решения, должны принять как риск, который может привести, а может и не привести их к постановке проблемы, которая будет менее решаемой или действенной (важно придумать несколько утверждений и расставить приоритеты).

Именно в этот момент комментарий о курице и яйце может показаться вполне реальным. Живой опыт решения связанных проблем может помочь рассеять этот туман, но также не стали бы вы участвовать в более расходящейся постановке проблемы, если бы вы придерживались того, что уже знаете?

Семинар завершается, как вы уже догадались, упражнением по постановке задачи. Опыт ничем не заменит - если вы делаете это впервые, найдите время, чтобы подготовиться и оспорить свои собственные предположения. Подобные семинары, которые я провожу, следует рассматривать как ритуалы. Посредством итераций команды найдут свое место.

Идея

Вышеупомянутое согласуется со вторым семинаром, посвященным идеям - это исследование способов решения постановки проблемы. Это, наверное, любимый всеми семинар, потому что есть большая степень свободы для выражения мнений, исследуя пространство решений как можно шире.

Это исследование не безгранично. Фактически, это ограничено по времени. По мере того, как идея распространяется вовне, она должна в конечном итоге сжиматься внутрь в сторону идей, которые четко сформулированы и расставлены по приоритетам с учетом таких качеств, как сговорчивость и влияние.

Не все мастерские одинаковы. Успех идеи сводится к знаниям, опыту и участию участников, а также способности фасилитатора «управлять кораблем». Из недавнего опыта стало ясно, что раннее введение прослеживаемости и ударных качеств бесполезно. Почему? Они очень рано начали свой путь к машинному обучению. Их знания и опыт потребовали от меня опираться на более знакомые качества для оценки идей. Это способствовало более плодотворному диалогу и значимой приоритизации идей.

Как вы понимаете, более широкий набор фонов, т. Е. разнообразие деловых, технических и предметных знаний - должно быть задействовано. Обладая таким опытом, легче полностью исследовать пространство решений и набирать обороты для идей. Это основа достижения консенсуса в отношении решения машинного обучения, определяющего ценность.

Влияние

Здорово! Теперь идея стала приоритетной. Однако каков подход, архитектура решения? Соответствует ли это ограничениям людей, процессов и технологий? Это вопросы, которые задают на третьем и заключительном семинаре. Он не фокусируется на том, почему и что нравится на предыдущих двух семинарах, а скорее на том, как.

Это, безусловно, наиболее технический семинар - не говоря уже о том, что технические умы не должны участвовать в других - без более глубокого знания данных и систем участники могут почувствовать себя очень сложными из-за этого семинара без правильного состава людей. Надеюсь, к настоящему времени стало очевидно, что фон участников меняется в зависимости от семинара и имеет решающее значение для успеха каждой сессии.

На этом заключительном семинаре стратегия команды в области науки о данных, если она не до конца понята, становится ярко ясной не только для фасилитатора, но и для участников. Нельзя сказать, что отсутствие стратегии является препятствием для сделки. Напротив, перед тем, как с головой окунуться в инженерное дело, полезно определить степень сильных сторон команды. То же самое с доступностью данных и ограничениями инфраструктуры.

Проводя этот семинар лично, легко заставить людей рисовать диаграммы на доске, и разговоры естественным образом движутся в этом направлении. Однако в условиях WFH существует острая необходимость в создании и поощрении такого поведения.

Делаем семинар дружественным к WFH

Я сделал все эти семинары дружественными к WFH, используя Miro, и это было фантастически. У каждого семинара есть информационная панель Miro, по которой могут перемещаться все участники, эффективно заменяя презентационную панель, стикеры, доску и маркеры, которые в противном случае были бы в физической комнате.

Однако сами по себе инструменты не обеспечивают гладкую работу. Образ мышления и процесс важны. Например, жестко контролируются поток и время действий, что важно даже при личной встрече, но очень важно во время видеозвонка, потому что никто не хочет, чтобы разговорчивый Терри занимал все время разговора. Вот почему я обычно разбиваю каждое упражнение на три части.

Каждому нужно время, чтобы подумать самостоятельно и записать идеи и концепции на панели инструментов. Затем следует пиринговая сессия, во время которой участники делятся мнениями и получают обратную связь от товарищей по команде. Затем происходит обмен со всей группой. Такое наращивание помогает обрабатывать стандартный стиль общения «один ко многим» в видеозвонках, чтобы заменить стиль общения «многие ко многим» в физической комнате. Это также поощряет участие всех, что будет происходить по-другому, когда мы будем лично.

В итоге - мы танцуем

Пессимисты сказали бы, что это все равно что пасти кошек, но лично я считаю, что ценить что-то сложное и рискованное, например ML, - это скорее танец. Несколько человек приходят с разных точек зрения, но все пытаются попасть на одну и ту же страницу.

Понимание общей картины, а также деталей неоценимо. Оба часто не присутствуют у одного человека, а распространяются по группе, поэтому общие процессы, описанные выше, становятся настолько важными. В каждом должно проявляться лучшее.

Конечно, на некоторых могут наступить пальцы, и одной мелодии (т. Е. Итерации этого процесса) может быть недостаточно для ночного клуба, но если вы придете на вечеринку с непредвзятым намерением, готовым отдать и посвятить себя процессу, есть хороший шанс, что вы уйдете счастливее, мудрее и станете танцевать по-своему.