Машинное обучение пришло на предприятия. Раскрутите бутылку в любом деловом районе, и это укажет на банк, автоматизирующий функции бэк-офиса, страховую компанию, строящую модели для оценки претензий, инженерную фирму, прогнозирующую, когда ее активы нуждаются в обслуживании, или юридическую фирму, занимающуюся компьютерной проверкой дел. Специалисты по данным проникли в каждую из этих компаний и меняют правила игры. Но точно так же, как специалисты по обработке и анализу данных находятся на пороге переворота в бизнесе, появились технологии, способные изменить науку о данных: машинное обучение автоматизируется.

Такие инструменты, как Praxata и Trifacta, значительно сокращают нагрузку на специалистов по обработке данных, связанных с очисткой и подготовкой данных, а такие платформы, как RapidMiner и DataRobot, автоматизируют моделирование и статистический анализ. Хлеб с маслом науки о данных, тяжелая работа, теперь может выполняться — таково обещание некоторых из этих поставщиков — «грамотными в науке о данных» аналитиками, которые дешевле и намного легче найти, чем востребованные специалисты по данным правильно. Это музыка для ушей руководителей, нуждающихся в талантах машинного обучения.

Три способа, которыми изменится роль специалистов по данным

Но означает ли это, что специалисты по данным скоро станут лишними? Едва ли. Оказывается, интерпретировать вывод программного обеспечения для автоматизированного машинного обучения непросто. (Вы говорите, что AUC против LogLoss?) Тем не менее, поскольку программное обеспечение выполняет большую часть беготни, роль специалистов по данным в бизнесе резко изменится: наука о данных будет меньше заниматься взломом, а больше — влиянием на бизнес.

1. Максимизируйте ценность для бизнеса, а не AUC

Специалисты по данным должны будут переосмыслить свои результаты и перейти от построения моделей к генераторам ценности. Это означает измерение успеха не с точки зрения показателей точности, а с точки зрения чистого нового дохода, полученного бизнесом, или полученной экономии средств. Этот сдвиг не означает пренебрежение точностью модели; вместо этого он предполагает, что специалисты по данным должны брать на себя ответственность за модели, которые они создают, а также записывать и демонстрировать их ценность.

2. Обеспечьте обучение и надзор

Поскольку машинное обучение становится все более распространенным на предприятиях, бизнес-пользователям потребуется помощь. Поскольку все больше людей используют инструменты обработки данных, извлекая информацию из прогностических моделей и продавая клиентам приложения машинного обучения, подавляющему большинству конечных бизнес-пользователей будет не хватать знаний для эффективного использования своих новых возможностей. Специалисты по данным должны взять на себя роль преподавателей, распорядителей и защитников продуктов и услуг машинного обучения. Это может принимать различные формы, начиная от форумов и руководств по передовому опыту и заканчивая процессами поддержки и управления.

3. Ведите бизнес

Сегодня большинство руководителей высшего звена понимают важность науки о данных для их бизнеса, но им не хватает знаний, чтобы воплотить это в жизнь. Это начинается с запутанной терминологии (AI, IA, когнитивный и т. д.) и метастазирует в ошибочные стратегические инициативы (см., например, IBM). Специалисты по данным должны проявлять инициативу в разработке и озвучивании видения бизнеса, трансформируемого машинным обучением. Лучшими специалистами по данным будут те, кто сможет оторваться от своих Jupyter Notebook и представить новые возможности, продукты и услуги, а также бизнес-модели.

Времена, когда команда по анализу данных работала в подвале вдали от штаб-квартиры, прошли. В течение следующих нескольких лет роль специалистов по данным будет развиваться и становиться более заметной в бизнесе. Поскольку новые инструменты освобождают специалистов по обработке и анализу данных от многих более утомительных задач, пришло время инвестировать в партнерство с функциональными и бизнес-лидерами. Будущие специалисты по данным будут оцениваться не по показателям точности, а по их влиянию на итоговый результат.