4 причины, по которым так сложно создавать продукты для машинного обучения!

Перевод, ценообразование, вождение, сельское хозяйство, производство ... Число возможных приложений машинного обучения продолжает расти. Эта тенденция привлекает еще больше предпринимателей, чтобы рискнуть в этой сфере. Появляются сотни небольших компаний и агентств, занимающихся ИИ, с зачастую очень похожими ценностными предложениями: помочь клиентам определить варианты использования машинного обучения, разработать модели машинного обучения на основе данных клиентов и превратить их модель в ценность путем автоматизации бизнес-процессов или улучшения процесса принятия решений.

Но редко наблюдается превращение одной из этих компаний в (масштабируемую) продуктовую компанию, хотя многим хотелось бы.

Но почему так сложно создавать продукты машинного обучения?

Что такое продукт машинного обучения?

Давайте сначала рассмотрим, что я имею в виду под продуктом машинного обучения: это часть программного обеспечения, в основе которой лежит обученная модель машинного обучения (например, нейронная сеть), которая предоставляет ее в качестве услуги. Через API или веб-сайт покупатель может использовать эту модель со своими собственными данными для решения определенной задачи, например, пометить спутниковое изображение, персонализировать свой веб-сайт для конкретного потребителя или получить представление о своих маркетинговых данных.

Разве при таком большом количестве приложений машинного обучения не должно быть много возможностей для машинного обучения как услуги (MLaaS)?

Я хотел бы утверждать, что масштабируемость этой бизнес-модели довольно ограничена из-за топлива, которое движет моделью машинного обучения: данных.

Проблема 1. Модель зависит от контекста

Для масштабирования MLaaS необходимо добавить нового клиента с относительно низкими затратами, и он должен приносить пользу множеству клиентов. Для этого необходимо обобщить модель на данные, которые модель еще не видела - в данном случае - новый заказчик. Однако проблема заключается в том, что модель машинного обучения очень зависит от контекста, а лучше сказать, от контекста, из которого были получены данные обучения. Алгоритм беспилотного вождения автомобиля, который был обучен в заснеженной Канаде, может не работать на песчаных дорогах Дубая.

Существуют подходы к использованию моделей, обученных в определенном контексте, в другом контексте, но они часто требуют, по крайней мере, некоторой адаптации к новому контексту - все еще остается открытым, можно ли автоматизировать этот процесс адаптации.

Более того, если модель игнорирует контекст конкретной компании, она может потерять ценную информацию, которая может повысить точность. Один из примеров - изменить размер изображений и получить разрешение, требуемое для модели машинного обучения, или исключить определенные региональные характеристики клиентов, которые модель не может уловить. Это может привести к худшим результатам модели, чем модель, зависящая от контекста. Поэтому адаптация модели к конкретному контексту клиента является серьезным препятствием для многих продуктов машинного обучения.

Задача 2: модель требует стандартизированных входных данных

Следующая проблема носит технический характер: вероятно, каждая компания имеет разную схему данных и использует разные форматы. Поскольку машинное обучение как услуга требует, чтобы все вводимые данные были в одном формате, сначала необходимо преобразовать данные. В то время как компания может предоставить инструменты и алгоритмы, которые преобразуют данные в формат, преобразование данных часто является специфической для клиента и, следовательно, трудоемкой задачей, которая не масштабируется.

Вызов 3: контекст меняется

Даже если мы научились моделировать данные из контекста, которые также делали прогнозы, вполне возможно, что контекст уже изменился. Компании меняют свою бизнес-модель, люди - свое поведение и т. Д .; Прекрасный пример - ценность денег. Правило принятия решения, полученное на основе набора данных о ценах в 2012 году, может оказаться недействительным в 2019 году из-за инфляции. Когда базовые данные меняются, это означает, что модель всегда нужно адаптировать к новой реальности.

Как и любой другой вид программного обеспечения, модель машинного обучения необходимо поддерживать и адаптировать к новому контексту.

Задача 4: модель меняет контекст

Но не только мир меняется, но и модель может изменить мир. Специалисты по машинному обучению любят делить мир на функции и прогнозные переменные, то есть точки данных, которые входят в модель в качестве входных данных, и переменную, которую следует прогнозировать. Однако они часто забывают, что могла быть обратная ссылка от прогнозируемой переменной к входным переменным.

Из-за отсутствия независимости выходные данные модели могут стать недействительными из-за самой модели. Прекрасным примером является проект Google по гриппу. В 2008 году исследователи интернет-гиганта обнаружили, что они могут прогнозировать вспышки гриппа в реальном времени по симптомам, которые люди вводят в строку поиска. Они обнародовали это и позволили людям увидеть, как распространяется вспышка гриппа. Спустя всего несколько месяцев модель становилась все хуже и хуже, пока они не решили отказаться от проекта. Что произошло? Говоря о способности Google предсказывать распространение гриппа, люди, вводившие слово «грипп», интересовались не поиском симптомов, а предсказанием гриппа Google. Видимо, это создавало слишком много шума и приводило к потере точности модели машинного обучения.

Кроме того, люди действуют стратегически и могут узнать, как обмануть систему. Примером может служить использование VPN, чтобы при бронировании авиабилета притвориться, что они находятся в Нигерии, а не в Лондоне, чтобы обмануть алгоритм динамического ценообразования. Эти стратегические реакции мира также могут потребовать некоторых корректировок модели машинного обучения или даже создания совершенно нового продукта.

Заключение

Поскольку данные, являющиеся топливом модели, очень зависят от контекста, я думаю, что сложно построить масштабируемые бизнес-модели на основе чистых продуктов машинного обучения, если данные не стандартизированы и не статичны. Конечно, процесс создания моделей имеет некоторую экономию на масштабе, то есть чем больше моделей создает компания, тем больше она может повторно использовать вспомогательные инструменты, структуры архитектуры и извлекать из опыта, однако, в конце концов, трудоемкие части, обслуживание моделей, являются не масштабируемы, и рост компании будет определяться их усилиями по найму.

Хотя автономное машинное обучение как услугу сложно масштабировать для разных клиентов, продукт, работающий на основе машинного обучения, может этого достичь. Предоставить не только двигатель, но и всю машину. Это означает, что продукт получит контроль над контекстом модели за счет интеграции всего бизнес-процесса, а также процесса сбора данных (если это возможно). В контексте B2B это может быть довольно сложной задачей, поскольку большая часть данных остается у клиента. Вот почему, вероятно, многие агентства ИИ не станут производственными компаниями.

Источники

Телеграмма о провале Google Flu

Заявление об ограничении ответственности: все, что сказано в этой статье, отражает мое личное мнение и не связано с моим работодателем, моей компанией или какой-либо другой организацией, с которой я связан.