Автор Ниша Шукат - 27 ноября 2018 г.

Недавно я встретился с директором по данным успешной компании HealthTech на конференции машинного обучения в Нью-Йорке. Мы прослушали несколько очень интересных выступлений и предложили решения машинного обучения от великих спикеров. Из любопытства я спросил его, с какими проблемами они обычно сталкиваются при выполнении нового проекта машинного обучения. Неудивительно, что я обнаружил следующее:

№1. Управление данными сложное

Большинство их систем не подключены. Источников данных много, и данные хранятся в различных форматах в нескольких базах данных. Когда ученые запрашивают данные, в большинстве случаев технические группы не знают об источниках, и даже они существуют из прошлого. Для выполнения таких задач задействуется много ресурсов, и для получения приличного набора данных требуется слишком много времени и циклов туда и обратно. Неудивительно, что сбор и подготовка данных (неоднократно) в конечном итоге оказываются самыми длинными и дорогостоящими циклами из всех этапов реализации машинного обучения.

№2. Задержки и время до понимания

С момента запуска проекта просто требуется слишком много времени, чтобы получить какие-либо практические идеи для бизнеса. Деловые люди привыкли получать гибкие поставки от технических команд, и они ожидают того же от команд ИИ. Но существует длинный цикл между настройкой, подготовкой данных, определениями моделей, тестами и т. Д., И к тому времени, когда они смогут представить бизнесу какие-либо идеи, будет уже слишком поздно.

№3. Стоимость инфраструктуры

Масштабируемая инфраструктура необходима для внедрения и запуска моделей искусственного интеллекта. Так что для этого необходимы предварительные вложения. По мере того, как все больше и больше моделей тестируется и повторно тестируется, эта стоимость имеет тенденцию к росту. Чаще всего оправдать такую ​​стоимость непросто, особенно при наличии шипов.

№4. Дорогие ресурсы

Что ж, известно, что для машинного обучения требуются специалисты по данным, а они стоят дорого. Помимо потребности в таких специализированных МСП, зарождающийся характер проектов машинного обучения в сочетании с неопытностью и отсутствием каких-либо хороших унифицированных платформ для рабочих процессов машинного обучения также создает потребность в нескольких инженерах для создания платформы, управления данными и управления выпусками. .

№5. Плохая видимость

Трудно получить реальную картину прогресса почти до самого конца, чтобы убедиться, действительно ли проект движется в правильном направлении. Обычно это «черный ящик» от начала до конца, поскольку нет единой системы или портала, который мог бы дать представление о ходе деятельности, показателях качества или показателях эффективности, которые помогают управлять проектом, оценивать риски и помочь предоставить реалистичную информацию спонсорам и заинтересованным сторонам бизнеса. Отсутствие видимости не позволяет «быстро выйти из строя» и приспосабливаться, не возвращаясь каждый раз «обратно к чертежной доске».

№6. Загадка сборки и покупки

Спонсорство со стороны высшего руководства направлено на получение скорейшего окупаемости инвестиций, даже если это означает переход к готовым решениям. Увы, ML - это всего лишь средство для достижения цели, то есть настоящая цель - это желаемый бизнес-результат (функция), обеспечиваемая ML. Машинное обучение само по себе не является результатом для бизнеса. Они хотят первыми войти в сферу машинного обучения и добиться быстрых результатов в бизнесе, в настоящее время у них нет другого выбора, кроме как построить дорогостоящий фундамент, поскольку отсутствуют промышленные готовые решения, которые помогают легко автоматизировать рабочие процессы машинного обучения.

Он упомянул, что по крайней мере 80% усилий по проекту направлено на неосновные виды деятельности, такие как создание инфраструктуры, подготовка данных и технические основы, а не на базовую науку о данных и алгоритмы для решения реальной бизнес-проблемы. Надеюсь, это изменится в следующем десятилетии, когда появятся более готовые к использованию платформы.

Мои последние мысли, когда я закончил разговор, заключались в том, что определенно существует пробел на рынке для платформы корпоративного уровня, которая поможет беспрепятственно автоматизировать рабочие процессы машинного обучения, так что основное внимание и инвестиции могут быть направлены на решение основных бизнес-проблем, а не на создание технической базы.