TLDR

Не существует простого уравнения, которое можно решить за время, необходимое для построения модели машинного обучения. Ответ будет зависеть от того, какие данные и модель используются, а также от предполагаемой точности.

Что входит в создание модели машинного обучения

Машинное обучение (МО) получило широкое распространение благодаря своей эффективности при анализе данных и улучшении рабочих процессов. Поскольку машинное обучение интегрируется на разных этапах бизнеса, понимание времени, необходимого для развертывания моделей машинного обучения, становится важным для управления проектами. К сожалению, не существует уравнения, которое могло бы определить время, необходимое для создания и развертывания этих моделей. Поскольку машинное обучение все еще находится в зачаточном состоянии, развертывание моделей все еще не происходит очень быстро. Согласно Состоянию машинного обучения на предприятии в 2020 году компании Algorithmia, 50 % респондентов заявили, что на развертывание одной модели уходит от 8 до 90 дней, и только 14 % заявили, что могут развернуть менее чем за неделю.

Согласно выводам Algorithmia, зрелость программы машинного обучения компании была самым важным фактором, определяющим, насколько быстро они смогут развернуть свои модели. Наличие большего стажа в этой области позволяет компаниям создавать свои команды, данные и системы, чтобы иметь возможность быстрее развертывать модели.

Чем быстрее будут развернуты модели, тем лучше. Машинное обучение, используемое для принятия более обоснованных бизнес-решений, терпит неудачу, если оно не может обеспечить быстрые и точные результаты на основе данных. Часто использование машинного обучения экономически невыгодно, если компании не могут развертывать модели в соответствии с новыми бизнес-операциями.

Наряду со стажем работы в области машинного обучения могут быть и другие факторы, влияющие на то, почему модели не развертываются быстрее. Поскольку модели работают с данными, доступ к нужным типам данных является ключевым фактором при развертывании моделей. Модели лучше всего работают со структурированными данными, для очистки которых требуется время. Пользователи, впервые использующие ML, могут столкнуться с трудностями при сборе или извлечении достаточного количества релевантных данных, если они исторически не сохранялись правильно. Наличие достаточно большого набора данных необходимо для создания эффективной модели. Однако чем больше данных, тем больше вычислительной мощности и времени требуется для выполнения проекта.

Время выполнения для создания моделей может занимать очень много времени в зависимости от объема предоставленных данных и желаемой точности. Точность измеряется количеством правильных прогнозов, деленным на общее количество сделанных прогнозов. Подача большого количества данных и получение достаточно точных прогнозов, чтобы они были статистически значимыми, часто может занимать много времени.

Хотя не все модели требуют чрезвычайно высокой точности, модели, созданные для подробных и важных вариантов использования, таких как здравоохранение, должны быть согласованы с очень высоким уровнем точности.

С появлением новых инноваций в области ИИ время, необходимое для создания модели, показывает признаки снижения. Amazon SageMaker предпринимает шаги, чтобы закрыть этот пробел, помогая пользователям создавать, обучать и развертывать модели. Предлагая широкий спектр фреймворков и алгоритмов, SageMaker обучит модель и поможет развернуть ее в рабочей среде. Такие инструменты, как SageMaker, могут сократить шаги, выполняемые разработчиком, чтобы сэкономить время при построении модели.

При создании собственной модели машинного обучения при управлении временем необходимо учитывать такие факторы, как знакомство разработчиков с созданием моделей, тип используемых вами данных и их размер, а также точность, необходимую для запуска проекта. Если все сделано правильно, машинное обучение может дать отличные результаты и принять более обоснованные бизнес-решения. Поскольку рост финансирования и инноваций не показывает никаких признаков замедления, среднее время, необходимое для развертывания модели машинного обучения, вероятно, будет продолжать снижаться.