Не переусердствуйте: как эффективно использовать возможности машинного обучения

Вместо того чтобы создавать большие проекты для создания идеальной модели, организациям следует быстро создавать прототипы и быстрее получать доступ к ценности из нетронутых вариантов использования.

Принцип Парето, широко известный как «80/20», предполагает, что большая часть ценности достигается при первом небольшом приложении усилий. Применяя эту концепцию к стратегическому управлению проектами по анализу данных, вот два простых, но полезных применения этого принципа эффективности:

Убывающая отдача: 80% точности модели можно обнаружить за 20% времени.
За время, необходимое для создания одной идеальной модели, мы могли бы создать пять несовершенных. Копание в поисках лучшего результата и ручная настройка модели в конечном итоге становятся «роскошным» занятием, которое следует применять в ситуациях, когда очевидно, что имеет смысл тратить время на повышение качества. Но в большинстве случаев даже базовый подход линейной регрессии с несколькими переменными является более целостным подходом к нацеливанию на конкретный ответ, чем просто на глазок или предположение.

Быстрая ошибка: 80 % ценности содержится в 20 % возможных вопросов по моделированию.
Нам необходимо создать процесс, позволяющий быстро обнаруживать наиболее ценные области для вложения времени, поскольку не все анализы заканчиваются. до ценного. Некоторые результаты просто невозможно предсказать — либо потому, что нам не хватает правильных драйверов, либо просто потому, что случайность играет слишком большую роль. В любом случае важно не переусердствовать с анализом и не управлять проектом. Эффективное получение первого ответа помогает расставить приоритеты в отношении того, какие обсуждения должны происходить.

Эти два утверждения на самом деле сходятся: создайте множество несовершенных моделей. Быстрое прототипирование позволяет нам фильтровать и быстро отбрасывать плохие модели, а быстрое развертывание позволяет нам сразу начать осознавать ценность. Увеличение объема работы приводит к уменьшению отдачи, и, учитывая, что пропускная способность команд ограничена, дальнейшие инвестиции после определенного момента нецелесообразны, поскольку они не принесут эффективных результатов.

Конечно, некоторые проекты по науке о данных должны быть осторожными и обдуманными: например, идентификация объектов для беспилотных автомобилей или регулируемые модели банковских рисков. Но для подавляющего большинства практических бизнес-приложений планка, которую необходимо преодолеть, — это не 100% точность, а скорее улучшение внутреннего чутья.

В конечном счете, в большинстве организаций существует длинный список решений, принимаемых с ограниченным руководством на основе данных, что даже простое машинное обучение может легко обеспечить инкрементальность. Быстрое рассмотрение ряда тем, поиск «довольно хорошего» ответа и широкая демократизация AI/ML — это достойная стратегия работы с данными на ближайшую перспективу.

Первоначально опубликовано на Einblick:https://einblick.ai/dont-over-invest-efficiency-is-the-name-of-the-game-when-operationalizing-ml/

Einblick – это первая в мире платформа обработки визуальных данных, обеспечивающая наиболее естественное взаимодействие с данными. Зарегистрируйтесь на пробную версию https://einblick.ai/try-einblick/

Не переусердствуйте: как эффективно использовать возможности машинного обучения

Вопросы по теме