«Если бы мне дали один час, чтобы спасти планету, я бы потратил 59 минут на определение проблемы и одну минуту на ее решение».

— сказал Альберт Эйнштейн. Верно ли это в разработке моделей науки о данных?

Согласитесь, часто процесс разработки модели теряет фокус на решаемой проблеме, что приводит к неудовлетворенным ожиданиям вплоть до отказа от проекта. Это так распространено в проектах по науке о данных, что восемь из 10 терпят неудачу. Но почему это происходит?

Часто определение нужных стейкхолдеров и тесное сотрудничество с ними не планируется сразу в начале проекта. Хотя это так важно для успеха проекта, ему не хватает предельной концентрации и суждения.

Прежде всего важно знать, как эти модели будут использоваться, каковы будут их результаты и какую цель эти результаты будут решать. Точнее, цели модели не сформулированы четко. Сквозные процессы, в которых будут использоваться модели, четко не сформулированы и не задокументированы. Влияние моделей на эти процессы широко не обсуждается и не одобряется. Остается много неясных заявлений и незавершенных работ. Полная общая картина процесса или качества недоступна. Диаграмма процесса, включающая модели и их истинное влияние, тщательно не изучается, не проверяется и не утверждается. То, как это влияет на объекты вне процессов, недостаточно изучено.

Кроме того, когда в эти обсуждения не вовлечены нужные заинтересованные стороны, детали процесса недостаточно выявляются, проверяются и утверждаются. Спешка перейти к следующему шагу и выполнить более увлекательную работу по разработке моделей отвлекает команду разработчиков. В плане не заблокировано достаточное время, или не установлены надлежащие качественные ворота, и это расходится в обе стороны команды.

Все эти неясные цели, пробелы в ожиданиях относительно того, как эти модели будут использоваться, создают много проблем в будущем, и в конечном итоге вы можете обнаружить, что модель была разработана для решения проблемы, отличной от ожидаемой.

Итак, как обеспечить цель моделей, абсолютно ясно, и они построены соответственно. Все модели на самом деле неверны — модель верна только для своей цели. Таким образом, чтобы построить модель, соответствующую цели, необходимо взаимодействие с соответствующими заинтересованными сторонами с самого начала проекта. Обсуждения с заинтересованными сторонами должны быть всесторонними и тщательными, чтобы прийти к абсолютно обоснованным выводам о целях моделей и их использовании. Это потребует полной проработки сквозных процессов, того, как модели будут использоваться и как они будут решать проблемы, тщательно обсуждаются, согласовываются, документируются и утверждаются. Наконец, влияние моделей на сквозные процессы должно быть проверено и одобрено заинтересованными сторонами, чтобы обеспечить их соответствие ценностям, принципам и кодексам поведения организации.

Следовательно, чрезвычайно важно четко определить цель моделей, их цели и результаты, которых они должны достичь, а затем все, что последует, должно следовать этой цели. Разработанная модель будет отвечать всем ожиданиям и будет этичной.

Первоначально опубликовано на https://www.seemasutradhar.com