Дилемма новичков в машинном обучении

Новичок нередко погружается в машинное обучение и не понимает, почему его модели не работают должным образом.

Человеческий мозг чрезвычайно эффективен при обучении многим задачам. Например, распознавание лица, взглянув на него только один раз (обучение за один раз) или объекта после просмотра нескольких образцов (обучение за несколько выстрелов). С другой стороны, модель машинного обучения далека от этой врожденной способности, которая есть у всех нас.

Эффективность моделей машинного обучения зависит от двух основных предпосылок:

Модель изучает основные закономерности в обучающих данных.
Невидимые данные имеют те же закономерности, что и обучающие данные.

Рассмотрим следующие сценарии.

Прогнозирование продаж мороженого!

Рассмотрим компанию по производству мороженого, которая использует модель машинного обучения для оценки продаж в этом сезоне.

В процессе обучения модель изучает циклический тренд продаж мороженого следующим образом:

· летом (больше продаж мороженого).

· вниз зимой (меньше продаж).

Правильные прогнозы делаются, если «циклический тренд остается в невидимых или новых данных».

С другой стороны..

Большинство моделей прогнозирования акций потерпели неудачу в марте 2020 года

Почему? Потому что во время обучения (скажем, на данных за 10 лет) прогностические модели не узнали о резком падении акций из-за неожиданного события — пандемии.

Рабочая модель

Успешное обучение модели зависит от множества факторов, таких как объем данных, качество данных и хорошо настроенная модель.

Что касается модели, делающей прогнозы, можно только «надеяться», что невидимые данные имеют те же закономерности. Потому что в реальном мире изменения невидимых данных могут произойти быстро!

Мониторинг

При постоянном мониторинге выявляются изменения данных и предпринимаются соответствующие действия:

· Если изменения допустимы (например, в связи с обновлением бизнес-процесса), модель переобучается для адаптации к допустимым изменениям.

· По любой другой недопустимой причине (например, просто шум, проникший в систему) необходимо обновить систему машинного обучения, чтобы удалить эти нежелательные данные (и гарантировать, что это не повторится).

Заключение

Важно осознавать, какие предположения мы делаем, что требуется для построения успешной модели и как необходим мониторинг для адаптации к изменениям данных!

Если предпосылки верны, есть хорошие шансы, что заключение будет верным!

Спасибо за чтение!