Model Drift — Машинное обучение

Прогнозные модели также страдают от изменений, которые происходят с течением времени, и очень важно решать проблемы ухудшения качества модели при ее производственной реализации

Введение:

Изменения неизбежны, и ваша прогностическая модель не является исключением 😊 Когда производительность вашей модели со временем ухудшается, это называется дрейфом модели или распадом модели. В целом существует два типа дрейфа модели.

1. Дрейф концепции

2. Дрейф данных

Движение концепции:

Когда прогностическая способность модели со временем ухудшается с тем же набором функций/меток, это случай дрейфа концепции. Возьмем классическую задачу машинного обучения прогнозирования цен на жилье, где нам нужно предсказать цену дома на основе определенного набора признаков. Если вы построили модель с данными за 2019 год и пытаетесь предсказать цены на жилье в 2020 году, ваши результаты будут лучше. Если та же модель используется для прогнозирования цен на жилье в 2021 году, очень высока вероятность того, что ваша модель не будет столь же хороша, как в 2020 году.

Дрейф данных:

В модель вводится новый набор меток, тогда этот тип дрейфа называется дрейфом данных. В классификации кошек и собак, если вводится новый класс коров, то он подпадает под дрейф данных по мере введения нового ярлыка. Для проблемы регрессии границы вашего прогноза могут измениться. Продажи определенного продукта подскочили и больше не следуют шаблону, изученному моделью, в случае дрейфа данных.

Есть шанс, что концепция и дрейф данных существуют вместе!!!

Способы определения дрейфа модели

В случае дрейфа концепции используемая метрика оценки поможет вам понять, является ли модель стабильной или дрейфующей. Например, если мы моделируем прогнозы с точностью 98%, пока вы строите модель, и когда вы тестируете ту же модель через год, точность может упасть до 90%. Дрейф данных становится очевидным по мере введения новых классов.

Устранение дрейфа модели

Существует несколько способов устранения дрейфа модели.

Сначала давайте посмотрим, как бороться с дрейфом данных. Мы можем использовать переобучение модели с новым набором меток. Это похоже на переобучение с нуля и требует много времени. Это помогает разместить новый набор меток

Дрейф концепции можно устранить с помощью следующих методов:

1. Со временем переоборудуйте модель

2. Больше веса последним данным

3. Обновление модели

4. Модели ансамбля

Давайте углубимся в каждый из методов, предложенных выше для дрейфа концепций.

1. Подгонка модели с течением времени. Модели можно периодически обучать с использованием нового набора данных, чтобы устранить отклонения концепций. Одним из примеров является планирование заданий для обучения модели и ее развертывания в начале каждого месяца.

2. Больший вес последним данным. Придание большего веса последним данным поможет устранить дрейф концепций. Но его применение ограничено моделью, в которой используются веса/коэффициенты. В НЛП существует концепция, согласно которой больший вес придается последним словам, наблюдаемым в абзаце, а не словам, которые находятся дальше (https://arxiv.org/abs/1706.03762).

3. Обновление модели: вместо того, чтобы полностью переделывать модель, мы можем использовать предыдущую модель в качестве отправной точки для обучения модели с новыми данными. В scikit Learn есть такой параметр, как теплый старт, который поможет вам достичь этого. В случае нейронных сетей вы можете использовать предыдущий вес в качестве отправной точки для переобучения модели (перенос обучения).

4. Ансамблевые модели: в случае ансамблевых моделей предыдущая модель остается неизменной. Новая модель обучается с новым набором данных на основе выходных данных предыдущей модели. По сути, новая модель будет понимать взаимосвязь между недавними изменениями, наблюдаемыми по отношению к старой модели.

Сводка

В этой статье мы рассмотрели, что такое дрейф модели, и его широкую классификацию. Кроме того, мы обсудили, как обращаться с различными методами, применяемыми для устранения дрейфа модели.

Model Drift — Машинное обучение

Вопросы по теме