Проблема глубокого обучения и временных рядов

Промышленность наконец осознает потенциал машинного обучения для прогнозного анализа. Но специалисты по обработке данных, столкнувшиеся с проблемой прогнозирования (прогнозирование спроса, профилактическое обслуживание, прогнозирование оттока…), обычно предпочитают один из двух одинаково неадекватных подходов:

Обычное моделирование: «Если я буду тренировать, проверять и тестировать свой случайный лес, как в школе, все будет в порядке».
Неверная изощренность: сети LSTM изначально последовательны! Давайте надрать задницу последними достижениями в области глубокого обучения ».

В другом месте мы описали, почему обычное моделирование не работает с временными рядами. Цель этой статьи - объяснить, почему второй подход не работает - почему глубокое обучение не работает для большинства задач промышленного прогнозирования.

На это есть три основные причины.

Модели глубокого обучения не являются последовательными. Их внутренние параметры не обновляются последовательно.
Для обучения моделей глубокого обучения требуется гораздо больше данных, чем генерирует большинство промышленных процессов.
Некоторые нейронные сети (например, сети LSTM) теоретически могут обрабатывать временные ряды, но их прогнозы трудно объяснить. А в промышленности объяснимость часто так же важна, как и точность.

Как следствие, модели глубокого обучения, применяемые к задачам промышленного прогнозирования, часто неэффективны… простые запаздывающие значения! Мы видели это снова и снова - в столь разных контекстах, как потребительские товары, электронная коммерция и автомобильная промышленность. .

Итак, что нужно сделать?

По нашему опыту, три тактики моделирования способствуют точности прогнозов:

Последовательное обучение. Постепенное обучение и тестирование вашего решения («бэктестинг») обычно дает вам мгновенный прирост точности на 10–15%.
Агрегирование в Интернете. Вместо использования одной сверхсложной модели или переключения с одной модели на другую на основе конфигурации данных используйте диверсифицированную и адаптивную комбинацию прогнозных моделей. Эта методология не только повышает точность, но и улучшает интерпретацию.
Отраслевой опыт. Используйте окружающий вас человеческий опыт для разработки функций, выбора модели, определения функции стоимости ... Это будет стоить в сто раз больше, если вы будете бесконечно настраивать вашу модель глубокого обучения.

***

Посетите Блог Datapred, чтобы узнать больше о машинном обучении, потоковой передаче данных и приложениях непрерывного анализа, и эту страницу, чтобы ознакомиться с обширным списком онлайн-ресурсов по машинному обучению и временным рядам.

Темы: временные ряды, машинное обучение, последовательные данные, бэктестинг, нейронные сети, глубокое обучение, LSTM.

Первоначально опубликовано на www.datapred.com.

Проблема глубокого обучения и временных рядов

Вопросы по теме