Промышленность наконец осознает потенциал машинного обучения для прогнозного анализа. Но специалисты по обработке данных, столкнувшиеся с проблемой прогнозирования (прогнозирование спроса, профилактическое обслуживание, прогнозирование оттока…), обычно предпочитают один из двух одинаково неадекватных подходов:
- Обычное моделирование: «Если я буду тренировать, проверять и тестировать свой случайный лес, как в школе, все будет в порядке».
- Неверная изощренность: сети LSTM изначально последовательны! Давайте надрать задницу последними достижениями в области глубокого обучения ».
В другом месте мы описали, почему обычное моделирование не работает с временными рядами. Цель этой статьи - объяснить, почему второй подход не работает - почему глубокое обучение не работает для большинства задач промышленного прогнозирования.
На это есть три основные причины.
- Модели глубокого обучения не являются последовательными. Их внутренние параметры не обновляются последовательно.
- Для обучения моделей глубокого обучения требуется гораздо больше данных, чем генерирует большинство промышленных процессов.
- Некоторые нейронные сети (например, сети LSTM) теоретически могут обрабатывать временные ряды, но их прогнозы трудно объяснить. А в промышленности объяснимость часто так же важна, как и точность.
Как следствие, модели глубокого обучения, применяемые к задачам промышленного прогнозирования, часто неэффективны… простые запаздывающие значения! Мы видели это снова и снова - в столь разных контекстах, как потребительские товары, электронная коммерция и автомобильная промышленность. .
Итак, что нужно сделать?
По нашему опыту, три тактики моделирования способствуют точности прогнозов:
- Последовательное обучение. Постепенное обучение и тестирование вашего решения («бэктестинг») обычно дает вам мгновенный прирост точности на 10–15%.
- Агрегирование в Интернете. Вместо использования одной сверхсложной модели или переключения с одной модели на другую на основе конфигурации данных используйте диверсифицированную и адаптивную комбинацию прогнозных моделей. Эта методология не только повышает точность, но и улучшает интерпретацию.
- Отраслевой опыт. Используйте окружающий вас человеческий опыт для разработки функций, выбора модели, определения функции стоимости ... Это будет стоить в сто раз больше, если вы будете бесконечно настраивать вашу модель глубокого обучения.
***
Посетите Блог Datapred, чтобы узнать больше о машинном обучении, потоковой передаче данных и приложениях непрерывного анализа, и эту страницу, чтобы ознакомиться с обширным списком онлайн-ресурсов по машинному обучению и временным рядам.
Темы: временные ряды, машинное обучение, последовательные данные, бэктестинг, нейронные сети, глубокое обучение, LSTM.
Первоначально опубликовано на www.datapred.com.