В двух словах о профилактическом обслуживании на основе данных

Обзор фундаментальных концепций и популярных алгоритмов

Для сложных систем, таких как самолеты, железные дороги, электростанции, обслуживание является большой проблемой, поскольку оно обеспечивает надежность и безопасность систем в течение их жизненного цикла.

Благодаря использованию возможностей передовых датчиков, технологии IoT и алгоритмов анализа данных, в эпоху Индустрии 4.0 в обслуживании произошел быстрый переход от «реактивного» к «упреждающему»: вместо того, чтобы выполнять обслуживание только тогда, когда отказ уже произошел, Современная стратегия состоит в том, чтобы активно предвидеть деградацию системы и планировать обслуживание «точно в срок». Этот новый тип обслуживания известен как профилактическое обслуживание (PdM).

На практике PdM обычно достигается за счет использования датчиков для постоянного мониторинга состояния системы. Впоследствии алгоритмы анализа данных используются для прогнозирования оставшегося срока полезного использования системы на основе последних измерений. Наконец, соответственно составляется график технического обслуживания, чтобы поддерживать систему в ее первоначальном состоянии.

В основе PdM лежат прогностические методы, которые позволяют прогнозировать тенденцию ухудшения работоспособности системы на основе данных измерений в реальном времени. Вот где сияет наука о данных: модели машинного обучения обычно строятся для определения характеристик текущего состояния работоспособности системы и прогнозирования времени, оставшегося до отказа системы.

В этом посте давайте подробно рассмотрим общепринятые модели на основе данных для выполнения прогностических задач. Эта статья построена следующим образом:

Во-первых, чтобы подготовить почву, мы кратко рассмотрим основные этапы профилактического обслуживания.
Во-вторых, мы классифицируем системы по различным категориям в зависимости от их характеристик и обсудим популярные модели машинного обучения для каждой категории систем.
Наконец, мы поговорим о проблемах, с которыми сталкивается предоставление надежного прогностического анализа.

Давайте начнем!

1. Основные этапы профилактического обслуживания

Основные шаги PdM включают сбор данных, диагностику, прогнозирование и управление здоровьем, как показано на приведенной выше инфографике.

1.1 Сбор данных

Этап сбора данных связан со сбором данных измерений с датчиков и обработкой необработанного сигнала для извлечения полезных функций, которые могут указывать на состояние работоспособности системы. Эта последняя задача широко известна как разработка функций в науке о данных.

Для извлечения признаков обычно используются методы обработки сигналов для преобразования необработанных данных в характеристики в другом домене (например, времени, частоте, частоте времени). Поскольку PdM в основном обнаруживает нестационарные сигналы, инструменты частотно-временного анализа удобны для извлечения признаков в диагностических и прогностических целях. В этой категории наиболее популярными подходами являются кратковременное преобразование Фурье, разложение вейвлет-пакетов, разложение по эмпирическим модам и преобразование Гильберта-Хуанга.

Дополнительным шагом после извлечения признаков является уменьшение признаков. Дело в том, что извлеченных функций обычно слишком много, чтобы их можно было использовать на практике. Популярные методы уменьшения размерности, такие как анализ главных компонентов (PCA), kernel-PCA, Isomap и т. Д., Обычно используются для устранения избыточных функций.

1.2 Диагностика

На этапе диагностики выполняется обнаружение неисправности и идентификация режима отказа на основе извлеченных значений признаков.

Диагностика неисправностей обычно формулируется как проблема классификации. В результате популярные методы классификации, такие как k-ближайшие соседи, машины опорных векторов, деревья решений, случайный лес, широко применяются для прогнозирования меток состояния работоспособности системы с учетом наблюдаемых значений характеристик. Ниже приводится простая иллюстрация применения модели дерева решений для классификации режима отказа системы.

1.3 Прогноз

Следующий шаг PdM - это прогнозирование. Здесь цель состоит в том, чтобы спрогнозировать будущее состояние отслеживаемой системы и оценить оставшийся срок полезного использования системы (RUL), то есть сколько времени пройдет до отказа системы.

Prognostics - это ключевая технология, лежащая в основе интеллектуальной PdM. Поскольку он предсказывает время, в которое система больше не будет выполнять свою предполагаемую функцию, он предоставляет пользователям возможность снизить риск отказа и одновременно продлить срок полезного использования системы.

Естественно, для оценки RUL интенсивно исследуются подходы, основанные на данных. В результате был предложен ряд стратегий машинного обучения для различных случаев применения. В разделе 3 мы рассмотрим некоторые из часто используемых подходов для прогнозирования RUL.

1.4 Управление здоровьем

После обнаружения неисправности системы и оценки оставшегося срока службы системы пора предпринять некоторые действия на основе полученных результатов.

Основная цель этапа управления здоровьем - оптимальное управление техническим обслуживанием и логистической поддержкой, то есть повышение доступности, надежности и безопасности, а также снижение затрат на техническое обслуживание и логистику. Управление работоспособностью обычно формулируется как задача оптимизации с ограничениями, в которой применяются алгоритмы глобальной оптимизации для получения наилучшего расписания технического обслуживания.

2. Классификация характеристик системы.

Прогностические методы обычно различаются в зависимости от типа рассматриваемой системы. Поэтому было бы неплохо сначала классифицировать различные системы на основе их характеристик, прежде чем обсуждать конкретные методы по отдельным категориям.

2.1 Характеристики системы

В общем, мы можем классифицировать систему в зависимости от того, является ли ее состояние наблюдаемым напрямую или косвенно, а также моделируется ли ее состояние как дискретный или непрерывный процесс. Следующее дерево решений иллюстрирует эту схему классификации.

2.2 Прямое или косвенное наблюдение?

Первый критерий - наблюдаемость состояния системы.

В некоторых случаях отслеживаемые данные могут напрямую описывать базовое состояние системы, например, износ и размер трещин. Для этих случаев оценка RUL может быть эффективно сформулирована как проблема прогнозирования временных рядов.

Однако во многих других случаях отслеживаемые данные могут только косвенно указывать на базовое состояние системы, например, мониторинг вибрации и масла для вращающихся машин. В таких ситуациях мы можем сформулировать прогнозную проблему как решение двух связанных уравнений:

Уравнение измерения устраняет разрыв между измеренными значениями характеристик и внутренним состоянием системы. Здесь h (.) Обозначает модель измерения, а ν представляет шум измерения.

Между тем, у нас есть уравнение эволюции состояния, описывающее процесс деградации системы. Здесь f (.) Обозначает модель деградации, а w представляет неопределенность модели. Этот член неопределенности вызван тем, что модель деградации может лишь частично отражать истинный физический процесс.

2.3. Эволюция дискретного или непрерывного состояния?

Второй критерий основан на том, как мы моделируем эволюцию состояния системы.

В некоторых случаях мы предполагаем, что система развивается в пространстве конечных состояний Φ = {0, 1,…, N}, где 0 соответствует идеальному здоровому состоянию, а N представляет состояние сбоя. Эти дискретные состояния могут быть получены на основе значимых рабочих условий на практике, таких как «Хорошо», «Только незначительные дефекты», «Требуется обслуживание», или они могут быть получены путем применения методов неконтролируемой кластеризации к обучающим данным.

В других случаях может иметь смысл моделировать эволюцию системы как непрерывный процесс. Например, внутреннее сопротивление батареи, которое обычно служит индикатором работоспособности литий-ионных батарей, постоянно ухудшается при прохождении последовательности циклов заряда-разряда.

3. Прогностические алгоритмы.

В этом разделе мы обсудим некоторые из обычно используемых методов машинного обучения для целей прогнозирования, то есть для прогнозирования оставшегося срока службы системы (RUL). Мы организуем наше обсуждение в соответствии с категориями, представленными в предыдущем разделе.

3.1 Марковские модели

Марковские модели полезны для систем, состояния которых непосредственно наблюдаемы и эволюционируют дискретным образом.

В общем, методы Маркова моделируют деградацию системы как случайный процесс, который перескакивает между конечным набором состояний Φ = {0, 1,…, N}. Здесь 0 соответствует идеальному работоспособному состоянию, а N представляет неисправное состояние. Последовательность состояний составляет цепь Маркова.

Основное предположение модели Маркова состоит в том, что будущее состояние системы зависит только от текущего состояния системы. Это свойство также известно как марковское свойство.

В рамках моделирования цепей Маркова RUL можно определить как количество времени, которое потребуется процессу деградации для перехода из текущего состояния в состояние отказа N в первый раз. Это также известно как время первого прохождения (FPT).

Конечно, для вычисления RUL с использованием методов Маркова нам необходимо знать количество состояний и матрицу вероятностей перехода A между состояниями, где Aᵢⱼ обозначающая вероятность перехода из состояния i в j. На практике они оцениваются по данным обучения. Для определения количества состояний обычно используется алгоритм кластеризации K -mean.

3.2 Прогнозирование временных рядов

Методы прогнозирования временных рядов полезны для систем, состояния которых непосредственно наблюдаемы и непрерывно развиваются. В этих настройках оценка RUL по сути является оценкой данных измеренных временных рядов для достижения заранее определенного порога.

Существуют различные подходы, с помощью которых можно строить модели прогнозирования временных рядов. Например, у нас есть метод экспоненциального сглаживания, который в своей базовой форме прогнозирует новые наблюдения как средневзвешенное значение прошлых наблюдений, при этом веса экспоненциально убывают назад во времени.

Также у нас есть модели ARIMA. Здесь ARIMA означает интегрированную авторегрессионную скользящую среднюю. ARIMA сочетает в себе модель авторегрессии, которая регрессирует новое значение наблюдения по прошлым значениям наблюдения, и модель скользящего среднего, которая моделирует член ошибки как линейную комбинацию членов ошибки, возникающих одновременно и в разное время в прошлом. Наконец, ARIMA использует этап дифференцирования (соответствующий «интегрированной» части модели) для устранения нестационарности тренда.

Помимо классических методов прогнозирования временных рядов, в нашем распоряжении также есть нейронные сети. Рекуррентные нейронные сети, в частности, модели Long-Short Term Memories (LSTM), набирают популярность в последние годы для целей прогнозирования.

3.3 Скрытые марковские модели

Скрытые марковские модели (HMM) полезны для систем, состояния которых можно наблюдать только косвенно, и которые развиваются дискретным образом.

Концептуально HMM состоит из двух случайных процессов: наблюдаемого процесса Y ₙ, который учитывает наблюдения, полученные на основе измерений датчиков, и процесса деградации системы Z ₙ, состояния которого ненаблюдаемы и эволюционируют согласно цепи Маркова на конечном пространстве состояний.

Обычно условная вероятность P (Y ₙ | Z ₙ = i) используется для описания взаимосвязи между этими двумя процессами.

Фундаментальный HMM может обрабатывать только дискретные наблюдения, то есть наблюдаемый процесс Y ₙ развивается в пространстве конечных состояний. Однако на практике наблюдения Y ₙ часто бывают непрерывными. В таких ситуациях для обработки непрерывных наблюдений обычно используется смесь гауссианской скрытой марковской модели (MoG-HMM). Там смесь гауссовых распределений используется для аппроксимации плотности вероятности P (Y ₙ | Z ₙ = i).

3.4 Стохастические методы фильтрации

Для систем, состояния которых можно наблюдать только косвенно и которые развиваются непрерывным образом, методы стохастической фильтрации являются хорошим выбором для прогнозирования RUL.

Методы стохастической фильтрации возникли в результате более широкой области исследований, известной как ассимиляция данных. Здесь цель состоит в том, чтобы оценить распределение вероятностей состояния системы путем усвоения информации как из наблюдений, так и из прогнозов модели.

В методах стохастической фильтрации используется байесовское обучение для итеративного обновления состояния системы и параметров, которые управляют эволюцией состояния по мере появления новых измерений. После оценки состояния и параметров мы можем предсказать будущие состояния системы, используя уравнения эволюции. Общий рабочий процесс показан ниже.

Для уравнения измерения модель измерения h (.) Обычно представляет собой управляемую данными модель, полученную из данных обучения. Для уравнения эволюции состояния f (.) Может быть получено либо из физических принципов, либо из контролируемых методов обучения, в зависимости от доступности знаний о физической деградации и соответствующих данных обучения.

Что касается методов стохастической фильтрации для оценки состояния, наиболее часто используемые методы основаны на фильтре Калмана, который имеет решения в замкнутой форме и очень быстро оценивается. Однако он может обрабатывать только линейные f (.) С членами гауссовского шума. Чтобы преодолеть это ограничение, были предложены более продвинутые варианты, включая неароматизированный фильтр Калмана, ансамблевый фильтр Калмана и т. Д.

Наиболее распространенным методом фильтрации является фильтрация частиц, также известная как метод последовательного Монте-Карло (SMC). Этот тип подхода к фильтрации использует набор взвешенных частиц (также называемых выборками) для представления распределения вероятностей состояний системы и параметров эволюции. Когда доступны новые наблюдения, веса этих частиц обновляются в соответствии с правилом Байеса. Благодаря своей имитационной природе, фильтрация частиц может обрабатывать нелинейность и негауссовость в реальных приложениях.

4. Проблемы прогнозирования

Несмотря на быстрое развитие алгоритмов прогнозирования, в действительности выполнить надежный прогнозный анализ не всегда просто. Есть ряд проблем, которые могут помешать нам достичь цели:

Надежность и сбои датчиков, так как датчики могут работать во враждебной среде;
Извлечение признаков, так как это нетривиальная задача изолировать функции, которые связаны с процессом деградации сложных систем;
Доступность данных, поскольку использование методов машинного обучения для прогнозирования обычно требует большого объема обучающих данных (особенно данных о работе до отказа), которые недоступны из действующих систем из-за времени и затрат. .

Помимо вышеупомянутых проблем, неопределенность, встречающаяся в прогнозе, представляет собой еще одну серьезную проблему для получения надежной оценки RUL.

Неопределенности прогноза могут возникать из-за:

Входные данные: данные датчика могут содержать значительный уровень шума. Кроме того, постоянно меняются условия окружающей среды и эксплуатационные нагрузки.
Модель: из-за ограниченности обучающих данных построенные модели на основе данных могут не отражать истинный процесс деградации системы, что приводит к ошибкам и неопределенностям моделирования.

Поскольку эти неопределенности могут привести к значительному отклонению результатов прогноза от реальной ситуации, разработка системы систематического управления неопределенностями имеет решающее значение для предоставления значимых прогнозов RUL. Чтобы узнать больше о том, как управлять неопределенностями, связанными с прогнозами на основе моделей, ознакомьтесь с моей предыдущей статьей здесь:

Объяснение количественной оценки неопределенности
Практика создания надежных прогнозов на основе моделей в сторонуdatascience.com

5. Выводы

В этой статье мы обсудили фундаментальные концепции профилактического обслуживания и представили некоторые из наиболее популярных алгоритмов оценки оставшегося срока службы системы. Кроме того, мы обсудили ряд проблем, связанных с получением надежных прогностических результатов.

Ключевые выводы этой статьи:

Профилактическое обслуживание (PdM) состоит из сбора данных, диагностики, прогнозирования и управления работоспособностью;
Prognostics - это ключевая технология, обеспечивающая интеллектуальную PdM;
Основная задача прогнозирования - предсказать оставшийся срок полезного использования системы (RUL);
На основе характеристик исследуемой системы (прямо / косвенно наблюдаемая, дискретная / непрерывная эволюция состояния) для оценки RUL обычно принимаются марковские модели, методы прогнозирования временных рядов, скрытые марковские методы и подходы стохастической фильтрации;
Обеспечить надежный прогностический анализ непросто из-за проблем, связанных с надежностью датчиков и отказами, извлечением функций, доступностью данных и погрешностями прогноза.

Ссылка

[1] Н.Х. Ким, 2017, Прогнозирование и управление работоспособностью инженерных систем.
[2] Л. Ляо, Ф. Коттиг, 2014 г., Обзор гибридных подходов к прогнозированию оставшегося полезного срока службы инженерных систем. и приложение для прогнозирования срока службы батареи , Транзакции IEEE о надежности.
[3] X. Si, W. Wang, C. Hu, D. Zhou, 2011, Оставшийся срок полезного использования оценка - обзор подходов, основанных на статистических данных , Европейский журнал операционных исследований.
[4] С. Санкарараман, К. Гебель, 2015 г., Неопределенность в прогнозировании и системном управлении здоровьем. , Международный журнал прогнозирования и управления здоровьем.

об авторе

Я доктор философии. исследователь, работающий над количественной оценкой неопределенности и анализом надежности для аэрокосмических приложений. Статистика и анализ данных составляют основу моей повседневной работы. Мне нравится делиться тем, что я узнал в увлекательном мире статистики. Проверьте мои предыдущие сообщения, чтобы узнать больше, и свяжитесь со мной в Medium и Linkedin.