В этой статье представлено основанное на данных решение для диагностики неисправностей модулей слежения за парком транспортных средств.

Введение

Многие транспортные и логистические компании используют модули для отслеживания своих транспортных средств, и нередко некоторые модули работают не так, как ожидалось. Возможно, потребуется выбросить трекер, могут быть собраны неверные данные с транспортного средства или, например, может быть отправлена ​​​​техническая поддержка на большое расстояние для анализа проблемы. Таким образом, необходимо проводить удаленную диагностику неисправностей этих модулей, поскольку при обнаружении сбоев могут возникнуть финансовые потери.

Поскольку эти модули постоянно отправляют данные в базу данных, целью данного исследования является использование этих данных для диагностики неисправностей модулей. Необходимо было разработать методологию предварительной обработки собранных данных, отправляемых модулями корабля. После этого были применены методы машинного обучения для создания моделей, которые были проанализированы и сравнены. Однако в чем вина?

Неисправности – это недопустимое отклонение хотя бы одного свойства или характерного параметра системы [1]. И есть три шага для диагностики неисправностей, а именно:

  1. Обнаружение неисправности: это самая основная задача диагностики неисправности, она используется для проверки неисправности или сбоя в системе и определения момента возникновения неисправности;
  2. Изоляция неисправности: изоляция служит для определения местоположения неисправности или дефектного компонента;
  3. Идентификация ошибки: идентификация используется для определения типа, формата и размера ошибки.

Как правило, процесс идентификации неисправностей состоит только из обнаружения и изоляции неисправностей (FDI). Это не отменяет полезности идентификации неисправностей. Однако этот процесс может не иметь существенного значения, если не происходит никаких действий по реконфигурации [2].

Разработка

Прежде всего, для выполнения любого решения по машинному обучению необходимы данные. Для этого исследования бразильская логистическая компания предоставила некоторые данные, отправленные многими трекерами, поэтому все используемые данные являются реальными.

Описание проблемы

Модули, установленные в автомобилях, отправляют данные в течение всего периода их эксплуатации. Компания предоставила 12586 реестров. Компания предоставила 12586 реестров. Реестр состоит из всех данных, переданных одним модулем за один день. В среднем каждый модуль отправляет 1116,67 балла в день. Каждая точка имеет восемь атрибутов:

  • Battery Voltage: плавающее значение напряжения аккумуляторной батареи автомобиля;
  • Долгота: плавающее значение долготы автомобиля;
  • Широта: плавающее значение широты автомобиля;
  • Зажигание: логическое значение, указывающее, включено ли зажигание
    ;
  • Одометр: плавающее значение одометра автомобиля;
  • Сигнал GPS: логическое значение, указывающее, действителен ли сигнал GPS
    ;
  • Velocity: плавающее значение скорости автомобиля;
  • Индекс памяти: целочисленное значение для позиции памяти, в которой
    точка сохранена в модуле.

Поскольку модули отправляют данные регулярно и с разной частотой в зависимости от каждого модуля, каждый реестр имеет разный размер. Таким образом, размер каждого реестра равен количеству отправленных точек, умноженному на 8 (количество атрибутов).

Цель состоит в выявлении ошибок, которые могут быть в реестре, или в том, работает ли он правильно. Таким образом, это проблема классификации нескольких классов, в которой есть восемь классов; один класс для реестров без ошибок и семь возможных ошибок, перечисленных ниже:

  • Ошибка 1: неправильная настройка импульса;
  • Ошибка 2: одометр заблокирован;
  • Ошибка 3: GPS заблокирован;
  • Неисправность 4: отсоединен провод зажигания;
  • Ошибка 5: неисправен акселерометр;
  • Ошибка 6: проблема с буфером модуля;
  • Ошибка 7: GPS со скачками в местоположении;

Некоторые из этих разломов имеют несколько слишком низких проявлений. Недостатки, у которых было менее 3%, были помечены как «Другие». Количество данных по каждому сбою можно увидеть слева.

Предварительная обработка данных

Поскольку процесс извлечения признаков – это обширная
работа, которая сильно влияет на конечный результат [3]. Этот подход использует знания из системы для выполнения преобразования данных, чтобы значительно уменьшить размерность данных.

Исходными атрибутами являются временные ряды (напряжение батареи, широта и т. д.), и из них я создал 21 новый атрибут, показанный в таблице ниже. После этого преобразование данных преобразует исходные данные из 2-D только в одно измерение. Большинство этих новых атрибутов можно легко рассчитать, и поэтому для этого не существует сложной формулы или алгоритма.

Большинство атрибутов являются бинарными, поэтому они не требуют нормализации. Однако такие атрибуты, как количество точек, данные о напряжении батареи и скачках индекса памяти, могут быть нормализованы. Поскольку анализ выбросов не проводился, традиционная нормализация может привести к тому, что данные будут подавлены некоторым высоким значением, поэтому используется RobustScaler. Этот масштабатор использует первый и третий квартили в качестве ограничений, а не максимальное и минимальное значения, поэтому эта нормализация является более надежной и поддерживает выбросы.

Поскольку одни атрибуты могут иметь высокую корреляцию с другими, были рассчитаны все возможные корреляции. Долгота и вариация широты имеют корреляцию Пирсона 0,996315, что в большинстве проектов машинного обучения предполагает, что мы должны отказаться от одного из этих атрибутов. Однако, поскольку целью моделей является диагностика сбоев в GPS модуля, оба атрибута полезны, несмотря на высокую корреляцию.

Кроме того, существует высокая корреляция между количеством точек и количеством точек с недействительным GPS, 0,962769. Это происходит потому, что количество точек является суммой количества действительных точек GPS с количеством недействительных точек GPS. Поэтому из-за этой линейной комбинации атрибут «количество баллов» был отброшен. Наконец, поля даты и серийного номера также отбрасываются, поскольку они предназначены для идентификации транспортного средства и модуля и не предоставляют никакой информации о работе модуля.

Обучение моделей машинного обучения

Для запуска алгоритмов наборы данных были разделены на обучающий и тестовый наборы. Для каждого эксперимента 20% реестров предназначались для тестирования и 80% для обучения.

Я хотел выяснить, какой традиционный алгоритм лучше работает с этими данными, поэтому я протестировал каждый из них с передискретизацией данных и с недостаточной выборкой.

Принимая во внимание методы ML, все случайные леса были созданы с использованием 100 оценок, а все MLP были выполнены с архитектурой (5, 10, 5), lr = 0,001 и 200 максимальными итерациями.

Полученные метрики можно увидеть в таблице ниже:

Нормализованную матрицу путаницы для случайного леса с передискретизацией также можно увидеть ниже:

В дополнение к метрикам оценки для методов ML также было рассчитано время обучения и оценки моделей. Это время в худшем случае составило 0,37мс, что можно считать ответом приложения в реальном времени
в этом примере.

Выводы

Как было предложено, эти модели могут обнаруживать и идентифицировать неисправности в модулях слежения за парком транспортных средств с высокопроизводительными показателями. Однако существовала обширная разработка функций, которую можно было выполнять автоматически с помощью LSTM или CNN. Я также сделал несколько моделей CNN для диагностики этой неисправности, возможно, я подробно расскажу об этом в следующей статье.

Ограничения используемых методов включают неспособность моделей обнаруживать разломы, которые не нанесены на карту, поэтому любые разломы, которые не были изучены, будут ошибочно классифицированы как одни из известных.

использованная литература

[1] Д. ван Шрик, «Замечания по терминологии в области надзора, обнаружения неисправностей и диагностики», IFAC Proceedings
Volumes, vol. 30, нет. 18, стр. 959–964, 1997.

[2] Д. Ван и В. Т. Питер, «Прогнозирование шламовых насосов на основе
индекса деградации скользящего среднего износа и общего
последовательного метода Монте-Карло», Механические системы и
обработка сигналов , том. 56, стр. 213–229, 2015.

[3] Л. Вэнь, С. Ли, Л. Гао и Ю. Чжан, «Новый метод диагностики неисправностей на основе сверточных
нейронных сетей»,
IEEE Transactions on Industrial Electronics, об. 65, нет. 7,
стр. 5990–5998, 2018.