Обзор публикации: Основанный на глубоком обучении подход к классификации болезней листьев банана

Текущий обзор сделан на основе статьи, опубликованной на симпозиуме Datenbanksysteme für Business, Technologie und Web Ростокского университета (Universität Rostock) у Балтийского моря в Германии (http://btw2017. informatik.uni-stuttgart.de/slidesandpapers/E1-10/paper_web.pdf)

Введение

В современном мире болезни растений являются факторами, оказывающими настолько негативное влияние, что качество и количество продукции значительно снижается. Раннее обнаружение их имеет первостепенное значение в этих отраслях, обеспечивая при этом качество продукции.

Недавние исследования были предложены с использованием новых методов, компьютерного зрения и искусственного интеллекта, чтобы обеспечить способ ранней идентификации. Глубокое обучение уделяет большое внимание этим исследованиям. В текущем обзоре рассматривается один из подходов 2017 года к автоматизации процесса классификации болезней банановых листьев. В частности, авторы публикации использовали архитектуру LeNet в качестве сверточной нейронной сети (CNN) для классификации наборов данных изображений.

Банановые болезни

Наиболее распространенными болезнями бананов, поражающими урожай, являются черная сигатока и банановая пятнистость. На следующем Рис. 1 показаны оба сценария:

Черная сигатока вызывается грибком Mycosphaerella fijiensis. Его симптомы начинаются с крошечных хлоротических пятен, а затем развиваются в тонкие коричневые линии и полосы. Пятнистость листьев – грибковое заболевание. Его симптомы начинаются в виде светло-коричневых пятнышек, которые со временем увеличиваются в размерах и становятся черными. При отсутствии лечения эти болезни убивают растение. Однако, если их диагностировать на ранней стадии, их можно вылечить и растения можно спасти.

В наши дни нельзя экономить на ресурсах, а опыт, необходимый для выявления таких заболеваний, очень ограничен, поэтому, если бы автоматическая система могла это делать, преимущества были бы огромными.

Связанных с работой

Как указывалось ранее, болезни растений представляют собой реальную угрозу для сельского хозяйства, учитывая производственные и экономические потери из-за них, и были разработаны подходы к созданию быстрого метода раннего выявления. Тем не менее, большинство проведенных исследований следуют шагам, показанным на рис. 2, где виден общий поток машинного обучения:

Процесс идентификации начинается с этапа получения изображения, когда (обычно) камера используется для захвата изображений здоровых и зараженных растений. Затем необходим дальнейший анализ для редактирования изображения и подготовки его к последующей обработке, такой как улучшение изображения, сегментация, преобразование цветового пространства и фильтрация. Все это является частью этапа предварительной обработки изображения. В частности, методы сегментации изображения, такие как порог, часто используются для обнаружения границ в изображениях. На этапе извлечения признаков такие признаки, как цвет, форма и текстура, вычисляются из изображения, чтобы, наконец, перейти к этапу классификации.

Общие ограничения

Большинство методов, предложенных в других публикациях, достаточно хорошо работают в контролируемых средах, тем не менее, в полевых условиях важные переменные не всегда находятся под контролем.

Например, сегментация используется в большинстве методов в качестве первого шага, и если изображение листа захвачено с черным фоном, сегментация проста и не может быть никаких проблем. Тем не менее, когда фон содержит другие листья или растения, сегментация может закончиться ошибкой. Большинство методов не смогут эффективно извлечь лист из фона, что приведет к ненадежным результатам. Кроме того, некоторые симптомы заболевания не имеют четко выраженных краев, и они могут постепенно переходить в здоровые ткани, где идентификация снова заканчивается ошибкой.

Метод

Предлагаемый механизм исследования имеет блок-схему, показанную на Рисунке 3:

На рисунке показаны два основных элемента: предварительная обработка изображения и этап классификации с использованием глубокого обучения.

Предварительная обработка изображений

На этом этапе изображения обрабатываются в соответствии с требованиями авторов. Цифровая камера используется для захвата каждого изображения, где они представлены в трех каналах с использованием схемы RGB (красный, зеленый, синий). Набор обучающих данных хранится в репозиториях с большим количеством здоровых и зараженных образов. Основные выполняемые манипуляции — изменение размера до 60x60 пикселей и преобразование в оттенки серого.

Классификация на основе глубокого обучения

Он состоит из компонентов Извлечение признаков и Классификация. Первый состоит из двух дополнительных операций: карты свертки и карты максимального объединения, а классификация выполняется с использованием полносвязных слоев. В общих чертах этот этап имеет ту же архитектуру, что и этап LeNet. Применительно к обсуждаемой проблеме архитектура выглядит следующим образом на Рис. 4:

Карта свертки

Это ядро CNN. Его цель — извлечь признаки из входного изображения. Он состоит из набора фильтров, которые «обучаются». Каждый фильтр применяется к необработанным значениям пикселей изображения с учетом красного, зеленого и синего цветовых каналов подвижным и перекрывающимся образом, вычисляя скалярное произведение между пикселем фильтра и входным пикселем. В результате получится двумерная карта активации фильтра, называемая картой функций. По сути, сеть изучает фильтры, которые активируются, когда находят известные функции во входных данных. После каждой выполненной свертки выполняется нелинейная функция активации ReLU, чтобы ввести нелинейность в CNN.

Максимальная карта объединения

Слой объединения или максимального объединения имеет в качестве выходных данных максимальное значение активации во входном слое по подокнам в каждой карте объектов. Проще говоря, это уменьшает размер карты объектов.

Модель классификации

В этом разделе используются полностью связанные слои, где каждый нейрон обеспечивает полное подключение ко всем изученным картам признаков, выданным из предыдущего слоя в нейронной сети свертки. Эти связанные слои основаны на функции активации softmax для вычисления оценок классов. Входные данные классификатора softmax — это вектор признаков, полученных в результате процесса обучения, а выходные данные — вероятность того, что изображение принадлежит данному классу.

Оценка результатов

Проверка предложенного метода была проведена с использованием реальных наборов данных о болезнях бананов, полученных в рамках проекта PlantVillage. Проект Plant Village содержит тысячи изображений здоровых и больных сельскохозяйственных культур, которые открыты и доступны в Интернете. Изображения в наборе данных были аннотированы как принадлежащие к трем различным категориям: здоровые (1643 изображения), черная сигатока (240 изображений) и черная крапинка (1817 изображений).

В реализации авторы использовали deeplearning4j как библиотеку глубокого обучения с открытым исходным кодом, которая поддерживает использование графических процессоров. Их цель состояла в том, чтобы оценить прогностическую эффективность модели болезней бананов на данных, ранее не аннотированных.

Эксперименты проводились с использованием различных диапазонов поездов и наборов тестов, чтобы оценить надежность метода и его способность избегать переобучения. Обучающий набор варьируется от 80 %, 60 %, 50 %, 40 % до 20 % с использованием тех же гиперпараметров, которые показаны в таблице 1:

Алгоритм стохастического градиентного спуска (SGD) использовался в модели для изучения наилучшего набора весов и смещений нейронной сети. Во время обучения алгоритм SGD работает, случайным образом выбирая небольшое количество входных данных для обучения. Авторы называют это размером партии, который установлен на 10. Скорость обучения установлена на 0,001. Это скорость, с которой функция перемещается по пространству поиска. Небольшая скорость обучения приводит к более точным результатам, но требует больше времени на обучение. Импульс является дополнительным фактором, определяющим, насколько быстро алгоритм SGD сходится к оптимальной точке. Он установлен на 0,9.
Чтобы оценить эффективность предложенной системы, авторы используют комбинацию точности, воспроизводимости и F1-показателя. Результаты представлены в Таблице 2 для всех возможных конфигураций эксперимента:

Полученные результаты подтверждают важность цветовой информации для идентификации болезней растений. Следовательно, зеленый цвет всегда относится к здоровому листу, а лист с черными или коричневыми пятнами можно считать нездоровым.

Рисунок. 5 показана точность различных вариантов разделения поездов и тестов при изменении количества итераций. Как может видеть читатель, в некоторых разбиениях модели требуется больше времени для сходимости. Однако в большинстве тестовых расщеплений модель начинает стабилизироваться с 25-й итерации и достигает хорошей точности на последней итерации.

Вывод

В статье представлен действенный подход, основанный на сверточных нейронных сетях, для выявления и классификации болезней бананов. Предложенная авторами модель отлично работает в реальных сценариях с меняющимися условиями вроде освещения, сложного фона, разного разрешения, размера, позы, ориентации. Проведенные эксперименты позволили получить хорошие результаты классификации, в то время как предложенный метод может помочь фермерам в точном обнаружении болезней листьев на бананах без больших вычислительных затрат.

Библиография

Амара, Дж., Буазиз, Б., и Алгергауи, А. (nd). Подход, основанный на глубоком обучении, для классификации болезней банановых листьев. Получено с http://btw2017.informatik.uni-stuttgart.de/slidesandpapers/E1-10/paper_web.pdf