Если нам нужно, чтобы какую-то работу выполняли другие, то их следует обучить такой работе. Подобным образом машина также обучается работе и определяет ее совершенство с точки зрения метрик. В основном используемые метрики — это точность, точность.
Как мы обсуждали в наших предыдущих статьях, человек учится быстро, но требует времени, чтобы выполнить огромный объем работы. С другой стороны, машина учится медленно, но делает это быстро.

Что касается предварительной обработки, она помогает сделать данные достаточно чистыми, чтобы модель могла изучить все шаблоны и края, необходимые для правильного прогноза. Поэтому это необходимо при передаче данных в нейронную сеть для обучения и тестирования. Некоторые из наиболее распространенных методов предварительной обработки для классификации изображений:

  1. Изменение размера изображения:
    Это делается для исходного изображения, чтобы изменить его размер. Изменение размера необходимо перед обучением, потому что некоторые изображения из-за различий в данных, используемых при обучении модели, т. Е. Данные, собранные из онлайн-источников, взятых из мобильный телефон и т.п.., могут различаться по размерам. Итак, чтобы сформировать базовый размер для всех изображений, мы специально изменяем размер всех изображений. Здесь при изменении размера мы в основном конвертируем изображение в 224 * 224, где оно обнаруживает все формы, шаблоны, необходимые для изучения, что делает вычисления менее сложными (по мере уменьшения размера пикселя снижается эффективность вычислений). Но если мы используем еще меньший размер, модель может вести себя не очень хорошо.

2. Удаление шума.
Это процесс удаления шума из изображения для улучшения обучения. Мы используем эту функцию предварительной обработки, чтобы сгладить изображение, чтобы уменьшить нежелательный шум. В основном это делается с помощью размытия по Гауссу. Это метод уменьшения шума путем сглаживания изображения. При этом визуальный эффект достигается таким образом, что изображение видно через полупрозрачный экран.

3. Бинаризация:
это не что иное, как преобразование изображения RGB в черно-белое изображение. Это сделано для того, чтобы избежать дополнительного изучения цветных шаблонов, где значения пикселей больше, а модель имеет тенденцию придавать больший вес. Таким образом, этот шаг предварительной обработки помогает разделить все пиксели на белые и черные в зависимости от порога. Важно отметить, что здесь необходимо установить наилучший порог.
Значение белого пикселя равно 255, а значение черного равно 0.
С нашим порогом допустим, что значение 127 меньше 127 пикселя считается белым и остальные черными. Это будет в основном полезно при обнаружении текста и проблемах с распознаванием.

Но здесь есть камень преткновения: если изображение подвергается воздействию условий освещения, становится трудно установить общий порог для всех пикселей этого конкретного изображения, и в этом случае этот шаг может оказаться бесполезным. Вы можете увидеть такой случай на рисунке ниже.

Существует множество способов установки этих пороговых значений на этом этапе предварительной обработки. Но чаще всего используется порог OTSU, поскольку он учитывает освещение, резкость, контрастность и т. д. конкретного изображения, чтобы установить лучший порог.
У нас также есть адаптивный порог, где вместо единого порога для всего изображения используются разные по одному для каждого пикселя на основе характеристик соседних пикселей. Все эти пороговые значения предопределены и могут использоваться напрямую с огромными библиотеками компьютерного зрения, такими как cv2, а также с библиотеками изображений, такими как PIL.

4. Удаление шума:
Как мы знаем, шум играет важную роль в сокрытии важной информации на изображении и затрудняет процесс обучения при обнаружении присутствующих в нем шаблонов и краев. Таким образом, устранение этого шума является основной целью этого этапа предварительной обработки. Это делается путем сглаживания изображения и удаления небольших точек/пятен, которые могут иметь большую интенсивность, чем остальная часть изображения. Удаление шума выполняется как для цветных, так и для бинарных изображений.

Это некоторые из наиболее часто используемых методов предварительной обработки для классификации изображений. А увеличение данных — это этап предварительной подготовки. Если у нас не хватает данных для обучения модели, мы используем эту технику для увеличения количества данных. Это включает в себя так много методов, таких как отражение, поворот, масштабирование, кадрирование, добавление шума и т. Д., Итак, давайте обсудим это в нашей следующей статье.

Спасибо !!! для прочтения…. Подпишитесь на меня и следите за обновлениями для более интересных тем.