Расширение данных — это метод увеличения объема данных за счет добавления копий модифицированных существующих данных или вновь созданных синтетических данных из существующих наборов данных. Он работает как регуляризатор и помогает уменьшить переобучение при обучении модели машинного обучения. Это тесно связано с работой oversampling в анализе данных.

Расширение данных наиболее популярно в области компьютерного зрения. посмотрите, что нужно изменить при использовании Data Augmentation.

  • набивка
  • изменение масштаба
  • вертикальное и горизонтальное перелистывание
  • случайное вращение
  • изображение перемещается по оси x, y
  • масштабирование
  • обрезка
  • темнота и яркость или изменение цвета
  • серый цикл
  • изменение контраста
  • добавление шума
  • случайное стирание

Теперь посмотрите на пример:

Приведенная выше модель показывает только наш исходный набор данных. Теперь посмотрим на обучение модели с помощью Data Augmentation.