Расширение данных — это метод увеличения объема данных за счет добавления копий модифицированных существующих данных или вновь созданных синтетических данных из существующих наборов данных. Он работает как регуляризатор и помогает уменьшить переобучение при обучении модели машинного обучения. Это тесно связано с работой oversampling в анализе данных.
Расширение данных наиболее популярно в области компьютерного зрения. посмотрите, что нужно изменить при использовании Data Augmentation.
- набивка
- изменение масштаба
- вертикальное и горизонтальное перелистывание
- случайное вращение
- изображение перемещается по оси x, y
- масштабирование
- обрезка
- темнота и яркость или изменение цвета
- серый цикл
- изменение контраста
- добавление шума
- случайное стирание
Теперь посмотрите на пример:
Приведенная выше модель показывает только наш исходный набор данных. Теперь посмотрим на обучение модели с помощью Data Augmentation.