Предыдущий ‹‹ Обучение и оценка моделей глубокого обучения (4/6)

В жизни зачастую легче освоить новый навык, если у вас уже есть опыт владения аналогичным навыком, который можно передать другим людям. Например, вероятно, легче научить человека водить автобус, если он уже научился водить машину. Водитель может использовать навыки вождения, которые он уже освоил на автомобиле, и применить их при управлении автобусом.
Тот же принцип можно применить к обучению моделей глубокого обучения с помощью метода, называемого перенос обучения.

Как работает трансферное обучение

Сверточная нейронная сеть (CNN) для классификации изображений обычно состоит из нескольких слоев, которые извлекают признаки, а затем используют последний полносвязный слой для классификации изображений на основе этих признаков.

Концептуально эта нейронная сеть состоит из двух отдельных наборов слоев:

  • Набор слоев базовой модели, которые выполняют извлечение объектов.
  • Полностью связный слой, который берет извлеченные функции и использует их для прогнозирования классов.

Слои извлечения признаков применяют сверточные фильтры и объединение, чтобы подчеркнуть края, углы и другие узоры на изображениях, которые можно использовать для их различения, и теоретически должны работать для любого набора изображений с теми же размерами, что и входной слой сети. Слой прогнозирования сопоставляет объекты с набором выходных данных, которые представляют вероятности для каждой метки класса, которую вы хотите использовать для классификации изображений.

Разделив сеть на эти типы слоев, мы можем взять слои извлечения признаков из уже обученной модели и добавить один или несколько слоев, чтобы использовать извлеченные признаки для прогнозирования соответствующих меток классов для ваших изображений. Этот подход позволяет вам сохранять предварительно обученные веса для слоев извлечения признаков, а это означает, что вам нужно обучать только добавленные вами слои прогнозирования.

Существует множество устоявшихся архитектур сверточных нейронных сетей для классификации изображений, которые вы можете использовать в качестве базовой модели для трансферного обучения, чтобы вы могли опираться на работу, уже проделанную кем-то другим, чтобы легко создать эффективную модель классификации изображений.