Тема:. Классификация изображений и оценка стоимости дома с визуальными и текстовыми функциями.

Члены команды: Гёкай Атай, Илькин Севги Ислер, Мюрувет Гёкчен, Зафер Джем Озджан

НАПОМИНАНИЕ

Цель состоит в том, чтобы правильно спрогнозировать стоимость домов. Для этого мы должны выполнить следующие шаги.

Мы будем использовать некоторые функции, такие как местоположение, количество комнат и т. Д., Но главное - добавить к этим данным уровень роскоши каждого дома, согласно их фотографиям. И для этого сначала мы должны разделить изображения на категории: ванная, спальня и т. Д., Потому что мы думаем, что не все пользователи будут добавлять теги к своим фотографиям в зависимости от их типов. Благодаря этому мы сможем сравнивать натуральные номера друг с другом. Иллюстрация приведена ниже.

  1. Нам нужно распределить фотографии по типам.
  2. Нам необходимо классифицировать эти комнаты в зависимости от их уровня роскоши.
  3. Используя эти уровни роскоши и другие данные, которые у нас есть, нам необходимо оценить стоимость дома.

КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ

Как мы упоминали ранее, для задачи классификации изображений (где мы пытаемся классифицировать ванную, спальню, кухню и вид дома спереди) мы использовали сверточную нейронную сеть. Мы разделили набор данных на 80% для поезда и 20% для проверки.

Для каждой архитектуры, которую мы пробовали, мы упорядочили код для ~ 200 эпох и установили условие ранней остановки. Если точность проверки не увеличивается в течение 30 эпох, выполнение завершается и сохраняет модель с максимальной точностью проверки.

Две недели назад мы уже тестировали производительность архитектуры InceptionV3. Вот результаты других глубинных архитектур, таких как VGG19 и DenseNet201.

VGG-19 - это сверточная нейронная сеть, которая обучается более чем на миллионе изображений из базы данных ImageNet. Сеть состоит из 19 уровней. Архитектура сети VGG была представлена ​​Симоняном и Зиссерманом в их статье 2014 года Очень глубокие сверточные сети для распознавания изображений большого размера. Мы использовали предварительно обученные веса VGG19 для классификации изображений. Мы заморозили все слои и обучили только полностью связанный слой с помощью наших меток классов. Поскольку эта архитектура используется для связанной задачи, точность классификатора была приличной, которая составляет около 87% точности.

Поскольку сеть глубокая и состоит из большого количества параметров, ее обучение было мучительно медленным. Тем не менее, он оказался хуже, чем InceptionV3, у которого точность 90%.

Эпоха 00080: val_acc не улучшилось с 0,87069
Прошло время: 1 день, 13: 52: 21.351408

DenseNet-201 - это сверточная нейронная сеть, которая обучается более чем на миллионе изображений из базы данных ImageNet. Сеть состоит из 201 слоя. DenseNet соединяет каждый уровень с каждым другим слоем с прямой связью. В то время как традиционные сверточные сети с L уровнями имеют L соединений - по одному между каждым уровнем и его последующим уровнем - DenseNet имеет L (L + 1) / 2 прямых соединений. Для каждого слоя характеристики всех предыдущих слоев используются в качестве входных данных, а его собственные карты характеристик используются в качестве входных данных для всех последующих слоев.

Мы применили тот же метод трансферного обучения, что и в предыдущих архитектурах. У нас есть точность проверки 92% с DenseNet201, что является лучшим среди других глубоких сетей, которые мы пробовали.

Эпоха 00051: val_acc не улучшилась по сравнению с 0.92172
Эпоха 00051: ранняя остановка
Прошло время: 15: 08: 18.962689

В ближайшие недели мы рассмотрим извлечение предметов роскоши, оценку цен и их объединение с классификацией изображений.