Задача Multi-Temporal Urban Development Challenge от SpaceNet 7: выпуск набора данных

Предисловие: SpaceNet LLC - некоммерческая организация, деятельность которой направлена ​​на ускорение прикладных исследований с открытым исходным кодом и искусственного интеллекта для геопространственных приложений, в частности, фундаментального картографирования (т. е. обнаружения следов зданий и дорожных сетей). SpaceNet управляется в сотрудничестве соучредителем и управляющим партнером CosmiQ Works, соучредителем и сопредседателем Maxar Technologies и нашими партнерами, включая Amazon Web Services (AWS), Capella Space, Topcoder. , IEEE GRSS, Национальное агентство геопространственной разведки и Планета.

Партнеры SpaceNet с гордостью объявляют о выпуске набора данных SpaceNet 7. Набор данных SpaceNet 7 Multi-Temporal Urban Development Challenge включает глубокий временной стек изображений и меток в более чем 100 местах на всех шести обитаемых континентах. Современные высокоточные карты имеют решающее значение для многих приложений (таких как реагирование на стихийные бедствия или гуманитарные мероприятия, подробно обсуждаемые в нашем предыдущем блоге), и этот набор данных поможет усилиям по совершенствованию методов автоматического картирования и обнаружения изменений накладных расходов. .

Это первый раз, когда SpaceNet использовала изображения Планеты с разрешением ~ 4 метра, а также первый раз, когда временное измерение будет явно включено в задачу. Выбранные местоположения могут похвастаться значительными изменениями за двухлетний график сбора данных. Динамический характер кубов данных позволяет отслеживать развитие городов, в частности: эволюцию площади зданий, а также распространение адресов. В следующих разделах мы обсудим многие аспекты этого уникального набора данных с открытым исходным кодом, распространяемого по разрешительной лицензии CC BY-SA 4.0.

1. Географический охват

Набор данных SpaceNet 7 содержит ~ 100 местоположений, разбросанных по всему миру. Многие из местоположений были выбраны, чтобы подчеркнуть существенные изменения, хотя некоторые были выбраны так, чтобы они совпадали с предыдущими регионами SpaceNet, а некоторые были выбраны из-за геополитических интересов. 60 кубов данных выпущены в качестве обучающих примеров (с обоими изображениями и сопутствующими метками), а 20 выпущены в качестве примеров test_public (только изображения). Остальные кубы данных зарезервированы для окончательного тестирования. На рисунке 1 есть ссылка на интерактивную карту, которая позволяет заинтересованным читателям исследовать расположение наборов данных.

2. Кубы данных - изображения

В каждом месте ежемесячная мозаика обрабатывается в течение двух лет. Этот длительный промежуток времени охватывает несколько сезонов и атмосферных условий, а также начало и завершение нескольких строительных проектов, см. Рисунок 2.

Облачность или (редко) неправильная калибровка датчика делают некоторые области изображений непригодными для использования. Соответственно, каждое изображение имеет сопутствующую маску непригодных данных (UDM) в стандартном формате GeoJSON, см. Рисунок 3.

3. Кубы данных - метки следа здания

Для каждой ежемесячной мозаики команда маркировки SpaceNet тщательно обрисовывала площадь каждого здания. Эти векторные метки GeoJSON позволяют отслеживать местоположение отдельных зданий (то есть адреса) с течением времени, отсюда и название: SpaceNet 7 Urban Development Challenge. На Рисунке 4 приведен пример этикеток на строительной площадке в одном из учебных городов.

Хотя маски построения полезны для визуализации (и для обучения алгоритмов сегментации глубокого обучения), точные векторные метки набора данных SpaceNet 7 позволяют назначать уникальный идентификатор (то есть адрес) каждому зданию. Соответствие этих адресов зданий между временными шагами является центральной темой задачи SpaceNet 7. На рисунке 5 мы отображаем эти изменения адреса здания.

4. Сводная статистика

5. Доступ к набору данных

Как всегда, данные SpaceNet находятся в свободном доступе на AWS. Как и в случае с предыдущими выпусками данных (например, SpaceNet 6), все, что вам нужно, это учетная запись AWS и установленный и настроенный AWS CLI. Как только вы это сделаете, просто выполните команду ниже, чтобы загрузить набор данных для обучения в свой рабочий каталог:

aws s3 cp s3://spacenet-dataset/spacenet/SN7_buildings/tarballs/SN7_buildings_train.tar.gz .

6. Выводы

Обнаружение изменений в изображениях над головой - сложная задача, которая сильно осложняется сезонными, атмосферными и световыми эффектами. Тем не менее, способность локализовать и отслеживать изменения в следах зданий с течением времени является важным аспектом в ряде приложений, от реагирования на стихийные бедствия и готовности к болезням до мониторинга окружающей среды. Кроме того, эта задача ставит перед сообществом компьютерного зрения интересные технические задачи.

Набор данных SpaceNet 7 обеспечивает прочную основу для достижений в этих областях благодаря большому корпусу изображений и меток, охватывающих более 100 различных местоположений, более 40 000 квадратных километров наблюдаемой территории и более 10 миллионов помеченных зданий.

Следите за новостями о предстоящих задачах и показателях SpaceNet 7, которые будут сопровождать этот набор данных (также см. Spacenet.ai для получения дополнительных ресурсов). Этот вызов стартует 31 августа 2020 года и будет представлен как соревнование на конференции NeurIPS 2020 года в декабре.

* Особая благодарность Хесусу Мартинесу Мансо за руководство созданием набора данных.

Поправка от 10 августа 2020 г .: введение было изменено, чтобы указать лицензию на набор данных SpaceNet 7 (CC BY-SA 4.0)