Точные данные о школах имеют решающее значение для обеспечения качественного образования и поощрения обучения на протяжении всей жизни, обеспечения равного доступа к возможностям и, в конечном итоге, для сокращения бедности. Это ключевые аспекты человеческого достоинства и человеческого развития и, соответственно, основные Цели устойчивого развития ООН (ЦУР 4, ЦУР 10 и ЦУР 1 соответственно). Однако в большинстве мировых учебных заведений записи неточны, неполны или отсутствуют.

ЮНИСЕФ выступил с смелой инициативой нанести на карту уровень подключения каждой школы в мире. В рамках инициативы создается платформа больших данных, известная как Magic Box, которая объединяет данные частного сектора с новыми вычислительными методами для получения критического понимания потребностей наиболее уязвимых групп населения. Development Seed и Maxar (ранее DigitalGlobe) поддерживают эти усилия, внедряя новейшее машинное обучение в огромный глобальный архив спутниковых изображений высокого разрешения Maxar. Наша первая часть этой работы нанесла на карту школы в Либерии. Последние усилия добавили 7000 школ, которые ранее не были нанесены на карту в Колумбии и одиннадцати странах Восточного Карибского бассейна.

Поиск школ

Школы похожи на любую другую инфраструктуру. У них есть ясная основная цель, но они играют очень много других ролей в сообществах. Они предоставляют место для общественных собраний, общественные места отдыха, убежища и избирательные участки. Одним из следствий этого является то, что школы выглядят по-разному от региона к региону. Внешний вид может варьироваться в зависимости от финансирования, доступных материалов и наличия земли, а также от местного архитектурного стиля, истории и местных целей. Из-за этих различий трудно представить себе последовательный набор правил, которые можно было бы предоставить компьютеру для надежного обнаружения школ из космоса.

Современные подходы к глубокому обучению представляют собой реальный путь для решения этой проблемы. Эти новые методы представлены с большим разнообразием изображений школ и большим разнообразием изображений зданий, которые не являются школами. Исходя из этого, они могут развить более глубокое понимание того, что является школой, а что нет. Результаты автоматизированных подходов еще не идеальны. Но в сочетании с опытными валидаторами-людьми глубокое обучение может быстро сканировать огромное количество данных и дать возможность валидаторам-людям быстро добавлять на карту тысячи школ. Это значительно сокращает время и затраты на такую ​​задачу картографирования.

Школы в изображениях с высоким разрешением

Несмотря на свою разнообразную структуру, многие школы имеют идентифицируемые служебные сигнатуры, которые могут позволить обнаружить их с помощью современных методов глубокого обучения. Школы можно наблюдать из космоса, и они имеют четкие черты, например размер, форма и удобства здания. По сравнению с окружающими жилыми зданиями, школы больше по размеру, их формы варьируются от U, O, H или L (рис. 2); К школам обычно пристроено несколько объектов: автостоянки, игровые площадки, баскетбольные площадки, бассейны и т. д. Школы в городских и более богатых районах могут иметь группу зданий с одинаковым типом крыши и цветом, а иногда и с крышей. четкая школьная граница. Школа в сельской местности может иметь голую землю в качестве игровой площадки для детей, окруженную зелеными насаждениями, и к ней можно добраться по дорогам или тропам.

Компания Maxar поддержала это исследование, предоставив доступ к своей базовой карте Vivid Basemap с разрешением 31 см. Этот проект был выбран в качестве получателя премии GBDX Research Award и будет продолжать поддерживаться DigitalGlobe после окончания срока действия награды. На этом этапе проекта мы используем DigitalGlobe Vivid images (DG Vivid). DG Vivid - это снимок Земли, мозаичный, с повышенной резкостью и усилением цвета. Этот продукт для обработки изображений с высоким разрешением имеет пространственное разрешение 50 см и глобальный охват. На снимках с субметровым пространственным разрешением такие объекты, как здания, автомобили и деревья, можно четко наблюдать из космоса.

Одна из проблем при работе с изображениями высокого разрешения заключается в том, что это ОГРОМНОЕ количество данных. Для сканирования всей Колумбии в поисках школ потребовалось обработать более 500 ГБ данных изображений. Чтобы завершить этот проект в разумные сроки, мы использовали новый подход и новый набор инструментов с открытым исходным кодом, созданный нашей командой.

Создание школьного идентификатора с помощью глубокого обучения

В проекте мы применили сверточные нейронные сети в качестве школьного классификатора, чтобы сузить область поиска. Вкратце, это работает путем подачи индивидуальных спутниковых изображений в нашу CNN, чтобы получить вероятность того, что модель считает, что школа присутствует на этом изображении. Изображения, на которых предполагается наличие школы, отправляются в нашу Группу данных, состоящую из опытных картографов, чтобы проверить школу на изображении и нанести ее на карту (рис. 3). Команда Data Team также подготовила набор исключительно высококачественных обучающих данных, которые помогли нам получить точные результаты. Мы создали наш школьный классификатор, улучшив две предварительно обученные модели, Xception и MobileNetV2, из ImageNet, с проверенным и очищенным набором данных известных школ в Колумбии. Более подробно о техническом подходе вы можете прочитать в нашем онлайн-отчете.

Мы провели первоначальное тестирование двух многообещающих фреймворков машинного обучения: Xception и MobileNetV2. Бинарный школьный классификатор был обучен с использованием существующего и очищенного набора школьных данных в Колумбии. Наше предварительное тестирование показало немного лучшие результаты от Xception, поэтому мы выбрали Xception для оставшейся части проекта. Однако MobileNetV2 использовала только четверть времени на итерацию обучения на одном и том же наборе обучения, и точность проверки снизилась только на 1%. Тем, у кого нет доступа к богатым облачным вычислительным ресурсам, вы можете вместо этого рассмотреть возможность использования MobileNetV2 для обучения модели.

Следующим шагом было применение этой модели к небольшим участкам, чтобы определить, есть ли там школа. В общей сложности мы отсканировали 52 миллиона этих небольших участков, взятых из Ярких изображений DigitalGlobe над Колумбией и восточно-Карибским регионом. Чтобы справиться с огромным масштабом этой модели, мы использовали Chip n’ Scale , инструмент с открытым исходным кодом, созданный Development Seed для массового спутникового ИИ. Используя Chip n ’Scale и при поддержке команды, управляющей API изображений DigitalGlobe, мы смогли обработать 1,6 миллиона изображений в час, завершив весь вывод за 32 часа.

Наша модель определила 73000 плиток, которые, по ее прогнозам, могут содержать не нанесенную на карту школу. Пять экспертов-картографов просмотрели все 73 000 локаций за восемь рабочих дней. Хотя мы не смогли подтвердить каждую школу только по снимкам, команде удалось подтвердить данные около 11 000 школ в Колумбии и странах Карибского бассейна, в том числе около 7 000 школ, которых ранее не было на карте. Группа определила еще 62 000 местоположений, которые должны быть переданы для наземной проверки полевыми агентами и местными властями.

Наше исследование показало, что современное глубокое обучение и недорогие облачные вычисления могут помочь людям быстро и тщательно выявлять масштабные школы. Это обеспечивает первую объектно-ориентированную модель обнаружения для школ. Полная и точная карта школьных объектов может еще больше сократить цифровой разрыв в образовании и улучшить доступ детей к информации, цифровым товарам и возможностям, а также наилучшим образом использовать ограниченные образовательные ресурсы.

Полная карта школы в сочетании с данными о подключении, собранными в рамках инициативы UNICEF's Project Connect, будет использоваться для сокращения цифрового разрыва в образовании и улучшения доступа к информации, цифровым товарам и возможностям для целых сообществ. Кроме того, понимание местоположения школ может помочь правительствам и международным организациям получить критическое представление о потребностях уязвимых групп населения, а также лучше подготовиться и отреагировать на внешние потрясения, такие как вспышки болезней или стихийные бедствия.

Для получения дополнительной информации обратитесь к полному отчету по проекту. Рецензируемый документ по этой теме был принят на первом семинаре Компьютерное зрение для глобальных проблем 16 июня. Если вы планируете быть там, мы будем рады услышать от вас - не стесняйтесь обращаться ко мне в Twitter или LinkedIn.

Если вы заинтересованы в получении полезной информации из спутниковых снимков и карт достопримечательностей с помощью искусственного интеллекта, например школа, поликлиники, населенные пункты, тогда будьте на связи.