Всего за несколько дней сообщество Zindi создало модель, которая может точно прогнозировать качество воздуха в городах по всей Африке, заполняя пробелы там, где нет датчиков качества воздуха.

В поисках данных о качестве воздуха в Африке мы наткнулись на изображение, которое без особых усилий иллюстрирует проблему мониторинга загрязнения воздуха на континенте. Эта карта подключенных к Интернету датчиков качества воздуха по всему миру (из проекта Всемирный индекс качества воздуха (WAQI)) непреднамеренно подчеркивает, почему нам нужны новые подходы к отслеживанию качества воздуха в Африке.

В рамках проекта WAQI наземные датчики загрязнения воздуха нанесены на карту по всему миру, но охват Африки невелик. Источник: Проект WAQI.

Это подтверждается недавними отчетами Университета Претории и ЮНИСЕФ, в которых делается вывод о том, что нам нужны более качественные данные, чтобы понять ситуацию с загрязнением воздуха в Африке, прежде чем пытаться ее улучшить.

Аргументы в пользу улучшения данных о качестве воздуха в Африке

Помимо общих проблем со здоровьем органов дыхания, мы знаем, что загрязнение воздуха оказывает прямое влияние на уровень смертности от COVID-19. Это недавнее исследование (опубликовано на сервере препринтов Medrxiv, что означает, что оно еще не является рецензируемой научной публикацией) показывает прямую статистическую связь между долгосрочным загрязнением воздуха и смертностью от COIV-19.

Эпидемиологические модели, модели общественного здравоохранения и экономические модели нуждаются в данных о качестве воздуха для получения точных результатов. Авторы вышеупомянутого исследования говорят, что более высокий уровень загрязнения означает более строгое социальное дистанцирование, а повышенная медицинская готовность требуется там, где уровень загрязнения выше.

Хотя хакатоны Zindi предназначены для того, чтобы предложить африканским ученым, занимающимся данными, бросить вызов и получить возможность обучения, мы также очень заинтересованы в предоставлении практических решений искусственного интеллекта с открытым исходным кодом, которые помогут в борьбе с COVID-19. Поэтому, как только мы получили победившее решение devnikhilmishra в недавнем #ZindiWeekendz Urban Air Pollution Challenge (вы можете найти его самостоятельно на GitHub), мы протестировали его. Мы хотели посмотреть, как это работает для прогнозирования качества воздуха в местах, где у нас нет наземных датчиков загрязнения.

Сообщество Zindi принимает вызов

Задача состояла в том, чтобы построить модель, которая могла бы использовать спутниковые данные для местоположения и прогнозировать качество воздуха на земле, измеряемое наземными датчиками, наблюдающими за твердыми частицами (PPM2,5, обычная мера загрязнения воздуха). Эта проблема качества воздуха проходила с 10 по 12 апреля, и в ней приняли участие более 200 специалистов по данным из Африки и всего мира.

Мы сопоставили прогнозы победившей модели с «истинными» значениями датчика в месте, которое не было указано в обучающем наборе. Вы можете видеть, что предсказание (выделено оранжевым цветом) близко соответствует данным датчика (выделено синим цветом) для большого города (Лондон), а также для небольшого города в Южной Африке (Вустер с населением менее 100 000 человек). Это означает, что модель хорошо работает как для крупных, так и для малых городских центров.

Наши прогнозы качества воздуха точно соответствуют фактическим данным, полученным от наземных датчиков в Лондоне и Вустере, Южная Америка. Источник: Зинди

Лучшее представление о качестве воздуха в Африке

Теперь, когда мы убедились, что модель работает должным образом, мы можем использовать ее! Поскольку единственными входными данными модели являются спутниковые данные, мы можем применить эту модель к любому местоположению, даже к тому, где нет наземных датчиков.

Это позволяет нам составить картину качества воздуха для мест, где ранее не было доступных данных. На приведенной ниже карте показана наша модель качества воздуха, примененная к крупным городам Африки, с прогнозированием качества воздуха на один день.

Прогноз качества воздуха в крупных городах Африки на один день (2 апреля 2020 г.). Источник: Зинди.

Мы позаимствовали систему индикаторов качества воздуха с цветовой кодировкой WAQI для изображения выше, но вы заметите, что на этой карте Африки имеется заметно больше информации о качестве воздуха, чем на карте WAQI выше. Это полезная и полезная информация для политиков, исследователей в области общественного здравоохранения и эпидемиологов, моделирующих вспышку COVID и ее последствия для общественного здравоохранения.

Имея доступ к историческим спутниковым данным, мы можем легко оглянуться на долгосрочные тенденции, чтобы лучше понять тенденции в показателях здоровья или сравнить период блокировки COVID-19 с периодом нормальной активности.

Эта модель, конечно, имеет свои ограничения. Уровни загрязнения в городе часто различны: подумайте о Кейптауне, где в богатых жилых районах у океана воздух хорошего качества по сравнению с бедными сообществами и поселками внутри страны, где PMM2.5 часто достигает «нездорового» или «очень нездорового» уровня. Модель потенциально может быть улучшена для просмотра районов в пределах города, но разрешение используемых спутниковых данных накладывает ограничения на то, насколько хорошо это может работать.

Кроме того, поскольку модель была обучена на городских данных, распространение прогнозов на менее городские районы, вероятно, сделает модель менее точной. Это сложная задача, поскольку за пределами городских районов, особенно в Африке, очень мало датчиков качества воздуха.

Мы рады сообщить, что эта модель находится в свободном доступе для использования по лицензии CC BY-SA 4.0, поэтому, если вы хотите использовать ее, свяжитесь с нами ([email protected]).

Мы хотели бы сказать большое спасибо всем нашим зиндийцам, которые участвовали и помогли сделать этот проект возможным, особенно тем, кто занял верхние строчки таблицы лидеров. Мы также благодарны Microsoft за спонсорство #ZindiWeekendz и за то, что все это стало возможным. Если вам интересно посмотреть другие решения, ознакомьтесь с репозиториями GitHub ниже.

devnikhilmishra (1 место) — GitHub Repo

CoviData (2 место) — GitHub Repo

Klai (3 место) — GitHub Repo

О Зинди

Zindi — это платформа для проведения соревнований по науке о данных, в которой принимают участие более 12 000 специалистов по данным со всей Африки и других стран. Спонсируемый Microsoft, Zindi провел серию из шести виртуальных хакатонов выходного дня в течение апреля и мая, специально посвященных медицинским, социальным и экономическим последствиям COVID-19. Все решения будут размещены на GitHub и в свободном доступе для государственных и частных субъектов, которые смогут использовать их в своей борьбе с COVID-19.