Почему Швеция может потерять много жизней

Выйдите на улицу в Стокгольме, и вы будете постоянно видеть, как много людей тусуются и делают покупки. Сегодня можно увидеть большое количество людей, идущих в Zara или H&M, чтобы заключить выгодные сделки, поскольку в данный момент есть распродажи. Но разве сейчас в Европе не свирепствует серьезная эпидемия?

COVID-19 поражает все страны Европы, включая Швецию. Мой друг Квентин и я, оба удивленные поведением страны, решили проанализировать ситуацию с точки зрения специалистов по данным. Правительство предложило людям оставаться дома и в безопасности, но действительно ли люди следуют этим предложениям? Наша гипотеза заключается в том, что многие этого не делают. И, следовательно, это может иметь драматическое влияние на развитие COVID-19 внутри страны.
Как специалисты по анализу данных, мы хотели создать показатель социального дистанцирования, с помощью которого можно было бы оценить, в какой степени определенная популяция следует мерам или «предложениям» оставаться взаперти дома.

Как мы можем построить показатель социального дистанцирования?

Наша первая идея заключалась в том, чтобы посмотреть, продолжают ли люди выходить на улицу или нет. Но мы ленивы и не хотим торчать по Швеции и периодически фотографировать улицы. Поэтому мы решили:

  1. Подключитесь к свободно доступным камерам в ключевых районах крупных городов Швеции
  2. Автоматически обнаруживать людей по полученным кадрам
  3. Постройте график изменения такой меры и сопоставьте ее с количеством случаев COVID-19 в Швеции

Мы начинаем с того, что периодически снимаем выходные данные с этих свободно доступных камер, затем передаем каждый выходной сигнал, который представляет собой кадр видеозаписи, в сеть CNN с помощью Yolo, затем мы определяем количество людей вместе на каждом временном шаге.

Yolo (достаточно один раз посмотреть) - это современная система обнаружения объектов. В основном он отличается от других алгоритмов скоростью вычислений. Мы не обучали нашу CNN дополнительно, поскольку использовали трансферное обучение (предварительно натренированные веса), чтобы максимально быстро разработать доступный процесс.

В Швеции мы сосредоточились на Гетеборге и Стокгольме, и в каждом городе было по несколько камер.

Картинка стоит миллиона слов. Итак, позвольте нам увидеть результат в нашем доступном в настоящее время веб-приложении, которое вы можете посетить здесь.

На приведенном выше графике мы можем видеть динамику среднего количества людей по ключевым районам Стокгольма вчера каждый час. Мы можем наблюдать, что одна и та же модель повторяется каждый день с пиком около полудня и 16:00.

Исходя из этого, мы можем получить более общее представление, построив максимальное и среднее количество людей, обнаруживаемых каждый день.

Как это связано с COVID-19?

Наша гипотеза такова: Если люди будут продолжать выходить на улицу, кривая COVID-19 не сгладится.

Чтобы сопоставить показатели количества людей, обнаруженных извне, и эволюции количества людей, инфицированных COVID-19, мы также извлекаем данные, предоставленные Университетом Джона Хопкинса, из этого репозитория git. Затем мы можем вычислить количество смертей и подтвержденное количество инфицированных. Оба показателя экспоненциально растут.

Как мы можем соотнести соблюдение мер сдерживания и эволюцию распространения COVID-19?

Строго говоря, сопоставить эти два показателя довольно сложно. Однако интуитивно наша гипотеза имеет смысл. Если люди продолжают выходить на улицу, вероятность передачи вируса от одного к другому выше, чем если бы все аккуратно оставались дома.

Что мы хотим показать:

Мы хотим показать статистически значимую корреляцию между количеством людей за пределами собранных в одном районе и развитием инфицированных случаев в Швеции. На данный момент мы согласовываем эти две меры по времени, предполагая, что у одного человека сразу появятся симптомы после выхода из дома и заражения.

Учитывайте инкубационный период:

Инкубационный период - это время между воздействием вируса и появлением первых симптомов. Новое исследование подсчитало, что средний инкубационный период COVID-19 составляет всего более 5 дней и что 97,5% людей, у которых развиваются симптомы, будут делать это в течение 11,5 дней заражения.

Что будет дальше:

В настоящее время мы работаем над более тщательным анализом корреляции между количеством людей, совместно выявленных за пределами страны, и количеством случаев COVID-19 в Швеции. Для этого мы учитываем инкубационный период, поэтому нам нужно вовремя больше данных. По сути, вместо того, чтобы согласовывать даты количества обнаруженных людей и количества подтвержденных случаев / смертей, мы возвращаемся во времени, используя временной сдвиг от 5 до 11 дней с учетом доступной информации об инкубационном периоде. .

Кроме того, мы планируем нормализовать количество людей, обнаруженных с течением времени, рассматривая его как временной ряд с сезонностью (мы всегда ожидаем, что больше людей будет на улице в выходные дни, и, следовательно, мы ожидаем периодического увеличения и уменьшения кривой каждую неделю).

Вместо того, чтобы соотносить количество людей, выявленных за пределами ключевых районов Швеции, с количеством случаев заболевания в течение 11 дней после этого, мы бы фактически сравнили соотношение количества людей, выявленных на улице, с количеством случаев заболевания в течение 11 дней. Оценка такого отношения определяется следующим уравнением:

И в действительности у нас действительно инфицировано больше людей, чем людей, признанных инфицированными. Точнее, мы можем написать, что реальное количество инфицированных в α раз превышает количество выявленных случаев.

Например, оценка α в Англии может доходить до 20. Такое соотношение зависит от различных параметров, и мы планируем исследовать это дальше в нашем анализе.

Резюме:

  1. Люди продолжают выходить на улицу в Швеции, как показывает наша модель, основанная на CNN.
  2. Кривая распространения COVID-19 в Швеции экспоненциально увеличивается, а не сглаживается.
  3. Если никаких изменений не произойдет, мы ожидаем непрерывного роста числа случаев, выявленных в Швеции, и аналогичных последствий в таких странах, как Италия и Франция.
  4. Мы проводим более строгий анализ, чтобы продемонстрировать нашу основную гипотезу.

Посетите нашу веб-страницу, чтобы узнать больше и оставить отзыв в разделе комментариев к этому сообщению. 🤗

Авторы:

Ранее инженер по обработке данных в Ekimetrics, а затем окончил Telecom ParisTech. Специализируется на программировании и Data Science.

Ранее специалист по анализу данных, стажер в Microsoft и студент кафедры машинного обучения Королевского технологического института KTH в Стокгольме.

Ресурсы:

Наше веб-приложение: https://corona-confinement.herokuapp.com/

Наш проект, показывающий панель управления в веб-приложении: https://github.com/MastafaF/corona_confinement_dashboard

Наш проект использует Yolo для обнаружения людей и создания базы данных:
https://github.com/MastafaF/corona_virus_analysis

Визуализация количества случаев COVID-19 в мире: https://github.com/ecohydro/covid-19-waves