Тематическое исследование ситуации с COVID-19 в Соединенных Штатах Америки

Введение

Прежде чем мы начнем, пожалуйста, не ожидайте от нас многого, потому что мы не одни из лучших ученых мира. Скорее, мы были привилегированной командой, которая получила пользу от инициативы Кеша Уильямс, организованной женщинами, которые кодируют (WWCode) и ACloudGuru.

Больницы - одно из важнейших заведений в обществе, а койко-место - неотъемлемая часть больницы. После пандемии (Covid-19) больницы играют решающую роль в нашем обществе.

Соединенные Штаты Америки серьезно пострадали от Covid-19, вся возможная поддержка оказывается больницам со стороны правительства и неправительственных организаций для заботы о людях. Тем не менее, какая-то больница может нуждаться в большей степени, чем другие больницы, и данные доступны, чтобы доказать это, но использование данных для прогнозирования больниц, которые в этом нуждаются или которые скоро достигнут пика загрузки, - это шаг, который стоит предпринять.

Цель проекта

Цель проекта - обучить алгоритм машинного обучения, который может прогнозировать коэффициент использования койки с высокой точностью, который затем может быть использован в качестве основы программного (мобильного) приложения, которое сектор управления здравоохранением может использовать, чтобы решить, какая больница будет в нужде в ближайшее время.

Заявление о проблеме

Пандемия в Соединенных Штатах Америки затронула от сотен до сотен тысяч людей по всей стране. В то время как в некоторых местах, таких как: Западная Вирджиния, Вайоминг, Южная Дакота и т. Д., Было немного случаев; другие места, такие как: Нью-Йорк, Массачусетс, Калифорния и т. д .; имели высокие случаи заражения и смерти COVID-19.

Это означает, что медицинским центрам потребуется много ресурсов, чтобы справиться с проблемами. При наличии надлежащей системы прогнозирования менеджменту здравоохранения по всей стране будет легко эффективно составить бюджет для конкретной больницы до того, как больница предъявит требования. Возможные проблемы, с которыми сталкиваются больницы:

  1. Растущее число случаев COVID вызывает острую нехватку больничных коек.
  2. Нехватка больничных коек может привести к неадекватному лечению и увеличению смертности среди пациентов с COVID.
  3. Оценить, сколько больничных коек потребуется при увеличении числа случаев COVID, сложно.

Решение и масштаб проекта

В этом проекте используются данные, полученные в период пандемии, что означает, что система прогнозирования наиболее актуальна во время пандемии.

1. Коэффициент использования больничных коек - это процент коек, занятых в настоящее время пациентами.

2. Коэффициент использования койки определяет, есть ли возможность принять больше пациентов.

3. Наша модель предсказывает коэффициент использования койки в зависимости от силы тока.

● Случаи COVID.

● Смертность от COVID.

● Всего лицензированных коек (всего коек)

● Доступны все вентиляторы.

Другие функции с низкой корреляцией с целевой функцией.

Методология

В этом разделе мы обсудим инструменты, методы и технологии, используемые для построения системы прогнозирования.

Сбор, обработка и хранение данных

Сбор данных осуществлялся в основном из открытого источника, то есть обмена данными Amazon (бесплатная подписка). Были получены два разных набора данных. Сюда входят: случаи заражения Covid-19 и случаи смерти в округах каждого штата и наборы данных об использовании койко-мест для больниц по округам и штатам. Ресурс по койкам включает данные о количестве лицензированных коек, коек с персоналом, коек в отделениях интенсивной терапии и коэффициента использования коек в больницах США.

Перед удалением нерелевантных объектов каждый набор данных был сгруппирован по округам и штатам. После этого мы объединяем наборы данных. Изучите наборы данных, а также проверьте корреляцию наборов данных с помощью корреляции копейщика. Тепловая карта корреляции помогла нам отбросить некоторые особенности.

1. Источники данных для нашей модели:

а. Данные о коронавирусе (Covid-19) в США | Нью-Йорк Таймс

Https://console.aws.amazon.com/dataexchange/home?region=us-east-1#/entitled-data-sets/cd2c8f9e908d78b2863f4ea7039b6cc5/revisions/32fbfdec79056f25074c0e25bd9634c2

б. Больничные койки США | Окончательное здравоохранение

Https://console.aws.amazon.com/dataexchange/home?region=us-east-1#/entitled-data-sets/298d3e38f0022d96e1e3d9f76f31ba00/revisions/90aaa6a6ba8d0f44b7332051dfb2fb3f

2. Хранение данных: AWS s3 Bucket.

Все наборы данных хранились в ведре s3 перед очисткой, после очистки наборов данных в sage-maker мы экспортируем очищенные наборы данных в ведро s3.

Разработка модели

Очищенные наборы данных были импортированы в sage-maker, разделенные на наборы данных для обучения, тестирования и проверки. И предварительно обученный алгоритм под названием linear-Learner был обучен с наборами данных, из которых алгоритм работал хорошо. Результаты показаны ниже.

Следующие ниже шаги были выполнены во время разработки модели.

  1. Исследование данных с использованием морской библиотеки.
  2. Разделение данных на данные обучения, тестирования и проверки в соотношении 60%, 20%, 20% соответственно.
  3. Хранение данных: AWS S3 Bucket.
  4. Настройка модели:

а. Выбор алгоритма AWS (Linear-Learner: «регрессор»).

б. Оценщик модели: тип экземпляра = отдельный экземпляр (ml.m4.xlarge).

c. Установка гиперпараметров модели (эпохи: 50, mini_batch_size: 25, скорость обучения: 0,001) и т. Д.

Для завершения проекта нам понадобилось приложение, и на его разработку потребуется время. Руководители mia-marketplace связались с нами и хотели, чтобы мы развернули нашу модель на их платформе, чтобы автоматически создать приложение, которое будет выставлено для всеобщего использования на mia-marketplace. Это означает новые требования, потому что mia может работать с моделями, построенными с помощью sklearn, но не с линейным учеником sagemaker. Последние версии scikit-learn, которые поддерживает mia, - это 0.22.1 и 0.23.1, поэтому мы должны это учитывать. Кроме того, версия python должна быть python 3.5 или 3.7.

В sagemaker мы изменили версию python с 3.6 на 3.7, а затем установили указанный sklearn. Мы обучаем несколько моделей, таких как случайный регрессор леса, градиентное усиление и т. Д. Randomforest показал лучшие результаты. При этом мы также позаботились о том, чтобы параметры были настроены так, чтобы мы могли получить хорошо работающую модель.

Результаты модели

Ниже представлен наш результат от linear-Learner и sklearn (github).

Развертывание модели и создание приложения на Mia

Получив правильные параметры, представитель mia обучил нас тому, как использовать mia-marketplace для развертывания приложения на основе машинного обучения. После этого мы развертываем приложение в загруженном файле рассола нашей модели. Мы протестировали приложение на MIA, и оно работает нормально. Ниже скриншот.

Согласно международным стандартам, коэффициент использования коек составляет от 84% до 85%, что подразумевает адекватное использование больничных помещений и ресурсов. Однако высокий коэффициент использования коек показывает, что такая больница может нуждаться в дополнительных медицинских ресурсах для поддержки пациентов.

Заключение, ограничения и рекомендации

Это было здорово, начиная с поиска данных, очистки, обсуждения, обучения модели и развертывания. ACloudGuru, WWCode и mia-marketplace дали нам возможность учиться, а также оказывать влияние. Этот проект открыт для улучшения по-разному:

я. Таким образом, создается больше данных, модель потребует постоянного переобучения для точного прогнозирования.

II. Это одна из областей применения, добавление более разнообразных данных может помочь изменить область применения.

Этот проект призван помочь в разработке политики в отношении экономических аспектов материалов для больниц, а не состояния здоровья пациентов.

Спасибо Кеша Вильямс из A-Cloud-Guru и Саманта Уокер из Mia-Marketplace.

Спасибо, что прочитали статью. Вы можете найти членов команды на connectedIn:

(а) Джаззмин Миллер

(б) Неха Ранаде

(c) Джозеф Итопа Абубакар

Ссылка на коды проектов

Https://github.com/JosephItopa/Drop_of_my_Python_Projects/tree/master/Hackathon

Https://github.com/neharanadee/Team_41_Machine_Learning_Hospital_bed_prediction_COVID

Ссылки

Https://www.researchgate.net/publication/326741475_The_Importance_of_Bed_Occupancy_Rate_in_Evaluate_The_Utilization_of_Hospitals

Http://hmis.cohhio.org/index.php?pg=kb.page&id=16

Https://www.iosrjournals.org/iosr-jdms/papers/Vol18-issue4/Series-2/J1804024955.pdf

Https://www.sciencedirect.com/topics/nursing-and-health-professions/hospital-bed-utilization