Примеры из COVID-19

Поскольку пандемия коронавируса продолжает разворачиваться каждый день, и хотя большинство из нас не выходят из дома, почти невозможно избежать последних новостей и ежедневных брифингов. И в этом бесконечном потоке обновлений и информации, кажется, есть одна постоянная - это использование данных. Кажется, что каждая статья или новостной репортаж делятся или ссылаются на визуализации данных, выводы, основанные на данных, и смоделированные прогнозы, и даже просто данные.

Наборы данных компилируются и обновляются ежедневно и распространяются в массы. Использование данных на протяжении всей этой пандемии, несомненно, предоставило лицо и что-то осязаемое для невидимого в противном случае врага. Как новый студент, изучающий науку о данных, я хотел вникнуть в некоторые примеры и варианты использования, которые действительно показывают, насколько важными могут быть данные в реальных условиях.

Прогнозирование развития COVID-19 с помощью сложных моделей

Хотя у меня нет точной статистики, я думаю, довольно легко предположить, что по крайней мере половина визуализаций данных в обращении иллюстрирует прогнозы, основанные на моделях. Модели, основанные на данных, пытаются предсказать течение вируса (и, в конечном итоге, когда мы сможем вернуться к «нормальному» состоянию).

Эти модели принимают во внимание любые доступные данные, которые могут быть найдены, а также изрядное количество предположений, сделанных на основе прошлых данных, а также, конечно, умеренное количество неопределенностей. Хотя идеальных моделей не существует, федеральные агентства, такие как CDC и NIH, а также исследователи во всем мире все больше полагаются на модели прогнозирования для прогнозирования будущих сценариев и оказания помощи политикам.

«Модели несовершенны, но они лучше, чем летающие вслепую, если вы используете их правильно».

Моделирование - невероятно мощный инструмент, и в случае COVID-19 оно может помочь определить разницу между тысячами и миллионами погибших во всем мире. Эти модели помогают нам прогнозировать уровни инфицирования и больницы для планирования увеличения пропускной способности, а также то, насколько эффективными могут быть меры социального дистанцирования.

В одном примере, приведенный ниже график (который, я уверен, большинство людей видели больше раз, чем хотели), иллюстрирует концепцию того, как меры социального дистанцирования могут влиять на уровень инфицирования и госпитализации.

Этот график сглаживания кривой возможен благодаря мощности прогнозного моделирования. Красная кривая представляет собой прогноз частоты инфицирования без мер, а синяя кривая предсказывает частоту инфицирования с помощью мер социального дистанцирования.

Поиск лечения с помощью искусственного интеллекта

Наряду с моделированием искусственный интеллект (ИИ) также применялся множеством способов во время вспышки COVID-19. Одним из таких проектов было использование ИИ для выявления потенциальных методов лечения. В частности, ИИ вычисляет, можно ли использовать существующие в обращении лекарства для лечения коронавируса.

ИИ способен переваривать большие объемы научной литературы и медицинских исследований, чтобы находить связи между генетическими и биологическими свойствами болезней и составом и действием лекарств. Искусственный интеллект может выполнять проверку с помощью симуляционных тестов намного быстрее, чем когда-либо мог бы любой человек.

Например, компания DeepMind из Google, занимающаяся искусственным интеллектом, предсказала структуру белков коронавируса, что может оказаться полезным при разработке новых лекарств.

Данные ради данных - понимание пандемии

Наконец, хотя источники данных позволяют использовать модели прогнозирования и возможности машинного обучения, о которых говорилось выше, не менее важно признать важность просто наличия данных на протяжении всего этого времени . Будь то пандемия или нет, но особенно во время пандемии, всегда важно знать факты и оставаться в курсе.

Как однажды сказал один из философов-основателей (обычно приписываемый сэру Фрэнсису Бэкону): «Знание - сила». И в современном мире нельзя отрицать, насколько действительно важны наличие и доступность данных. Многие наборы данных компилируются, собираются и публикуются для всеобщего изучения и анализа - чтобы любой мог принять участие или просто оставаться в курсе.

Например, Johns Hopkins CSSE собрал следующую информационную панель Глобальные случаи коронавируса COVID-19 для отслеживания вируса во всем мире. На этой панели инструментов собраны ключевые показатели из набора данных подтвержденных случаев.

Эта панель управления построена на базе данных, общедоступной на Github, на которую есть ссылка на панели управления. Хотя данные используются в пандемии COVID-19 для проведения новаторской работы, одним из последствий, на который не стоит обращать внимания, является просто тот факт, что данные доступны в качестве источника информации и понимания пандемии. Панель управления Johns Hopkins получает более миллиарда взаимодействий в день.

Данные могут использоваться для представления фактов и текущего положения дел «как есть». Например, графики, подобные приведенным ниже, предлагают визуальное представление фактических чисел и информации по мере их развертывания.

Хотя есть еще много примеров в дополнение к вышеизложенному, использование науки о данных в глобальной пандемии, такой как COVID-19, действительно имеет решающее значение для оказания помощи обществам в эффективной и действенной борьбе со вспышкой.

Ссылки: