ИИ еще не оказал влияния, но специалисты по обработке данных приняли вызов

Введение

Заболевание COVID-19, вызванное вирусом SARS-CoV-2, было выявлено в декабре 2019 года в Китае и объявлено ВОЗ глобальной пандемией 11 марта 2020 года. Искусственный интеллект (ИИ) является потенциально мощным инструментом в борьбе с "COVID-19 пандемия". Для настоящих целей ИИ можно определить как приложения Машинное обучение (ML), Обработка естественного языка (NLP) и Компьютерное зрение, чтобы научить компьютеры использовать модели на основе больших данных для распознавания образов, объяснения и прогноз. Эти функции могут быть полезны для распознавания (диагностики), прогнозирования и объяснения (лечения) инфекций COVID-19, а также для управления социально-экономическими последствиями. С момента начала пандемии началась борьба за использование и изучение ИИ и других инструментов анализа данных для этих целей.

В этой статье я делаю предварительный обзор, обсуждая фактический и потенциальный вклад ИИ в борьбу с COVID-19, а также текущие ограничения на этот вклад. Он направлен на извлечение быстрых выводов из быстро расширяющегося обсуждения и растущего объема работы, чтобы служить в качестве исходных данных для быстрого реагирования в исследованиях, политике и медицинском анализе. Цена пандемии с точки зрения человеческих жизней и экономического ущерба будет ужасной; на момент написания большая неопределенность окружала оценки того, насколько ужасными и успешными могут быть немедикаментозные и фармацевтические меры. Улучшение искусственного интеллекта, одного из самых многообещающих инструментов анализа данных, разработанных за последнее десятилетие или около того, чтобы помочь уменьшить эти неопределенности, является стоящим делом. Обнадеживает то, что специалисты по данным взяли на себя эту задачу (что означает, что срок хранения этой статьи, вероятно, будет коротким).

Ключевые выводы заключаются в следующем. Я считаю, что ИИ пока что не помог против COVID-19. Использование искусственного интеллекта затруднено из-за недостатка данных, а также из-за слишком большого количества зашумленных и нестандартных данных. Преодоление этих ограничений потребует тщательного баланса между конфиденциальностью данных и проблемами общественного здравоохранения, а также более строгого взаимодействия человека и ИИ. Маловероятно, что они будут своевременно решены, чтобы оказать большую помощь во время нынешней пандемии. Вместо этого ИИ может помочь со следующей пандемией. Между тем, сбор диагностических данных о том, кто заразен, будет иметь важное значение для спасения жизней и ограничения экономического разрушения из-за сдерживания.

Фактический и потенциальный вклад ИИ в борьбу с COVID-19

Существует шесть областей, в которых ИИ может внести свой вклад в борьбу с COVID-19: i) ранние предупреждения и оповещения, ii) отслеживание и прогнозирование, iii) информационные панели, iv) диагностика и прогноз, v) лечение и лечение, и vi) социальный контроль.

Ранние предупреждения и оповещения

Случай с канадской моделью искусственного интеллекта BlueDot уже стал легендарным. Он показывает, что относительно недорогой инструмент искусственного интеллекта (BlueDot был профинансирован стартовыми инвестициями в размере около 9 миллионов долларов США) может превзойти людей в обнаружении вспышек инфекционных заболеваний. Согласно счетам, BlueDot спрогнозировала вспышку инфекции в конце 2019 года, выпустив предупреждение для своих клиентов 31 декабря 2019 года, до того, как Всемирная организация здравоохранения сделала это 9 января 2020 года. Исследователи работают. с BlueDot также опубликовали уведомление в Журнале медицины путешествий 14 января 2020 года, в котором перечислены 20 основных городов назначения, куда прибывают пассажиры из Ухани. Он предупредил, что эти города могут оказаться в авангарде глобального распространения болезни.

Хотя BlueDot, несомненно, является мощным инструментом, большая часть полученной им огласки содержит некоторое преувеличение и некоторую недооценку роли ученых-людей. Во-первых, в то время как BlueDot забил тревогу 31 декабря 2019 года, другая модель на основе искусственного интеллекта, HealthMap, в Бостонской детской больнице в США, забила тревогу еще раньше, 30 декабря 2019 года. Спустя всего 30 минут ученый из Программы мониторинга возникающих заболеваний объявил тревогу. Хотя модель на основе искусственного интеллекта была быстрее всего на 30 минут, она, тем не менее, придавала очень низкий уровень значимости вспышке. По сути, для распознавания угрозы требовалась человеческая интерпретация и контекст. Более того, даже в случае BlueDot люди остаются центральными в оценке его результатов, как объясняет в этом подкасте Камран Хан, основатель BlueDot. Поэтому справедливо подчеркивается, что для оптимального применения ИИ необходим человеческий фактор из различных дисциплин.

Отслеживание и прогнозирование

ИИ можно использовать для отслеживания (включая прогнозирование текущей погоды) и прогнозирования распространения болезни COVID-19 во времени и в пространстве. Например, после предыдущей пандемии, пандемии вируса Зика 2015 года, была разработана динамическая нейронная сеть для прогнозирования его распространения. Однако такие модели необходимо будет переобучить с использованием данных о пандемии COVID-19. Кажется, это происходит сейчас. В Университете Карнеги-Меллона алгоритмы, подготовленные для прогнозирования сезонного гриппа, теперь переобучаются на новых данных из COVID-19.

Различные проблемы затрудняют точное прогнозирование распространения пандемии. К ним относятся отсутствие исторических и объективных данных для обучения ИИ; паническое поведение, которое приводит к шуму в социальных сетях; и тот факт, что характеристики инфекций COVID-19 отличаются от характеристик предыдущих пандемий. Не только отсутствие исторических данных, но и проблемы с использованием больших данных, например, собранных из социальных сетей, оказались проблематичными.

Здесь подводные камни больших данных и искусственного интеллекта в контексте инфекционных заболеваний, как показал печально известный провал Google Flu Trends, остаются в силе. Дэвид Лазер, Райан Кеннеди и Алессандро Веспиньяни в статье 2014 года в Science назвали это высокомерием больших данных и динамикой алгоритмов. Например, по мере того, как инфекция продолжает распространяться и накапливаться трафик социальных сетей вокруг нее, накапливается количество шума, который необходимо отфильтровать, прежде чем можно будет выявить значимые тенденции. Для инструментов прогнозирования, основанных на поведении в прошлом, глобальный выброс с его массой новых и беспрецедентных данных, таких как COVID-19, был описан Яном Роуэном как криптонит современного подхода искусственного интеллекта , Что повлияет не только на прогнозирование инфекционных заболеваний, но и на все модели прогнозирования, в том числе в финансах, экономике. Как он объясняет, многие отрасли собираются вернуть людей в кресло прогнозирования, которое было отнято у них моделями.

Один из способов справиться с высокомерием в отношении больших данных и динамикой алгоритмов - это модерация контента в социальных сетях. Крупные платформы социальных сетей, такие как Google (YouTube) и Facebook, начали более интенсивно использовать ИИ для модерации контента, в том числе проверки на фальшивые новости, из-за сокращения численности персонала в результате мер изоляции. Больше полагаться на ИИ для модерации контента обнажило тот факт, что ИИ по-прежнему плохо с этим справляется. YouTube признал, что более широкое использование ИИ при модерации контента подвержено ошибкам. Это еще раз демонстрирует необходимость человеческого участия в ИИ и руководства им.

В результате нехватки данных, слишком большого количества резко выделяющихся данных и шумных социальных сетей, высокомерия больших данных и алгоритмической динамики прогнозы AI о распространении COVID-19 еще не очень точны и надежны. Следовательно, до сих пор большинство моделей, используемых для отслеживания и прогнозирования, не используют методы искусственного интеллекта. Вместо этого большинство синоптиков предпочитают устоявшиеся эпидемиологические модели, так называемые модели SIR, аббревиатура означает население территории, которая уязвима, заражена и R удален.

Например, Институт будущего человечества Оксфордского университета дает прогнозы распространения вируса на основе эпидемиологической модели GLEAMviz. Metabiota, компания из Сан-Франциско, предлагает Epidemic Tracker и модель краткосрочного прогнозирования распространения болезни, которую они используют для прогнозов. Том Кроуфорд, математик из Оксфордского университета, дает краткое и лаконичное объяснение этих SIR-моделей в недавнем видео на YouTube.

Институт Роберта Коха в Берлине использует эпидемиологическую модель SIR, которая учитывает правительственные меры сдерживания, такие как изоляция, карантин и предписания по социальному дистанцированию. Их модель объясняется здесь и здесь. Аналогичная расширенная модель SIR, учитывающая меры общественного здравоохранения против пандемии и использующая данные из Китая, была недавно предварительно опубликована и сделана доступной в формате R. Модель Института Роберта Кока использовалась ранее в случае Китая, чтобы проиллюстрировать, что сдерживание может быть успешным в сокращении распространения до более медленных, чем экспоненциальных, темпов.

Отслеживание и прогнозирование распространения COVID-19 являются ценными данными для органов общественного здравоохранения при планировании, подготовке и управлении пандемией. И оценить, где они находятся на эпидемиологической кривой и удастся ли их сгладить. Он также может дать приблизительное представление о возможном воздействии мер, принятых для сокращения или замедления распространения. Например, Институт Роберта Коха прогнозировал, что число инфицированных в Нидерландах к 28 марта 2020 года достигнет 10922. На этот день, согласно CSSE Университета Джона Хопкинса, общее количество инфицированных пациентов в Нидерландах было ниже прогнозируемого. , на 8647. Это может усилить аргументы в пользу того, что подход правительства помогает снизить рост инфекций.

Панели мониторинга данных

Отслеживание и прогнозирование COVID-19 привело к появлению индустрии информационных панелей, которые визуализируют пандемию. MIT Technology Review подготовил рейтинг этих дашбордов для отслеживания и прогнозирования. Они оценивают верхние панели инструментов как UpCode, NextStrain, JHU CSSE Джона Хопкинса, Thebaselab, BBC, New York Times и HealthMap. Среди других примечательных панелей мониторинга - ИИ-трекер Microsoft Bing.

Хотя эти информационные панели дают глобальный обзор, все большее число стран уже имеют свои собственные информационные панели; например, в Южной Африке была создана Панель мониторинга COVID 19 ZA в Южной Африке, которую ведет Группа исследований данных для исследования социального воздействия Университета Претории.

Чтобы облегчить создание визуализаций данных и панелей мониторинга пандемии, Tableau создала Центр данных COVID-19 со стартовой книгой COVID-19. А Tirthajyoti Sarkar опубликовал скрипт Python, чтобы проиллюстрировать, как можно извлечь данные из набора данных COVID-19 New York Times для создания визуализации данных о прогрессировании инфекции. Аманда Макулец призывает к ответственной визуализации данных о COVID-19, перечисляя Десять соображений при визуализации данных о COVID-19.

Диагностика и прогноз

Быстрая и точная диагностика COVID-19 может спасти жизни, ограничить распространение болезни и получить данные для обучения моделей искусственного интеллекта. ИИ может предоставить полезный вклад в этом отношении, в частности, при диагностике на основе изображений. Согласно недавнему обзору приложений искусственного интеллекта против COVID-19, проведенному исследователями, работающими с UN Global Pulse, исследования показали, что искусственный интеллект может быть таким же точным, как и люди, может сэкономить время радиологов и проводить диагностику быстрее и дешевле, чем с помощью стандартных тесты на COVID-19. Могут использоваться как рентгеновские снимки, так и компьютерная томография (КТ). Адриан Роузброк предлагает учебное пособие о том, как использовать глубокое обучение для диагностики COVID-19 с помощью рентгеновских снимков. Он отмечает, что тесты на COVID-19 дефицитны и дороги, но что во всех больницах есть рентгеновские (или компьютерные) аппараты. Магдид и др.. (2020) предложили метод использования мобильных телефонов для сканирования изображений компьютерной томографии.

В этом отношении несколько инициатив находятся в стадии реализации. ИИ под названием COVID-Net был разработан для диагностики COVID-19 на рентгеновских снимках грудной клетки с использованием данных пациентов с различными заболеваниями легких, включая COVID-19. В Китае исследователи из Университета Жэньминь в Ухане опубликовали модель искусственного интеллекта (однако, еще не прошедшую экспертную оценку) для диагностики COVID-19 с помощью компьютерной томографии, заключив, что Модель глубокого обучения показала сопоставимую производительность с экспертом. радиолога, и значительно повысить эффективность работы радиологов в клинической практике. Он обладает огромным потенциалом для того, чтобы снизить нагрузку на врачей-радиологов, улучшить раннюю диагностику, изоляцию и лечение и, таким образом, внести вклад в борьбу с эпидемией .

Другой пример продолжающихся усилий - это работа исследователей из Голландского университета Делфта, которые выпустили модель искусственного интеллекта для диагностики COVID-19 с помощью рентгеновских лучей. Эта модель, обозначенная как CAD4COVID, представляет собой программу искусственного интеллекта, которая выявляет подозреваемых на COVID-19 по рентгеновским снимкам грудной клетки. Он основан на предыдущих моделях искусственного интеллекта, разработанных университетом диагностики туберкулеза.

Потенциал ИИ в диагностике еще не реализован на практике, хотя сообщалось, что ряд китайских больниц развернули радиологические технологии с использованием ИИ. Радиологи, однако, выразили свою обеспокоенность тем, что для обучения моделей ИИ недостаточно данных, что большинство доступных изображений COVID-19 поступают из китайских больниц и могут страдать от систематической ошибки выбора, а также что с использованием компьютерной томографии и X - лучи могут загрязнить оборудование и распространить болезнь дальше. Действительно, использование компьютерной томографии в европейских больницах упало после начала пандемии, что, возможно, отражает эту озабоченность.

Наконец, как только заболевание диагностируется у человека, возникает вопрос, будет ли он поражен и насколько интенсивно. Не всем людям с диагнозом COVID-19 потребуется интенсивная терапия. Возможность прогнозировать, кто пострадает в большей степени, может помочь в выборе адресной помощи и планировании распределения и использования медицинских ресурсов. Исследователи из Китайского университета науки и технологий Хуачжун использовали машинное обучение для разработки алгоритма прогностического предсказания, позволяющего предсказать вероятность того, что кто-то переживет инфекцию. А группа исследователей из Вэньчжоу и Нью-Йорка подготовила ИИ, который может с 80-процентной точностью предсказать, у какого человека, пораженного COVID-19, разовьется острый респираторный дистресс-синдром (ARDS). Однако выборка, которую они использовали для обучения своей системы искусственного интеллекта, небольшая (всего 53 пациента) и ограничена двумя китайскими больницами.

В заключение следует отметить, что применение искусственного интеллекта для диагностики COVID-19 и прогнозирования того, как пациенты могут прогрессировать, стимулировало большие исследовательские усилия, но пока не имеет широкого применения. Как заключает Деван Колдевей: Этой весной врач ИИ не поставит диагноз коронавируса никому. Также кажется, что сравнительно меньше усилий прилагается к использованию ИИ для очень ранних диагностических целей, например, для определения того, инфицирован ли кто-то еще до того, как он обнаруживается на рентгеновских снимках или компьютерной томографии, или на поиск диагностических средств на основе данных, которые имеют меньшее заражение. риск.

Способы лечения

Еще задолго до вспышки COVID-19 искусственный интеллект хвалили за его способность вносить вклад в открытие новых лекарств. В случае COVID-19 ряд исследовательских лабораторий и центров обработки данных указали, что они нанимают ИИ для поиска средств лечения и вакцины против COVID-19. Есть надежда, что ИИ сможет ускорить как процессы открытия новых лекарств, так и перепрофилирования существующих лекарств.

Например, DeepMind от Google предсказал структуру белков вируса - информацию, которая может быть полезна при разработке новых лекарств. Однако, как сообщает DeepMind на своем веб-сайте, мы подчеркиваем, что эти предсказания структуры не были проверены экспериментально… мы не можем быть уверены в точности структур, которые мы предоставляем.

Исследователи из Южной Кореи и США опубликовали результаты использования ML для идентификации существующего препарата атазанавир, который потенциально может быть перепрофилирован для лечения COVID-19. Исследователи из Benevolent AI, британского стартапа в области искусственного интеллекта, и Imperial College опубликовали статью в The Lancet, в которой идентифицировали барицитиниб, препарат, используемый при ревматоидном артрите и миелофиброзе, в качестве потенциального средства лечения COVID-19. . Исследователи из сингапурской фирмы Gero, используя глубокую нейронную сеть, определили ряд существующих экспериментальных и одобренных лекарств, в том числе Афатиниб, средство от рака легких, которое может потенциально использоваться для лечения COVID-19. - Однако их работа еще не прошла рецензирование.

Маловероятно, что эти методы лечения (и, возможно, лекарства) будут доступны в ближайшем будущем, по крайней мере, для того, чтобы они были очень полезны во время нынешней пандемии. Причина в том, что медицинские и научные проверки, отслеживание и контроль, которые необходимо провести до того, как эти препараты будут одобрены, после того, как они будут идентифицированы и проверены, потребуют времени - по оценкам, до 18 месяцев для вакцина.

Социальный контроль

ИИ использовался и может использоваться в дальнейшем для управления пандемией путем сканирования общественных мест на предмет потенциально инфицированных людей, а также путем принудительного социального дистанцирования и мер изоляции. Например, как описано в South China Morning Post, В аэропортах и ​​на вокзалах по всему Китаю инфракрасные камеры используются для сканирования толпы на предмет высоких температур. Иногда они используются с системой распознавания лиц, которая может определить человека с высокой температурой и то, носит ли он или она хирургическую маску .

Китайская фирма Baidu - один из производителей таких инфракрасных камер, использующих компьютерное зрение для сканирования толпы. Сообщается, что эти камеры могут сканировать 200 человек в минуту и ​​распознают тех, у кого температура тела превышает 37,3 градуса. Однако тепловидение критиковалось за то, что оно неадекватно для определения на расстоянии лихорадки у людей в очках (поскольку сканирование внутреннего слезного протока дает наиболее надежные показания) и потому, что оно не может определить, повысилась ли температура у человека из-за COVID-19 или по другой причине.

Что еще более тревожно, как сообщает South China Morning Post, Эта система также используется для обеспечения того, чтобы граждане подчинялись приказам о самоизоляции. Согласно сообщениям, лицам, нарушившим приказ и покинувшим дом, позвонили из властей, предположительно после того, как их отслеживала система распознавания лиц .

Это использование не ограничивается Китаем. Система камер компьютерного зрения на основе искусственного интеллекта, сканирующая общественные места, использовалась для отслеживания того, соблюдают ли люди в британском городе Оксфорд меры правительства по социальному дистанцированию. Стартап в США, основанный на компьютерном зрении, уже предлагает программное обеспечение для обнаружения социального дистанцирования, которое использует изображения с камеры для обнаружения нарушения норм социального дистанцирования, после чего отправляет предупреждение. В более крайних случаях израильское правительство одобрило кибер-мониторинг со стороны своих служб безопасности для выявления и помещения в карантин людей, которые могут быть заражены, а Россия внедряет нашу комбинацию приложения и QR-системы для отслеживания зараженных людей и контроля движение.

В то время как использование ИИ для прогнозирования и диагностики COVID-19 затруднено из-за отсутствия исторических данных обучения, инструменты ИИ, такие как компьютерное зрение и роботы, - нет. Следовательно, в краткосрочной перспективе мы с большей вероятностью увидим, что этот тип ИИ будет использоваться и, кроме того, для социального контроля. Связанные с этим технологии, такие как мобильные телефоны с приложениями или носимыми устройствами на базе искусственного интеллекта, которые собирают данные о местоположении, использовании и здоровье их владельцев, также с большей вероятностью будут задействованы. Георгиос Петропулос из Брейгеля заявляет, что такие приложения позволяют пациентам получать в режиме реального времени информацию о времени ожидания от своих поставщиков медицинских услуг, чтобы давать людям советы и обновлять информацию об их состоянии здоровья без необходимости лично посещать больницу. , а также для уведомления людей о потенциальных очагах заражения в режиме реального времени, чтобы их можно было избежать .

Основываясь на данных с мобильных устройств, Google опубликовал «Отчеты о мобильности сообщества COVID-19», доступные для 131 страны, что позволяет наблюдать влияние мер сдерживания на мобильность людей.

Какими бы полезными они ни были, есть опасения, что, когда вспышка закончится, эрозия конфиденциальности данных не будет отменена, и что правительства будут продолжать использовать свои улучшенные возможности для опроса своего населения и использовать данные, полученные в борьбе с COVID. -19 для других целей. Юваль Ноа Harari (2020) предупреждает: «Даже когда количество заражений от коронавируса снизится до нуля, некоторые правительства, нуждающиеся в данных, могут утверждать, что им необходимо сохранить системы биометрического наблюдения, потому что они опасаются второй волны коронавируса или потому что в Центральной Африке развивается новый штамм Эбола, или потому что. . . вы поняли. "

Ограничения: слишком много и слишком мало данных

ИИ может стать инструментом в борьбе с COVID-19 и подобными пандемиями. Однако, как заключает Георгиос Петропулос из Брейгеля, системы искусственного интеллекта все еще находятся на предварительной стадии, и пройдет время, прежде чем будут видны результаты таких мер искусственного интеллекта. Здесь было показано, что текущее использование ИИ фактически ограничено, с одной стороны, нехваткой данных, а с другой стороны, слишком большим объемом данных. Отсутствуют исторические данные, на которых можно обучать модели искусственного интеллекта, недостаточно открытых наборов данных и моделей для работы, но также существуют потенциальные проблемы, связанные с высокомерием больших данных, отсутствием корректировки алгоритмов, а также потоком научных результатов и аномальных данных, которые должны быть изменены и оценены, прежде чем они в конечном итоге будут подвергнуты клиническим испытаниям.

Напротив, там, где ИИ проще использовать, например, для наблюдения, мы, вероятно, увидим больше усилий, но с потенциально неблагоприятными долгосрочными последствиями для конфиденциальности и связанных с этим проблем с правами человека. Ниже я остановлюсь на этих вопросах более подробно.

Во-первых, что касается потребности в большем количестве данных, по COVID-19 явно требуется больше новых обучающих данных; Требуется большая открытость и обмен информацией, а также необходимы более совместные и междисциплинарные исследования для улучшения возможностей ИИ. Более того, необходимо провести дополнительные диагностические исследования. Во всех этих случаях роль людей во взаимодействии с ИИ и управлении им необходима.

К настоящему времени достигнут обнадеживающий прогресс в ряде заметных мероприятий, в которых признается важность создания и обмена существующими наборами данных и информацией об эпидемии. Одной из первых стала база данных Глобальные исследования коронавируса Всемирной организации здравоохранения (ВОЗ) со ссылками на другие аналогичные инициативы.

Одной из самых амбициозных инициатив, посвященных ИИ, является, пожалуй, совместная инициатива Semantic Scholar, Института искусственного интеллекта Аллена, Microsoft, Facebook и других по обеспечению открытого доступа к COVID-19 Open Research Dataset ( CORD-19), который содержит около 44 000 научных статей, которые теперь доступны для интеллектуального анализа данных.

В связи с этим Kaggle, платформа для проведения соревнований по науке о данных, на основе этих данных объявила конкурс данных Вызов открытого набора данных по COVID-19. Zindi, крупнейшая платформа для конкуренции данных в Африке, аналогичным образом запустила конкурс, чтобы точно предсказать распространение COVID-19 по миру в течение следующих нескольких месяцев.

Elsevier опубликовал в своем Информационном центре по новому коронавирусу результаты раннего и рецензируемого исследования COVID-19, а также около 20 000 статей на ScienceDirect. как полные тексты для интеллектуального анализа данных. Точно так же Линза предоставила все свои данные о патентах в так называемых Патентных наборах инноваций в области человеческого коронавируса и исследовательских работ для поддержки поиска новых и перепрофилированных лекарств. Google предоставил (до 15 сентября 2020 г.) общедоступные наборы данных COVID-19 на своей облачной платформе, а Amazon запустил публичное озеро данных AWS COVID-19. , который он описывает как централизованное хранилище обновленных и тщательно отобранных наборов данных о распространении и характеристиках нового вируса короны (SARS-CoV-2) и связанного с ним заболевания COVID-19.

К другим инициативам по сбору данных и открытым инновациям относятся Калифорнийский университет в Беркли, Иллинойский университет в Урбана-Шампейн и C3.ai, учредивший Институт цифровой трансформации C3.ai. Этот институт объявил конкурс предложений на методы искусственного интеллекта для смягчения пандемии. Среди прочего, они должны касаться применения машинного обучения и других методов искусственного интеллекта для смягчения распространения пандемии COVID-19 и анализа данных для исследования COVID-19 с использованием личных и конфиденциальных данных. Данные открытого доступа также собираются и предоставляются Инициативой GISAID (ранее - Глобальной инициативой по совместному использованию всех данных о гриппе).

Открытый доступ к данным и научной литературе о COVID-19 продвигают не только крупные технологические компании, издатели и университеты, но и более мелкие стартапы и НПО. Например, Newspeak House - независимый колледж с проживанием в Великобритании - начал краудсорсинговую инициативу, Справочник по коронавирусу, в которую он пригласил общественность внести свой вклад. А Эмили Чен и ее коллеги опубликовали первый общедоступный набор данных о COVID-19 в Twitter.

Приложения ИИ сдерживает не только отсутствие данных, но и, как это ни парадоксально, их слишком много. Как было отмечено, по мере того, как пандемия прогрессирует и проблема доминирует в новостях и социальных сетях, создается слишком много шума больших данных и резко выделяющихся данных, и алгоритмы будут перегружены - это был урок из Google Flu Trends 'неудавшаяся инициатива. В этом случае особенно ценными становятся курирование контента и алгоритмическая корректировка, основанные на человеческом здравом смысле. Кроме того, ученым придется иметь дело с потоком научных статей и новых данных, которые генерируются и передаются через них.

Ежедневно выходит более 100 научных статей о пандемии. Однако в этой потенциальной информационной перегрузке инструменты анализа данных могут сыграть важную роль. Примером инициативы в этом отношении является Навигатор доказательств COVID-19, который предоставляет компьютерные карты доказательств научных публикаций о пандемии, ежедневно обновляемые из PubMed.

Выводы

ИИ пока не играет значительной роли в борьбе с COVID-19, по крайней мере, с эпидемиологической, диагностической и фармацевтической точек зрения. Его использование ограничено нехваткой данных и слишком большим количеством зашумленных и резко отклоняющихся данных. Для обучения ИИ необходимо создание объективных данных временных рядов. Растущее число международных инициатив в этом отношении обнадеживает; тем не менее, необходимо провести дополнительные диагностические исследования. Не только для предоставления обучающих данных для запуска моделей ИИ, но и для более эффективного управления пандемией и снижения ее стоимости с точки зрения человеческих жизней и экономического ущерба.

На момент написания значительные усилия всех затронутых стран были направлены на то, чтобы закрыть свою экономику путем блокировки, обеспечения социального дистанцирования и отмены мероприятий. На данный момент эти меры, похоже, смогли замедлить распространение. Однако сомнительно, что эти меры будут устойчивыми более чем на пару недель. По мнению Группы реагирования на COVID-19 Имперского колледжа, «Основная проблема подавления этого типа интенсивного вмешательства… необходимо будет поддерживать до тех пор, пока вакцина не станет доступной, учитывая, что мы прогнозируем, что передача быстро восстановится. если вмешательство смягчается. "

Дополнительные диагностические тесты будут полезны, чтобы в конечном итоге остановить пандемию, ограничить экономический ущерб от блокировок и избежать восстановления после ослабления ограничений. Матиас Деватрипонт и его коллеги приводят доводы в пользу обширного диагностического тестирования населения, чтобы позволить людям вернуться к работе только в том случае, если они не заразны, и поместить на карантин тех, кто инфицирован. Они также призывают к более рандомизированной выборке тестов, чтобы улучшить наши оценки доли популяции с вирусом, которая остается бессимптомной. В настоящее время мы просто не знаем, сколько людей инфицировано. По сути, это может быть, как показывает исследование Science, что 86 процентов всех случаев заражения могут быть недокументированными. Если это так, то очень высока опасность возобновления пандемии. Таким образом, критически важно преодолеть ограниченные данные о том, кто заразен.

Наконец, данные имеют решающее значение для того, станет ли ИИ эффективным инструментом против будущих эпидемий и пандемий. Как я уже упоминал, опасаются, что проблемы общественного здравоохранения превзойдут проблемы конфиденциальности данных. Правительства могут захотеть продолжить чрезвычайное наблюдение за своими гражданами еще долго после того, как пандемия закончится. Таким образом, опасения по поводу эрозии конфиденциальности данных оправданы.

Полное обсуждение правовых и этических аспектов управления данными выходит за рамки данной статьи. Однако два прекрасных комментария опубликованы в Брейгеле и Nature. Короче говоря, учитывая угрозу общественному здоровью, создаваемую пандемией, Европейский GDPR (статья 9) позволяет собирать и анализировать личные данные, если они преследуют четкую и конкретную цель в области общественного здравоохранения. Гибкость для своевременного сбора и анализа больших данных имеет важное значение в борьбе с пандемией, даже если может потребоваться, чтобы власти собирали больше личных данных, чем многие люди могли бы чувствовать себя комфортно. Поэтому крайне важно, чтобы власти проявляли особую осторожность при обращении с такими данными, их обосновании и доведении до сведения общественности. Опасность заключается в том, что люди могут потерять доверие к правительству, что, как отметили Йенка и Вайена, заставит людей с меньшей вероятностью следовать советам или рекомендациям общественного здравоохранения и с большей вероятностью будет иметь худшие результаты в отношении здоровья .