Машинное обучение может обнаружить Covid-19 менее чем за пять минут!

Информация и выводы из исследований, направленных на быстрое обнаружение коронавируса.

Вступление

Группа исследователей из всемирно известных академических институтов, таких как Оксфордский университет, Университет Уорика, Университет Монпелье и авторитетных исследовательских лабораторий, изобрели методологию обнаружения Covid-19 (SARS-CoV-2 ) и других респираторных патогенов в считанные минуты.

Это стало возможным благодаря использованию методов анализа изображений и машинного обучения, в частности сверточных нейронных сетей для классификации микроскопических вирусов респираторных заболеваний на основе структурных особенностей, уникальных для вирусов.

В этой статье представлена ​​ключевая информация и выводы из опубликованного исследования, относящиеся к работе, проделанной исследователями из вышеупомянутых институтов.

Прочитав эту статью, вы поймете интуицию и методы, лежащие в основе методов, используемых для создания пятиминутной системы обнаружения Covid-19 5, и другую важную справочную информацию.

Совершенно очевидно, что некоторые термины и фразы в этой статье могут быть незнакомы некоторым читателям, поэтому в некоторых местах этой статьи в некоторых разделах даются определения используемых слов и ключевых терминов.

SARS-CoV-2: штамм коронавируса человека, вызывающий болезнь Covid-19.

Патогены: болезнетворный организм или инфекционный агент. Распространенными типами патогенов являются вирусы, бактерии, грибы, прионы и паразиты.

Предыдущие методы обнаружения Covid-19 (SARS-CoV-2)

Возможно, вы уже знакомы с методами обнаружения Covid-19, возможно, вы недавно проходили тест на Covid-19. Некоторые тесты Covid-19 обнаруживают присутствие вируса в образце мазка из горла, в то время как другие выявляют антитела, которые вырабатываются иммунной системой человека для борьбы с болезнью.

Ниже приведены более формальные объяснения и описания тестов, которые обычно проводятся для обнаружения Covid-19.

Тесты амплификации нуклеиновых кислот

Тесты амплификации нуклеиновой кислоты обнаруживают Covid-19 путем идентификации конкретной последовательности нуклеиновой кислоты; это означает обнаружение уникальных биополимеров или биомолекул, уникальных для вируса.

Компонент амплификации этой процедуры обнаружения относится к созданию копий генетического материала или ДНК, специфичных для Covid-19.

Обнаружение наличия ДНК вируса фактически намного лучше с точки зрения ранней диагностики заболевания по сравнению с обнаружением антител. Организму обычно требуется время, чтобы вырабатывать антитела в ответ на вирусную инфекцию Covid-19.

Обнаружение антигенов и антител

Антигены - это инвазивные организмы, которые вызывают реакцию иммунной системы с образованием антител. Антитела обычно связываются с антигенами, вызывающими инфекции и заболевания, что, в свою очередь, заставляет иммунную систему нейтрализовать антигены.

Тесты на антитела к Covid-19 показывают, заразился ли человек ранее вирусом Covid-19, путем определения наличия антител у человека путем тестирования на антитела в крови.

Тест на антитела не показывает, инфицирован ли человек в настоящее время Covid-19, тогда как тест на антиген подтвердит, инфицирован ли человек сейчас.

Тестирование антигена работает путем обнаружения присутствия белков, связанных с вторгающимся патогеном.

Биополимеры: это материалы из длинных повторяющихся цепочек молекул, продуцируемых живыми организмами (РНК (рибонуклеиновая кислота) или ДНК (дезоксирибонуклеиновая кислота)).

Как работает пятиминутная процедура обнаружения

Процедура работает путем передачи изображений меченых вирусных частиц, которые обрабатываются для отображения определенных цветовых сигналов. Сверточная нейронная сеть проводит классификацию сигналов вирусных частиц на микроскопических изображениях.

Вот шаги процедуры более подробно:

  1. Процедура начинается с извлечения вирусных частиц с помощью мазка из зева.
  2. Собранные образцы вируса инактивированы формальдегидом.
  3. Следующим шагом является мгновенное мечение интактных вирусных частиц путем связывания коротких флуоресцентных ДНК с поверхностью вируса.
  4. После маркировки вирусные частицы иммобилизуют и помещают на предметное стекло, покрытое хитозаном.
  5. Изображения вирусных частиц с ограничением дифракции получают с помощью микроскопии.
  6. Затем методы обработки изображений и машинного обучения используются для классификации различных типов вирусов в образцах.

Сверточная нейронная сеть (CNN) классифицирует вирусные частицы на основе распределения флуорофоров на поверхности вирусных частиц. CNN использует уникальные особенности распределения флуорофоров на поверхности вирусных частиц.

Частицы вируса имеют различные формы, размер, структуру и химию поверхности, что, в свою очередь, позволяет распределению флуорофоров на поверхности вирусных частиц, что является уникальным признаком классификации вирусов.

Изображения, представленные в сеть CNN, содержат вирусные частицы, которые светятся как отдельные зеленые или красные сигналы флуоресценции и желтые частицы. Желтые частицы соответствуют совместно локализованным зеленым и красным сигналам флуоресценции (вирусным частицам, имеющим как красные, так и зеленые флуоресцентные метки).

Согласно исследованиям, в образце мазка из горла, который не содержал вируса SARS-CoV-2 (вирус-отрицательный), было обнаружено несколько колокализованных сигналов.

Колокализованные сигналы чаще наблюдаются в вирус-положительных образцах. См. Изображения ниже для примеров извлеченных изображений.

Перед пересылкой изображений через сверточную нейронную сеть области сигналов изображения фильтруются на основе дефицита (‹10 пикселей) областей сигналов изображения или изобилия (› 100 пикселей) сигналов изображения в пределах определенного поля обзора.

Адаптивная фильтрация - это метод обработки изображений, используемый для отделения вирусных сигналов от фона.

Другой метод, используемый для обеспечения преобладания сигналов вирусных частиц в изображениях, - это фильтрация сигналов на основе условий совместной локализации.

Сигналы, которые соответствуют установленным условиям сигналов колокализации, сохраняются, а те, которые не соответствуют, отфильтровываются из окончательных изображений, которые проходят через CNN.

Большинство практиков машинного обучения признают описанный выше процесс как методы обеспечения целостности и чистоты данных, которые применяются на этапе подготовки данных в жизненном цикле проекта машинного обучения.

Флуорофор: химическое соединение, которое действует как агент обнаружения благодаря своей способности поглощать и повторно излучать свет с различной длиной волны.

Колокализация: событие, при котором происходит пространственное перекрытие флуоресцентных меток.

Сетевая архитектура и методы машинного обучения

Архитектура сверточной нейронной сети, разработанная и реализованная в рамках этого исследовательского проекта, состоит из 15 уровней.

Проектирование архитектуры CNN делится на три этапа, а в конце - классификационная голова.

Первый этап идет после входного слоя, где есть сверточный слой (8 каналов, размер фильтра 2x2, 0 отступов), за которым следует ReLu, пакетная нормализация и слой максимального пула (размер пула 2x2, шаг 2). . На первом этапе на следующий этап выводятся восемь субдискретизированных карт функций.

Второй этап состоит из сверточного слоя (16 каналов, размер фильтра 2x2, заполнение 1), за которым следует ReLu, пакетная нормализация и слой максимального объединения (размер пула 2x2, шаг 2). На втором этапе выводятся шестнадцать карт функций с пониженной дискретизацией для следующего этапа.

Третий этап состоит из сверточного слоя (32 канала, размер фильтра 3x3, заполнение 1), за которым следует ReLu, пакетная нормализация и без слоя максимального объединения.

Результаты третьего этапа передаются на полностью связанный слой. В типичной CNN выходные данные сверточного слоя превращаются в одномерный массив перед передачей на полностью связанный слой.

Полностью связанный слой (плотный слой) содержит произвольное количество нейронов / единиц. Активации полностью подключенного уровня проходят через слой softmax, где выполняется классификация входных данных.

Ниже приведены некоторые краткие определения ключевых терминов, включенных в этот раздел. Не стесняйтесь пропустить, если вы уже знакомы с терминами и терминологией.

Сверточный слой. Свертка - это математический термин, который описывает умножение скалярного произведения между двумя наборами элементов. В рамках глубокого обучения операция свертки воздействует на фильтры / ядра и массив данных изображения в сверточном слое. Следовательно, сверточный слой - это просто слой, в котором выполняется операция свертки, которая происходит между фильтрами и изображениями, прошедшими через сверточную нейронную сеть.

Уровень пакетной нормализации: пакетная нормализация - это метод, который смягчает влияние нестабильных градиентов в нейронной сети за счет введения дополнительного уровня, который выполняет операции с входными данными из предыдущего уровня. Операции стандартизируют и нормализуют входные значения, после чего входные значения преобразуются посредством операций масштабирования и сдвига.

Слой MaxPooling: максимальный пул - это вариант субдискретизации, при котором максимальное значение пикселей, попадающих в принимающее поле единицы в пределах субдискретизации, берется в качестве выходных данных. Операция max-pooling ниже имеет окно 2x2 и скользит по входным данным, выводя среднее значение пикселей в принимающем поле ядра.

Сглаживание слоя: принимает входную форму и сглаживает входные данные изображения в одномерный массив.

Функция активации Softmax: тип функции активации, которая используется для получения распределения вероятностей набора чисел во входном векторе. Выходные данные функции активации softmax - это вектор, в котором его набор значений представляет вероятность возникновения класса или события. Сумма значений в векторе равна 1.

Гиперпараметры и дополнительная информация

  • Скорость обучения, использованная при обучении сверточной нейронной сети, была установлена ​​на 0,01 без снижения скорости обучения.
  • Размер мини-партии: 1000
  • Количество тренировочных эпох: 100
  • Частота проверки: 20 шагов

Обучение и тестирование

Вирус SARS-CoV-2 имеет аналогичные ранние симптомы с другими респираторными заболеваниями, такими как грипп и сезонные коронавирусы человека (hCov); Следовательно, любые методы обнаружения Covid-19 должны быть полезными для различения похожих вирусов.

Сеть CNN, используемая в этом исследовании, была обучена и проверена на наборе данных, содержащем четыре уникальных вируса, разделы для обучения и проверки составили 70% и 30% соответственно.

Исследователи убедились, что внедренная CNN может различать вирусы, которые имеют схожую форму, структуру и химию поверхности.

Согласно заметкам из исследовательской работы, этап обучения и проверки занял в общей сложности 12 минут.

Полученные результаты

Производительность обученной архитектуры CNN была представлена ​​через матрицу путаницы, включенную в исследовательский документ.

Матрица неточностей иллюстрирует эффективность алгоритма классификации для набора тестовых или оценочных данных, для которых классификации данных (метки) уже известны.

CNN была протестирована как на вирусах, выращиваемых в лаборатории в контролируемой среде, так и на клинических образцах вирусов, полученных от пациентов.

Ниже приведены подробные сведения о производительности и результатах классификации.

Выращенные в лаборатории вирусы и контролируемое тестирование

CNN была протестирована на способность классифицировать положительные и отрицательные образцы вируса IBV (вирус инфекционного бронхита). ИБК - это штамм коронавируса, поражающий птиц. CNN смогла классифицировать положительные и отрицательные отдельные вирусные частицы ИБК с точностью 91,4%.

Еще одним проведенным тестом была способность CNN различать вирусы, которые обладали схожими структурными свойствами. Вирусами, использованными для этого теста, были IBV и три других вируса гриппа (штамм Udorn, X31 и PR8).

CNN смогла различить вирусы из образцов IBV с точностью 95,5% (Udorn) и 94,5% (PR8). CNN обеспечила производительность 68,8%, когда ей было поручено классифицировать вирусы, которые были образцами вируса X31 или Udorn, двух очень похожих вирусов с точки зрения структурных свойств.

Клинические образцы вирусов в неконтролируемой среде

Более надежным тестом, который подчеркивает эффективность CNN, была классификация образцов вируса SARS-CoV-2 от пациентов. Образцы вируса были взяты из мазков из зева у пациентов с положительным и отрицательным результатом на SARS-CoV-2, а также на другие штаммы коронавируса человека (OC43, HKU1 и NL63).

Архитектура CNN была обучена и протестирована на данных, собранных из образцов вируса мазка из горла.

Обученная CNN хорошо справилась с классификацией между положительным и отрицательным SARS-CoV-2 с точностью примерно 70% и между hCov и отрицательными образцами с точностью 78%.

Точность классификации 73% была достигнута, когда CNN было поручено классифицировать образцы вируса, которые были либо SARS-CoV-2, либо любым из сезонных человеческих коронавирусов.

Уменьшение точности производительности, наблюдаемое между выращенными в лаборатории вирусами и клиническими образцами, объяснялось сложностью вирусов в клинических образцах; также выращенные в лаборатории образцы не содержали внешних остаточных клеточных материалов, которые могут повлиять на целостность образцов вирусов.

Преимущества и план развертывания

Преимущества процедуры и технологии экспресс-тестирования, упомянутые в этой статье, очевидны.

Крайне важно, чтобы мы, как общество, применяли методы, которые позволили бы взять под контроль нынешнюю пандемию.

Ниже приведены некоторые из основных преимуществ обсуждаемой технологии быстрого тестирования:

  • Предоставляет результаты диагностики в течение 2–5 минут с высокой точностью.
  • Быстрый метод обнаружения Covid-19, предложенный в исследовании, упомянутом в этой статье, полезен как инструмент ранней диагностики, который может помочь сдержать распространение инфекций посредством ранней диагностики.
  • Может эффективно различать вирусы, подобные SARS-CoV-2, это будет полезным атрибутом в зимние месяцы, когда сезонные коронавирусы более распространены среди пациентов.
  • Процесс, используемый в этом конкретном методе обнаружения Covid-19, можно использовать для обнаружения других респираторных вирусов.
  • Технология обнаружения, предложенная в исследовательской работе, может быть использована вне лабораторий. Таким образом, мы можем наблюдать развертывание этой технологии обнаружения в школах, домах престарелых, больницах и международных транспортных узлах.

Что касается сроков, когда эта 5-минутная технология обнаружения Covid-19 будет представлена ​​широкой публике, в настоящее время планируется создать компанию, которая сможет начать разработку продукта в первые месяцы 2021 года.

Одним из примечательных упоминаний о технологии быстрого обнаружения, которая была в авангарде публичных новостей, являются 12-минутные тесты на обнаружение Covid-19, которые в настоящее время продаются в британском розничном магазине товаров для здоровья и красоты Boots. Тестовые устройства от LumiraDx будут изначально стоить 120 фунтов стерлингов, а стоимость будет снижаться по мере увеличения спроса.



Надеюсь, статья была вам полезна.

Чтобы связаться со мной или найти другой контент, похожий на эту статью, сделайте следующее:

  1. Подпишитесь на мой Список рассылки для получения еженедельных информационных бюллетеней.
  2. Следуйте за мной на Medium
  3. Свяжитесь со мной и свяжитесь со мной в LinkedIn

Другие статьи