Пневмония - это инфекция, при которой воспаляются воздушные мешочки в одном или обоих легких. Воздушные мешочки могут заполняться жидкостью или гноем (гнойным материалом), вызывая кашель с мокротой или гноем, лихорадку, озноб и проблемы с дыханием. Различные организмы, включая бактерии, вирусы и грибки, могут вызывать пневмонию. Он может вызвать легкое или опасное для жизни заболевание у людей любого возраста и является самой крупной инфекционной причиной смерти во всем мире.

Ссылка на задание: https://www.kaggle.com/c/rsna-pneumonia-detection-challenge

В этом блоге мы построим модели для обнаружения визуального сигнала пневмонии. Для этого алгоритм должен автоматически определять затемнение легких на рентгенограммах грудной клетки. Для построения этой модели я использую Python в качестве языка сценариев и данные с сайта Kaggle.

Данные из Kaggle:

1. Обучающие изображения - формат DICOM

2. Тестирование изображений - формат DICOM

Изображения представлены в формате DICOM (Цифровые изображения и коммуникации в медицине) и представлены как «.dcm.». Теперь, когда у нас все готово, пора начинать!

1. Загрузите данные

Во-первых, нам нужно показать изображения, необходимые для импорта необходимых пакетов. Эти пакеты помогут нам загрузить данные и показать визуальные сигналы. Мы используем следующие пакеты: google.colab, os, zipfile, pandas, pydicom. Насколько нам известно о других распространенных импортных пакетах. Здесь я просто добавляю фрагмент для pydicom. После шага ниже мы получим все атрибуты.

Следующий шаг загрузит все данные во фреймы данных.

Теперь нам нужно проверить форму, уникальные значения и атрибуты null. Итак, по мере обработки описанных выше небольших шагов анализа данных мы создадим обучающий фрейм данных. После чего мы снова выполним операцию с уникальными значениями.

На этом этапе ваш фрейм данных обучения настроен для визуализации.

2. Визуализируйте отношения между атрибутами.

Мы просто будем использовать необходимые атрибуты для дальнейшей обработки. «PatientId», «Возраст», «Пол», «ViewPosition» и «PixelSpacing» - это лишь некоторые из атрибутов, которые мы будем анализировать. Как мы уже узнали из последних блогов, нам необходимо импортировать некоторые графические пакеты, такие как matplotlib, pyplot и seaborn.

Используя указанные выше библиотеки и атрибуты, мы можем очень легко отображать категориальную статистику.

Поскольку мы закончили с категориальным представлением, мы можем показать полученные dicom изображения.

Теперь мы готовы найти визуальные пятна непрозрачности легких.

Здесь мы видим все визуальные пятна, указывающие на пневмонию.

Вывод

Как видно на рентгенограммах, мы правильно спрогнозировали наличие пятен пневмонии. Вы можете продолжить работу над моделированием, чтобы более точно предсказать вероятность того, что человек страдает пневмонией.

Оставайтесь здоровыми и безопасными!

P.S. Я скоро поделюсь кодом полностью. А пока вы можете почитать другие мои блоги, в которых исследуется роль машинного обучения в отделе здоровья и спорта.