Узнайте, на какие факторы следует обращать внимание в отношении потенциальных сердечно-сосудистых заболеваний (ССЗ) на основе исторических данных.

Краткое содержание

Это исследование направлено на то, чтобы выяснить, на какой фактор сердечно-сосудистых заболеваний (ССЗ) следует обратить внимание, основываясь на списке зарегистрированных случаев сердечно-сосудистых заболеваний (ССЗ), опубликованном несколькими наблюдениями из Кливленда, Венгрии, Швейцарии, Лонг-Бич, штат Вирджиния, и Сталога (Heart ) Набор данных. Это исследование, в котором модель машинного обучения может оказать большую помощь людям с сердечно-сосудистыми заболеваниями или с высоким риском сердечно-сосудистых заболеваний, нуждается в раннем выявлении и лечении.

Введение

Сердечно-сосудистые заболевания (ССЗ) являются причиной смерти номер 1 во всем мире, унося примерно 17,9 миллиона жизней ежегодно, что составляет 31% всех смертей в мире. Четыре из 5 смертей от сердечно-сосудистых заболеваний связаны с сердечными приступами и инсультами, и одна треть этих смертей происходит преждевременно среди людей в возрасте до 70 лет.

Наиболее важными поведенческими факторами риска сердечно-сосудистых заболеваний и инсульта являются нездоровое питание, низкая физическая активность, употребление табака и злоупотребление алкоголем. Воздействие поведенческих факторов риска может проявляться у людей в виде повышенного артериального давления, повышенного уровня глюкозы в крови, повышенного уровня липидов в крови, а также избыточного веса и ожирения. Эти «промежуточные факторы риска» могут быть измерены в учреждениях первичной медико-санитарной помощи и указывают на повышенный риск сердечного приступа, инсульта, сердечной недостаточности и других осложнений.

В этой статье исследуется сердечная недостаточность с использованием набора данных, содержащего 11 функций, которые можно использовать для прогнозирования возможного заболевания сердца. Этот набор данных был создан путем объединения различных наборов данных, уже доступных независимо, но не объединенных ранее. В этом наборе данных 5 наборов данных о сердце объединены по 11 общим признакам, что делает его самым большим набором данных о сердечных заболеваниях, доступным на сегодняшний день для исследовательских целей.

В этой статье рассматриваются следующие вопросы:

  • Какой фактор в наибольшей степени влияет на число случаев сердечно-сосудистых заболеваний в мире?
  • Существуют ли какие-либо регулярные действия, которые могут быть полезны для выявления потенциальных случаев сердечных заболеваний в будущем?

Анализ выполняется с помощью Python. Подробные шаги для выполнения анализа см. здесь.

Функции данных

Вот особенности, рассматриваемые в этом исследовании.

  • Возраст (возраст пациента в годах)
  • Пол (пол пациента, М или Ж)
  • Тип боли в груди (бессимптомная, типичная стенокардия, атипичная стенокардия и неангинальная боль)
  • АД в состоянии покоя (артериальное давление пациента в состоянии покоя в мм рт.ст.)
  • Холестрол (холестрол в сыворотке пациента в мг/дл)
  • Уровень сахара в крови натощак (уровень сахара в крови пациента натощак)
  • ЭКГ покоя (ЭКГ пациента в состоянии покоя)
  • Максимальная частота сердечных сокращений (максимальная частота сердечных сокращений пациента, достигнутая в ударах в минуту)
  • Физическая стенокардия (упражнения включают стенокардию)
  • Oldpeak (числовая мера депрессии сегмента ST у пациента, учитывающая физические нагрузки по сравнению с состоянием покоя)
  • ST Slope (наклон пикового сегмента ST при нагрузке)

Выводы

Какой фактор больше всего влияет на число случаев сердечных заболеваний в мире?

Из парного графика видно, что вероятность сердечных заболеваний выше у людей из следующих категорий:

  1. Взрослые люди
  2. Люди с повышенным артериальным давлением в состоянии покоя.
  3. Люди с повышенным уровнем холестерина.
  4. Пожилые люди с высокими показателями OldPeak.
  5. Пожилые люди с повышенным уровнем холестерина.
  6. Люди с высоким максимальным ЧСС.

Мы изучаем тип боли в груди, чтобы повлиять на болезни сердца

Глядя на приведенную выше диаграмму, мы видим, что не потому, что у человека нет симптомов, это не означает, что у него нет риска сердечно-сосудистых заболеваний. Мы ожидали, что у людей, страдающих атипичной стенокардией, будет низкая вероятность сердечно-сосудистых заболеваний. Почему это? Атипичная стенокардия используется для описания боли, которая не соответствует типичному представлению. Большинство причин атипичной стенокардии связаны не с сердцем, а с заболеваниями органов дыхания, опорно-двигательного аппарата и желудочно-кишечного тракта.

Мы можем спутать неангинозную боль с сердечным заболеванием, поскольку вы обычно чувствуете ее за грудиной и напоминает боль в сердце. Обычно это вызвано проблемами с мышцами или костями, проблемами с легкими, а иногда и проблемами с желудком, такими как язвы. Вот почему у людей, которые испытывали неангинозную боль, меньше вероятность сердечно-сосудистых заболеваний. Типичная ангинальная боль представляет собой заболевание сердца, и поэтому шансы человека иметь заболевание сердца или нет близки.

Слишком высокий уровень сахара в крови может способствовать накоплению бляшек в артериях, что в конечном итоге может ограничить количество крови, поступающей к вашим жизненно важным органам. В результате могут возникнуть болезни сердца. Приведенная выше диаграмма ясно показывает, что у человека с BS натощак выше 120 мг/дл высока вероятность развития сердечно-сосудистых заболеваний.

Из вышеизложенного видно, что ваш шанс заболеть сердечно-сосудистыми заболеваниями коррелирует с OldPeak и Возрастом и обратно коррелирует с MaxHR.

Есть ли какие-либо регулярные действия, которые могут быть полезны для выявления потенциальных случаев сердечно-сосудистых заболеваний в будущем?

Основываясь на приведенном ниже рисунке, можно понять, что заболевания сердца возникают в возрасте от 45 до 68 лет.

Учитывая гендерный фактор, большинство случаев сердечно-сосудистых заболеваний в основном приходится на мужской пол, но, вероятно, у женщин также могут быть сердечно-сосудистые заболевания.

У большинства пациентов, которые испытывают бессимптомную боль в груди, диагностирован сердечный приступ, а у меньшего числа — типичная стенокардия. По данным, около 79% пациентов, которые испытывали бессимптомную боль в груди, имели сердечные заболевания, а остальные 21% не имели их.

ЭКГ в покое — это тест, который измеряет электрическую активность сердца.

На основании результата ЭКГ в покое, при нормальном результате не было большого влияния на выявление болезни сердца, а затем при ГЛЖ и ST результат может быть признаком болезни сердца.

Инфаркт миокарда с подъемом сегмента ST (ИМпST) — это тип сердечного приступа, который в основном поражает нижние камеры сердца. Они названы в честь того, как они изменяют вид электрической активности вашего сердца при определенном типе диагностического теста.

Когда наклон ST плоский, случаев сердечного заболевания больше, около 83%. Когда наклон ST восходящий, примерно в 80% случаев, согласно нашему набору данных, мы можем сказать, что у пациента не будет сердечного заболевания.

Согласно нашему набору данных, когда уровень сахара в крови натощак ниже 121 мг/дл, около 48% пациентов были диагностированы с сердечными заболеваниями.

Когда уровень сахара в крови натощак превышает 120 мг/дл, примерно у 79% пациентов диагностируется заболевание сердца.

Стенокардия при физической нагрузке — это тип боли в груди, вызванный уменьшением притока крови к сердцу.

При стенокардии физической нагрузки, как показывают наши данные, примерно у 85% пациентов диагностируется заболевание сердца. При отсутствии стенокардии только у 35% больных диагностировали порок сердца.

Прогноз

Мы используем прогнозирование 5 моделей для определения пациентов с сердечными заболеваниями или нет.

  1. Логистическая регрессия
  2. Древо решений
  3. K-ближайший сосед
  4. SVM
  5. Случайный лес

Основываясь на приведенном ниже рисунке, наилучшая точность получена методом Random Forest с 88%. Подробнее можно посмотреть здесь.

+---------------------+----------+-----------+--------+----------+
|     Estimators      | Accuracy | Precision | Recall | F1-Score |
+---------------------+----------+-----------+--------+----------+
| Random Forest       |     0.88 |      0.90 |   0.90 |     0.90 |
| K-Nearest Neighbor  |     0.86 |      0.89 |   0.87 |     0.88 |
| SVM                 |     0.86 |      0.89 |   0.87 |     0.88 |
| Logistic Regression |     0.84 |      0.89 |   0.84 |     0.86 |
| Decision Tree       |     0.81 |      0.86 |   0.81 |     0.84 |
+---------------------+----------+-----------+--------+----------+

Заключение

Количество пациентов с сердечной недостаточностью увеличивается с каждым днем. Чтобы преодолеть эту опасную ситуацию и снизить вероятность сердечной недостаточности, необходима система, которая может генерировать, управлять или классифицировать данные с использованием подхода машинного обучения. В этом проекте были протестированы различные модели, а затем предложена лучшая модель для прогнозирования людей с сердечной недостаточностью при условии, что доступен набор данных, содержащий различные симптомы, используемые в проекте. В дальнейшем модель может быть реализована как система для врачей и кардиохирургов для своевременной диагностики вероятности сердечного приступа у пациентов.