НЕОБРАБОТАННЫЕ ДАННЫЕ

Во-первых, данные получены от пациентов с сердечными заболеваниями из частной больницы. Мы хотели бы использовать разделение теста поезда, чтобы предсказать человека, у которого будет болезнь сердца, на основе этих данных.

ИМПОРТ ЗАВИСИМОСТИ

Нам нужно импортировать важные зависимости из scikit, чтобы узнать из Google Colab, как показано ниже:

ОТОБРАЖЕНИЕ ДАННЫХ

Данные будут включены в нашу модель и отображаться в 30 рядах.

СТАТИСТИЧЕСКИЕ ДАННЫЕ

Мы начали анализировать данные, чтобы получить статистические данные из этого диапазона данных с 303 рядами пациентов.

КЛАССИФИКАЦИЯ ДАННЫХ

Мы разделили пациентов на две классификационные группы: 0 — без заболеваний сердца и 1 — пациенты с заболеваниями сердца.

СТАНДАРТИЗАЦИЯ ДАННЫХ

Стандартизация данных — это процесс преобразования данных в общий формат, позволяющий пользователям обрабатывать и анализировать их.

МОДЕЛИРОВАНИЕ ДАННЫХ

Модели данных состоят из сущностей, которые являются объектами или понятиями, данные о которых мы хотим отслеживать, и они становятся таблицами в базе данных. Продукты, поставщики и клиенты — все это примеры потенциальных сущностей в модели данных. В этом случае мы будем использовать 20% тестовых данных от общих данных, чтобы проверить данные, прежде чем обучить оставшиеся 80% данных, чтобы сделать прогноз на основе нашего машинного обучения с использованием анализа разделения тестов на обучение.

ОЦЕНКА ТОЧНОСТИ

Данные о точности показывают, что более 80% показывают, что данные приемлемы.

СДЕЛАТЬ ПРОГНОЗ

После того, как моделирование будет успешно реализовано, мы получим данные от одного пациента, чтобы диагностировать вероятность сердечно-сосудистых заболеваний. В данном случае я выберу возраст (60), пол (0-мужской), цп (0), трестбпс (150), хол (258), фбс (0), рестэкг (0), талах (2), эксанг ( 7), олдпик (6), склон (1), ка (2), таль (3).

РЕЗУЛЬТАТ

У этого пациента выше нет сердечного заболевания после анализа, проведенного машинным обучением. Вот и все!