НЕОБРАБОТАННЫЕ ДАННЫЕ
Во-первых, данные получены от пациентов с сердечными заболеваниями из частной больницы. Мы хотели бы использовать разделение теста поезда, чтобы предсказать человека, у которого будет болезнь сердца, на основе этих данных.
ИМПОРТ ЗАВИСИМОСТИ
Нам нужно импортировать важные зависимости из scikit, чтобы узнать из Google Colab, как показано ниже:
ОТОБРАЖЕНИЕ ДАННЫХ
Данные будут включены в нашу модель и отображаться в 30 рядах.
СТАТИСТИЧЕСКИЕ ДАННЫЕ
Мы начали анализировать данные, чтобы получить статистические данные из этого диапазона данных с 303 рядами пациентов.
КЛАССИФИКАЦИЯ ДАННЫХ
Мы разделили пациентов на две классификационные группы: 0 — без заболеваний сердца и 1 — пациенты с заболеваниями сердца.
СТАНДАРТИЗАЦИЯ ДАННЫХ
Стандартизация данных — это процесс преобразования данных в общий формат, позволяющий пользователям обрабатывать и анализировать их.
МОДЕЛИРОВАНИЕ ДАННЫХ
Модели данных состоят из сущностей, которые являются объектами или понятиями, данные о которых мы хотим отслеживать, и они становятся таблицами в базе данных. Продукты, поставщики и клиенты — все это примеры потенциальных сущностей в модели данных. В этом случае мы будем использовать 20% тестовых данных от общих данных, чтобы проверить данные, прежде чем обучить оставшиеся 80% данных, чтобы сделать прогноз на основе нашего машинного обучения с использованием анализа разделения тестов на обучение.
ОЦЕНКА ТОЧНОСТИ
Данные о точности показывают, что более 80% показывают, что данные приемлемы.
СДЕЛАТЬ ПРОГНОЗ
После того, как моделирование будет успешно реализовано, мы получим данные от одного пациента, чтобы диагностировать вероятность сердечно-сосудистых заболеваний. В данном случае я выберу возраст (60), пол (0-мужской), цп (0), трестбпс (150), хол (258), фбс (0), рестэкг (0), талах (2), эксанг ( 7), олдпик (6), склон (1), ка (2), таль (3).
РЕЗУЛЬТАТ
У этого пациента выше нет сердечного заболевания после анализа, проведенного машинным обучением. Вот и все!