Анализ набора данных #IRIS для машинного обучения с использованием алгоритмов #классификации, доступных в программировании #R.

Мы начинаем с исходного набора данных, чтобы провести базовый анализ и визуализацию данных, после чего целенаправленно вводим отсутствующие значения в набор данных, а затем заменяем их пакетом #mice.

Анализ также учитывает #выбросы, которые присутствуют в наборе данных.

Выбор важных функций осуществляется с помощью #boruta.

Затем мы приступаем к разбиению набора данных на модели #обучения и #тестирования, а затем используем различные #алгоритмы, такие как #randomforest #ctree #rpart #knn #Weka (J48) и другие.

https://www.linkedin.com/feed/update/urn:li:activity:7021502192981262336?utm_source=share&utm_medium=member_desktop

P.S. Более совершенная версия того же анализа данных будет загружена в ближайшие недели (работа в процессе).