Анализ набора данных #IRIS для машинного обучения с использованием алгоритмов #классификации, доступных в программировании #R.
Мы начинаем с исходного набора данных, чтобы провести базовый анализ и визуализацию данных, после чего целенаправленно вводим отсутствующие значения в набор данных, а затем заменяем их пакетом #mice.
Анализ также учитывает #выбросы, которые присутствуют в наборе данных.
Выбор важных функций осуществляется с помощью #boruta.
Затем мы приступаем к разбиению набора данных на модели #обучения и #тестирования, а затем используем различные #алгоритмы, такие как #randomforest #ctree #rpart #knn #Weka (J48) и другие.
P.S. Более совершенная версия того же анализа данных будет загружена в ближайшие недели (работа в процессе).