ЦЕЛЬ: Изучить и понять алгоритм k-Nearest Neighbor.
Алгоритм K-ближайшего соседа
Учитывая новый предмет:
1. Найдите расстояния между новым элементом и всеми остальными элементами
2. Выберите k более коротких расстояний
3. Выберите наиболее распространенный класс на этих k дистанциях.
4. Именно в этом классе мы будем классифицировать новый элемент.
Набор данных:
Набор данных Iris Plants: Набор данных содержит 150 экземпляров (по 50 в каждом из трех классов). Количество атрибутов: 4 числовых, предиктивные атрибуты и класс.
Программа и вывод:
· Импорт библиотек:
· Чтение набора данных в кадр данных pandas и указание имени столбца:
· Разделить набор данных:
· Разделить данные на обучающий и тестовый наборы:
· Прогнозирование тестового набора данных:
· Результат печати:
· Матрица путаницы:
· Отчет о классификации:
· Точность классификатора:
· Чувствительность и специфичность:
Скачать файл ipnyb можно здесь. Если вы найдете это полезным, пожалуйста, похлопайте мне. Спасибо за чтение.