ЦЕЛЬ: Изучить и понять алгоритм k-Nearest Neighbor.

Алгоритм K-ближайшего соседа

Учитывая новый предмет:

1. Найдите расстояния между новым элементом и всеми остальными элементами

2. Выберите k более коротких расстояний

3. Выберите наиболее распространенный класс на этих k дистанциях.

4. Именно в этом классе мы будем классифицировать новый элемент.

Набор данных:

Набор данных Iris Plants: Набор данных содержит 150 экземпляров (по 50 в каждом из трех классов). Количество атрибутов: 4 числовых, предиктивные атрибуты и класс.

Программа и вывод:

· Импорт библиотек:

· Чтение набора данных в кадр данных pandas и указание имени столбца:

· Разделить набор данных:

· Разделить данные на обучающий и тестовый наборы:

· Прогнозирование тестового набора данных:

· Результат печати:

· Матрица путаницы:

· Отчет о классификации:

· Точность классификатора:

· Чувствительность и специфичность:

Скачать файл ipnyb можно здесь. Если вы найдете это полезным, пожалуйста, похлопайте мне. Спасибо за чтение.