Это 94-й день моей серии Дневник машинного обучения (MLD).
Сегодня я рассмотрел концепцию алгоритма K-ближайшего соседа.
K-ближайшие соседи
Мы вкратце узнали, как работают k-ближайшие соседи в Дне 25. Рассмотрим некоторые свойства этого алгоритма.
Преимущества
- Очень простой алгоритм
- Обучение не требуется (непараметрический)
Недостатки
- Необходимо постоянно хранить большой набор данных
- Время теста долгое
- Время тестирования растет по мере роста набора данных
Измерение расстояния
Типичным выбором метрики расстояния является расстояние L2. В общем случае метрика расстояния может быть записана следующим образом:
Это все на сегодня.