Это 94-й день моей серии Дневник машинного обучения (MLD).

Сегодня я рассмотрел концепцию алгоритма K-ближайшего соседа.

K-ближайшие соседи

Мы вкратце узнали, как работают k-ближайшие соседи в Дне 25. Рассмотрим некоторые свойства этого алгоритма.

Преимущества

  • Очень простой алгоритм
  • Обучение не требуется (непараметрический)

Недостатки

  • Необходимо постоянно хранить большой набор данных
  • Время теста долгое
  • Время тестирования растет по мере роста набора данных

Измерение расстояния

Типичным выбором метрики расстояния является расстояние L2. В общем случае метрика расстояния может быть записана следующим образом:

Это все на сегодня.