KNN (K-ближайших соседей) – это алгоритм машинного обучения. Он используется для задач классификации и регрессии.
Алгоритм KNN находит K-ближайшего соседа в ранее помеченном наборе данных, когда необходимо классифицировать или предсказать новую точку данных. KNN может обрабатывать многомерные данные, представляющие каждую точку данных в виде вектора.
Для классификации KNN видит метки K ближайших соседей и классифицирует новую точку данных с метками большинства этих соседей. Для регрессии KNN оценивает новую точку данных, усредняя оценки своего K-ближайшего соседа.

Наиболее широко используемым методом измерения расстояния в KNN является евклидово расстояние.

Евклидово расстояние. Линейное расстояние между точками данных. Математически евклидово расстояние между двумя точками равно квадратному корню из суммы квадратов разностей их координат.

Подобно задаче регрессии, при оценке зависимой переменной Y для любого наблюдения со значениями X1 и X2 ближайшая единица наблюдения K определяется путем первого вычисления расстояния. Затем, в отличие от задачи регрессии, в качестве предсказанного класса определяется наиболее часто наблюдаемая частота значений Y ближайших K наблюдений.

Будьте на связи!

Вы можете получить все коды, связанные с исследованием, по следующим адресам в социальных сетях.