Введение в алгоритмы машинного обучения

Цель кластеризации состоит в том, чтобы разделить совокупность или точки данных на несколько групп таким образом, чтобы точки данных в одних и тех же группах были более похожи друг на друга и отличались от точек данных в других группах. В этой статье я дам определение кластеризации и объясню многие типы кластеризации.

Что такое алгоритмы кластеризации?

Процесс группировки объектов по сходству называется кластеризацией. Описывается как неконтролируемая задача обучения с целью получения обучающих данных с использованием определенного набора входных данных, но без каких-либо заранее определенных целевых значений. Чтобы сделать набор неразмеченных данных более понятным и доступным для манипуляций, необходимо искать сопоставимые структурные характеристики. Кластер — это группа точек данных, которые связаны друг с другом через их соединения с соседними точками данных. Две области применения кластеризации — это анализ шаблонов и разработка признаков.

Типы алгоритмов кластеризации

Существуют различные методы кластеризации, которые могут обрабатывать различные виды данных.

на основе плотности

Данные организованы в кластеры с высокой плотностью точек данных, окруженные низкой плотностью точек данных. По сути, алгоритм идентифицирует области с высокой плотностью точек данных и обозначает эти области как кластеры.

На основе дистрибутива

В зависимости от вероятности того, что каждая точка данных принадлежит определенному кластеру, все точки данных рассматриваются как компоненты этого кластера.

на основе центроида

Эти методы делят точки данных в зависимости от нескольких центроидов, присутствующих в данных. В соответствии с квадратом расстояния от центроида каждая точка данных группируется в кластер. Это самый популярный вид кластеризации.

Иерархический

Все устроено сверху вниз путем создания дерева кластеров.

Популярные алгоритмы кластеризации

  • Алгоритм кластеризации K-средних
  • Алгоритм модели гауссовой смеси
  • Алгоритм кластеризации DBSCAN
  • Алгоритм БЕРЕЗА
  • Алгоритм кластеризации среднего сдвига
  • Алгоритм ОПТИКА

Что ж, если вам понравилась эта статья, вы можете ознакомиться с моими статьями, чтобы найти больше интересных статей в области искусственного интеллекта и машинного обучения.



Заключение

Если вы нашли эту статью полезной, оцените ее, похлопав в ладоши, и следите за мной, чтобы не пропустить другие интересные статьи. Что ж, у меня для вас хорошие новости: я буду приносить больше статей, объясняющих концепции и модели машинного обучения с помощью кодов, так что оставьте комментарий и расскажите, насколько вы взволнованы этим.