Я прочитал несколько разных статей о том, как PAM выбирает начальные медоиды, но я получаю противоречивые мнения.
Некоторые предполагают, что k первых медоидов выбираются случайным образом, в то время как другие предполагают, что алгоритм изначально выбирает k репрезентативных медоидов в наборе данных (хотя и не уточняя, как происходит эта «репрезентативность»). Ниже я перечислил эти ресурсы:
Недостатки алгоритма K-Medoid (PAM)
https://paginas.fe.up.pt/~ec/files_1112/week_06_Clustering_part_II.pdf
https://www.datanovia.com/en/lessons/k-medoids-in-r-algorithm-and-practical-examples/
1) Мой вопрос был бы в том, мог бы кто-нибудь объяснить более подробно, как алгоритм выбирает начальные k медоидов, поскольку, насколько я понимаю, разный начальный выбор может привести к разным результатам.
2) Также является ли это одной из причин использования CLARA (помимо минимизации времени вычислений и проблем с объемом оперативной памяти) - найти медоиды через ресемплинг, которые являются "оптимальными" вариантами?
Я использую R в скобках с функцией pam(). Открыт для других функций в других библиотеках, если есть лучшая альтернатива, о которой я не знаю.