Я сгруппировал свои данные (75000, 3), используя алгоритм sklearn Gaussian Mix Model (GMM). У меня 4 кластера. Каждая точка моих данных представляет молекулярную структуру. Теперь я хотел бы получить наиболее репрезентативную молекулярную структуру каждого кластера, который, как я понимаю, является центром тяжести кластера. До сих пор я пытался найти точку (структуру), которая находится прямо в центре кластера, используя атрибут gmm.means_, однако эта точная точка не соответствует какой-либо структуре (я использовал numpy.where). Мне нужно было бы получить координаты ближайшей структуры к центроиду, но я не нашел функцию для этого в документации модуля (http://scikit-learn.org/stable/modules/generated/sklearn.mixture.GaussianMixture.html). Как я могу получить репрезентативную структуру каждого кластера?
Большое спасибо за вашу помощь, любое предложение будет оценено.
((Поскольку это общий вопрос, я не считаю необходимым добавлять код, используемый для кластеризации, или какие-либо данные, сообщите мне, если это необходимо))