У меня есть дендрограмма с 900 листами (элементами). Я построил полную дендрограмму, которая дает мне общее представление о кластеризации этих элементов. Однако из-за большого количества листьев рассмотреть детали не представляется возможным. Поэтому я хотел бы разделить дендрограмму на определенном уровне расстояния и создать отдельные графики для каждой суб-дендрограммы, чтобы листья и метки листьев стали читаемыми.
Я искал способ сделать это, но нашел настройки только для полной дендрограммы.
Моя идея заключалась в том, чтобы использовать fcluster
, чтобы найти, какие листья соответствуют какому кластеру, а затем повторить связывание только с этими листьями. Однако это кажется излишним для функции, которая должна быть очень простой с точки зрения пользователя. Знаете ли вы какие-либо способы сделать это с помощью одной или очень нескольких строк?
Я использую linkage
и dendrogram
из scipy.cluster.hierarchy
и ввожу матрицу расстояний (вместо точек данных), которая была преобразована с помощью squareform
из scipy.spatial.distance