Разделение частей дендрограммы в scipy.cluster.hierarchy

У меня есть дендрограмма с 900 листами (элементами). Я построил полную дендрограмму, которая дает мне общее представление о кластеризации этих элементов. Однако из-за большого количества листьев рассмотреть детали не представляется возможным. Поэтому я хотел бы разделить дендрограмму на определенном уровне расстояния и создать отдельные графики для каждой суб-дендрограммы, чтобы листья и метки листьев стали читаемыми.

Я искал способ сделать это, но нашел настройки только для полной дендрограммы.

Моя идея заключалась в том, чтобы использовать fcluster, чтобы найти, какие листья соответствуют какому кластеру, а затем повторить связывание только с этими листьями. Однако это кажется излишним для функции, которая должна быть очень простой с точки зрения пользователя. Знаете ли вы какие-либо способы сделать это с помощью одной или очень нескольких строк?

Я использую linkage и dendrogram из scipy.cluster.hierarchy и ввожу матрицу расстояний (вместо точек данных), которая была преобразована с помощью squareform из scipy.spatial.distance


person Giampiero Salvi    schedule 24.04.2021    source источник
comment
Отвечает ли этот вопрос на ваш вопрос stackoverflow.com/questions/16883412/?   -  person Max Pierini    schedule 26.04.2021