Интерпретация результата «cutree» из hclust/heatmap.2

У меня есть следующий код, который выполняет иерархическую кластеризацию и отображает их на тепловой карте.

set.seed(538)
# generate data
y <- matrix(rnorm(50), 10, 5, dimnames=list(paste("g", 1:10, sep=""),
paste("t", 1:5, sep="")))
# the actual data is much larger that the above

# perform hiearchical clustering and plot heatmap
test <- heatmap.2(y)

Что я хочу сделать, так это распечатать элемент кластера из каждой иерархии на графике. Я не уверен, что это хороший способ сделать это.

Я пробовал это:

cutree(as.hclust(test$rowDendrogram), 1:dim(y)[1])

Но возникли проблемы с интерпретацией результата. Что означает каждое значение в матрице? Например g9-9=8 . Что здесь означает 8?

    1 2 3 4 5 6 7 8 9 10
g1  1 1 1 1 1 1 1 1 1  1
g2  1 2 2 2 2 2 2 2 2  2
g3  1 2 2 3 3 3 3 3 3  3
g4  1 2 2 2 2 2 2 2 2  4
g5  1 1 1 1 1 1 1 4 4  5
g6  1 2 3 4 4 4 4 5 5  6
g7  1 2 2 2 2 5 5 6 6  7
g8  1 2 3 4 5 6 6 7 7  8
g9  1 2 3 4 4 4 7 8 8  9
g10 1 2 3 4 5 6 6 7 9 10

Ваш экспертный совет будет принят с благодарностью.


person neversaint    schedule 22.08.2013    source источник


Ответы (1)


Столбец j сообщает вам, как ваши g должны быть сгруппированы, если вы хотите ровно j групп.

Столбцы 1 и 10 не очень полезны, но, возможно, столбец 2 является хорошим примером. Это говорит вам, что если бы вы хотели ровно две группы, то они были бы:

group1: {g1, g5}
group2: {g2, g3, g4, g6, g7, g8, g9, g10}
person flodel    schedule 22.08.2013