В рамках проекта прогнозирования спроса я хотел бы определить лучший способ группировки временных рядов, которые имеют сходство друг с другом, чтобы я мог применить алгоритм прогнозирования сверху вниз. На данный момент мой ключевой вопрос заключается в том, чтобы определить, какие группы являются подходящими и какова соответствующая иерархия этих групп. Почитав немного, я считаю, что Dynamic Time Warping может помочь. Чтобы проверить это, я создал небольшой тестовый пример, но столкнулся с одной проблемой: как я могу извлечь иерархию, например, из текстового дерева или чего-то подобного. Я надеюсь, что, возможно, кто-то из вас сможет помочь мне в дальнейшем.
Я создал следующий случай, чтобы продемонстрировать, к чему я пришел.
sc2 <- read.table("http://dl.dropbox.com/u/9641130/R/hclust.data", header=F, sep="")
SampleLabels <- c("ID1", "ID2", "ID3", "ID4", "ID5", "ID6", "ID7", "ID8", "ID9", "ID10", "ID11", "ID12", "ID13", "ID14", "ID15")
distMatrix2 <- dist(sc2, method="DTW")
hc2 <- hclust(distMatrix2, method="average")
# show the visual tree
plot(hc2, labels=SampleLabels)
Каким-то образом я хотел бы получить имена и элементы кластеров в виде текста, чтобы я мог продолжать работать с ним. У кого-нибудь есть идея?
Спасибо!
numgroups
)? Затем получите группы с чем-то вроде:groups = cutree(hc2,k=numgroups)
. Это дает групповые задания. Не уверен, что еще вы хотели бы. - person Seth   schedule 21.06.2012