Я использую R для статистического анализа временных рядов. Я пробовал гуглить, но не могу найти окончательных ответов. Может ли кто-нибудь, кто знает больше, указать мне правильное направление?
Пример:
Допустим, я хочу сделать линейную регрессию двух временных рядов. Временные ряды содержат ежедневные данные, но здесь и там могут быть пробелы, поэтому временные ряды не являются регулярными. Естественно, я хочу сравнивать только точки данных, где оба временных ряда имеют данные. Это то, что я делаю в настоящее время, чтобы читать файлы csv во фрейм данных:
library(zoo)
apples <- read.csv('/Data/apples.csv', as.is=TRUE)
oranges <- read.csv('/Data/oranges.csv', as.is=TRUE)
apples$date <- as.Date(apples$date, "%d/%m/%Y")
oranges$date <- as.Date(oranges$date, "%d/%m/%Y")
zapples <- zoo(apples$close,apples$date)
zoranges <- zoo(oranges$close,oranges$date)
zdata <- merge(zapples, zoranges, all=FALSE)
data <- as.data.frame(zdata)
Есть ли более тонкий способ сделать это?
Кроме того, как я могу разделить данные, например, выбрать записи в data
с датами в течение определенного периода?