У меня есть некоторые данные (температура для разных уровней заряда батареи) для пользователей мобильного приложения. Я хотел бы построить данные для каждого пользователя (все на однолинейном графике), а также медиану temp
для аналогичных percentage
для всех пользователей (на том же графике, выделив его более толстой линией). Я могу построить все линии, кроме медианы, используя ggplot2. Вот мой фиктивный файл данных (я могу изменить организацию/структуру данных или сгруппировать свои данные, если мне нужно):
userId, percentage, temp
11, 2, 32
11, 3, 32
11, 4, 33
11, 5, 33
11, 7, 34
11, 10, 30
12, 2, 30
12, 3, 30
12, 4, 30
12, 5, 30
12, 7, 34
12, 10, 32
Вот как я это делаю на данный момент:
library(ggplot2)
sampleDataFrame <- read.table(file.choose(), sep=",", header=T)
sampleDataFrame$userId <- factor(sampleDataFrame$userId)
p1 <- ggplot(sampleDataFrame, aes(x=percentage, y=temp, colour=userId)) + geom_line()
print(p1)
Вот результат:
+ geom_hline(yintercept = mean(sampleDataFrame$temp), size=2)
или+ geom_hline(yintercept = aggregate(temp~userId, sampleDataFrame, mean)$temp, size=2)
? - person lukeA   schedule 10.01.2016temp
). - person Javad   schedule 10.01.2016median
) вычислить медиану вместо среднего? - person Javad   schedule 10.01.2016mean
наmedian
. - person lukeA   schedule 10.01.2016