Я хотел бы создать диаграмму рассеяния в ggplot2, которая отображает мужские test_scores по оси x и женские test_scores по оси Y, используя набор данных ниже. Я могу легко создать график geom_line, разделив мужчин и женщин и поместив дату («dts») на ось x.
library(tidyverse)
#create data
dts <- c("2011-01-02","2011-01-02","2011-01-03","2011-01-04","2011-01-05",
"2011-01-02","2011-01-02","2011-01-03","2011-01-04","2011-01-05")
sex <- c("M","F","M","F","M","F","M","F","M","F")
test <- round(runif(10,.5,1),2)
semester <- data.frame("dts" = as.Date(dts), "sex" = sex, "test_scores" =
test)
#show the geom_line plot
ggplot(semester, aes(x = dts, y = test, color = sex)) + geom_line()
Похоже, что с одним временным рядом ggplot2 лучше справляется с данными в широком формате, чем в длинном. Например, я мог бы легко создать два столбца, «male_scores» и «female_scores», и сопоставить их друг с другом, но я хотел бы, чтобы мои данные были аккуратными и в длинном формате.
Приветствую и спасибо.