У меня есть продольный набор данных с двумя группами диагнозов, которые я хочу визуально сравнить. У каждого субъекта есть одна, две или три точки данных и ряд зависимых переменных.
Вот образец данных:
dput(sample)
Я хочу визуализировать каждую зависимую переменную (по оси Y) с возрастом (по оси X), используя траекторию / наиболее подходящую кривую среднего роста, а также график спагетти, поэтому он будет выглядеть примерно так:
наиболее подходящая кривая среднего роста и график спагетти
Вот что у меня есть на данный момент:
Код R:
Результат: продольный график спагетти
library(lattice)
xyplot(vol ~ age, groups = id, type= "b", data= data,
ylab = "Volume (mm cubed)",
xlab = "Age (years)",
main = "Volume",
scales = list (x = list(at = c(4, 6, 8, 10, 12, 14, 16, 18, 20))))
Как видно из выходного рисунка, сюжет сгруппирован по теме (id). Я хочу сохранить линии, соединяющие каждый момент времени для каждого субъекта, но сгруппированные по диагнозу, как показано на первом графике. Также не знаете, как создать (и наложить) наиболее подходящую кривую среднего роста на графике спагетти.
Наконец, после подбора модели для каждой группы, какая команда в R лучше всего подходит для получения сводной статистики (например, t-тест и f-тест для p-значений)?
Использование
dput(sample)
: