Я работаю в R с переменной ответа, которая представляет собой буквенную оценку, полученную студентом за определенный курс. Ответ порядковый и, на мой взгляд, логически соразмерный. Насколько я понимаю, мне нужно проверить его пропорциональность, прежде чем я смогу использовать polr () вместо multinom ().
Для одного из своих курсов данных я «проверил» пропорциональность следующим образом:
M1 <- logLik(polrModel) #'log Lik.' -1748.180691 (df=8)
M2 <- logLik(multinomModel) #'log Lik.' -1734.775727 (df=20)
G <- -2*(M1$1 - M2$2)) #I used a block bracket here in the real code
# 26.8099283
pchisq(G,12,lower.tail = FALSE) #DF is #of predictors
#0.008228890393 #THIS P-VAL TELLS ME TO REJECT PROPORTIONAL
Для второго способа проверки предположения о пропорциональных шансах я также запустил две модели vglm, одну с family=cumulative(parallel =TRUE)
, другую с family=cumulative(parallel =FALSE)
. Затем я провел pchisq()
тест с разницей в отклонениях моделей и разницей остаточных степеней свободы.
Это прилично? Если нет, мне бы очень хотелось помочь с фактическим кодированием, чтобы определить, принимать или отклонять предположение о пропорциональных шансах!
В дополнение к двум вышеупомянутым тестам я построил график своих кумулятивных вероятностей для каждого из предикторов индивидуально. Я читал, что хочу, чтобы эти линии были параллельны. Чего я не понимаю, так это то, что с polr()
ваш результат представляет собой единый наклон для каждой независимой переменной (коэффициент), а затем конкретный перехват в зависимости от того, с какой совокупной вероятностью вы работаете (например: P (Y ‹= A), P (Y ‹= B) и т. Д.). Итак, если ваши коэффициенты наклона одинаковы для каждого из уравнений, как могут линии не быть параллельными?
Я подобрал основы своих знаний на уроке Криса Билдера на YouTube; он говорит о параллельных графах здесь, на 42-й минуте.
Любая помощь приветствуется! Спасибо!