Предыстория. Когда мы проверяем значимость категориальной переменной, закодированной как фиктивные переменные, нам необходимо одновременно проверить, что все фиктивные переменные равны 0. Например, если X принимает для значений 0, 1, 2, 3 и 4 я бы подогнал фиктивные переменные для уровней 1-4 (при условии, что я хочу, чтобы 0 был базовым уровнем), а затем хочу одновременно проверить B1 = B2 = B3 = B4 = 0.
Если это единственная переменная в моем наборе данных, я могу использовать общую F-статистику для достижения этого. Однако, если у меня есть другие ковариаты, общий F-критерий не работает.
В Stata, например, это (очень, очень) просто выполняется командой testparm
как: testparm i.x
(после подбора желаемой модели регрессии), где префикс i.
сообщает, что Stata X является категориальными данными рассматриваться как фиктивные переменные.
Вопрос/проблема: мне интересно, как я могу сделать это в SAS с оператором CONTRAST
(или ESTIMATE
?) при подгонке регрессионной модели с помощью PROC GLM.
, так как я прошерстил Интернет и не нашел, что Я ищу, я предполагаю, что упускаю что-то очень очевидное. Однако все примеры, которые я видел, относятся НЕ к категориальным (class
) переменным, а скорее к двум отдельным (скажем, непрерывным) переменным. Противоположное утверждение в этом случае будет просто чем-то вроде
CONTRAST 'Contrast1' y 1 z 1;
В противном случае они предназначены для расчета гипотез типа H_0: B1-B2=0.
Я чувствую, что мне нужно разбить гипотезы на более мелкие части и определить тот набор, который определяет все отношения, но я делаю это неправильно. Например, для B1=B2=B3=B4=0 я подумал, что могу сказать B1=B2=B3=-B4, а затем определить (1) B1=-B4, (2) B2=-B4 и (3) B2. =В3. Я пытался закодировать это как оператор CONTRAST
как (скажем, X находится в порядке убывания в наборе данных: 4-0):
CONTRAST 'Contrast' x -1 0 0 1 0
x -1 0 1 0 0
x 0 1 1 0 0;
Я знаю, что это неправильно, и я пробовал много-много вариантов и любую случайную логику, которую мог придумать. Моя проблема в том, что у меня относительно начальные знания о CONTRAST
(и, к сожалению, я не нашел отличной документации, которая помогла бы с этим), а также о том, как на самом деле должна быть сформулирована эта проверка гипотезы для оценки (пытаюсь ли я разделить ее на штук, как я сделал выше, или...?).