Я пытаюсь использовать Mlogit
в R, I ' m немного новичок в logits, и у меня проблемы с настройкой моей проблемы в среде Mlogit. На самом деле я не полностью уверен, что mlogit - это правильный подход. Вот аналогичная проблема.
Рассмотрим набор данных о бейсболе с переменной результата, которая принимает "out" "single" "double", "triple" и "homerun". В качестве независимых переменных у нас есть название отбивающего, имя питчера и стадион. Существуют сотни наблюдений для каждого жидкого теста, в том числе многие, когда тесто обращено к одному и тому же кувшину.
Я решил, что это определенно полиномиальный логит, потому что у меня есть несколько категориальных результатов, но я не уверен, потому что вся документация, кажется, имеет дело с «выбором» между альтернативами, что на самом деле не так. Я попытался начать свою логит-модель с одной факторной переменной для нападающего, еще одной для питчера и еще одной для стадиона. Когда я попробовал это в R, я получил
Error in row.names<-.data.frame(*tmp*, value = value) : invalid 'row.names' length
С некоторым поиском в Google я думаю, может быть, ожидается только одно наблюдение для каждой комбинации нападающего, питчера и парка? Может быть нет? Что я делаю неправильно? Как мне это настроить?
Изменить: пример данных здесь
https://docs.google.com/spreadsheets/d/19fiq_QEMj4nAPcTqIRxeaYNPgqeHxKAEuPrfHMeIJ7o/edit?usp=sharing