Ожидает ли mlogit от statsmodel широкий формат?

Анализ дискретного выбора с помощью Python. Как правило, существует два формата представления данных регрессии:

  1. длинный формат
  2. широкий формат

В длинном формате есть строка для каждого потенциального варианта, а также столбец Y со значением 0 или 1 в зависимости от выбора. Широкий формат имеет только одну строку на человека (респондента опроса), и Y охватывает все выбранные функции, а X охватывает все альтернативы продукта.

Пример длинный

person answer   Y ~ x1     x2    
1      1        0   green  large 
1      1        1   red    large
1      2        1   green  small
...

Пример широкий

y1     y2     ~ x11     x12    x21     x22    
green  large    green  large   red    large
green  small    green  small   red    small
...
  1. Правильно ли мое описание?
  2. использует ли statsmodel mlogit описанный здесь широкий формат?

person Roland Kofler    schedule 10.02.2016    source источник
comment
Он не использует ни того, ни другого. Я думаю, что примеры не поддерживаются. См. мой ответ по адресу stackoverflow.com/questions/34548375/   -  person Josef    schedule 10.02.2016
comment
вы пишете: параметры различаются в зависимости от выбора, но не объясняющие переменные, что такое параметры? означает ли это, что функция mlogit не поддерживает мой вариант использования на основе выбора? (Боже, как все сложно.)   -  person Roland Kofler    schedule 10.02.2016