R: как оценить модель фиксированных эффектов с весами

Я хотел бы запустить модель фиксированных эффектов с использованием OLS с взвешенными данными.

Поскольку здесь может возникнуть некоторая путаница, я хочу сказать, что я использовал здесь «фиксированные эффекты» в том смысле, который обычно подразумевают экономисты, то есть «в рамках модели» или, другими словами, индивидуально-специфические эффекты. На самом деле у меня есть «многоуровневые» данные, то есть наблюдения за людьми, и я хотел бы контролировать их регион происхождения (и иметь соответствующие кластерные стандартные ошибки).

Образец данных:

library(multilevel)
data(bhr2000)
weight <- runif(length(bhr2000$GRP),min=1,max=10)
bhr2000 <- data.frame(bhr2000,weight)
head(bhr2000)
  GRP AF06 AF07 AP12 AP17 AP33 AP34 AS14 AS15 AS16 AS17 AS28 HRS RELIG   weight
1   1    2    2    2    4    3    3    3    3    5    5    3  12     2 6.647987
2   1    3    3    3    1    4    3    3    4    3    3    3  11     1 6.851675
3   1    4    4    4    4    3    4    4    4    2    3    4  12     3 8.202567
4   1    3    4    4    4    3    3    3    3    3    3    4   9     3 1.872407
5   1    3    4    4    4    4    4    3    4    2    4    4   9     3 4.526455
6   1    3    3    3    3    4    4    3    3    3    3    4   8     1 8.236978

Я хотел бы оценить следующие модели:

AF06_ij = beta_0 + beta_1 AP34_ij + alpha_1 * (GRP == 1) + alpha_2 * (GRP==2) +... + e_ij

где я обращаюсь к конкретным лицам, а j - к группе, к которой они принадлежат.

Более того, я хотел бы, чтобы наблюдения взвешивались по weight (весам выборки).

Однако я хотел бы получить «кластерные стандартные ошибки», чтобы отразить возможную гетероскедастичность GRP. Другими словами, E(e_ij)=0, но Var(e_ij)=sigma_j^2, где sigma_j может быть разным для каждого GRP j.

Если я правильно понял, nlme и lme4 могут оценивать только модели со случайными эффектами (или так называемые смешанные модели), но не модели с фиксированными эффектами в смысле внутри.

Я попробовал пакет plm, который выглядел идеально для того, что я хотел сделать, но не допускает весов. Есть еще идеи?


person Peutch    schedule 12.10.2014    source источник
comment
Вопросы без данных, без конкретного описания проблемы и с запросом рекомендаций для альтернативного пакета и рабочего примера на самом деле слишком расплывчаты, как слишком расплывчатые, по крайней мере, для SO. Вам следует получить общий совет по статистике в одном из мест, где возникают такие вопросы.   -  person IRTFM    schedule 12.10.2014
comment
Ты прав. Я изменил свой вопрос, чтобы было понятнее, что я хочу сделать. Спасибо!   -  person Peutch    schedule 13.10.2014
comment
Вот несколько интересных статей о фиксированных / случайных эффектах. andrewgelman.com/2005/01/25/why_i_dont_use   -  person miles2know    schedule 18.10.2014
comment
Спасибо, поэтому я использовал кавычки вокруг выражения, это чертовски запутанно! Я также отредактировал свой вопрос, чтобы указать конкретную эконометрическую модель, которую я пытаюсь оценить, чтобы она была более ясной ...   -  person Peutch    schedule 18.10.2014


Ответы (2)


Я думаю, что это скорее вопрос обмена стеком, но помимо фиксированных эффектов с весами модели; вы не должны использовать OLS для упорядоченной категориальной переменной ответа. Это тип анализа упорядоченного логистического моделирования. Итак, ниже я использую предоставленные вами данные, чтобы соответствовать одному из них.

Для ясности у нас есть упорядоченный категориальный ответ «AF06» и два предиктора. Первая «AP34» также является упорядоченной категориальной переменной; второй "GRP" - ваш фиксированный эффект. Так что, как правило, вы можете создать групповой фиксированный эффект путем принуждения рассматриваемой переменной к коэффициенту на правой стороне ... (Я действительно стараюсь держаться подальше от статистической теории, потому что это не место для этого. Так что я мог бы быть неточно в некоторых вещах, которые я говорю)

Приведенный ниже код соответствует упорядоченной логистической модели с использованием функции polr (логистическая регрессия пропорциональных шансов). Я попытался интерпретировать то, что вы хотели, с точки зрения спецификации модели, но, в конце концов, OLS - это неправильный путь вперед. Вызов coefplot будет иметь очень перегруженную ось Y, я просто хотел представить очень элементарное начало того, как вы могли бы это интерпретировать. Я бы наверняка постарался визуализировать это более тонко. И вернемся к интерпретации ... Вам нужно будет над этим поработать, но я думаю, что в целом это правильный метод. Лучший ресурс, о котором я могу думать, - это главы 5 и 6 книги Гельмана и Хилла «Анализ данных с использованием регрессии и многоуровневых / иерархических моделей». Это такой хороший ресурс, поэтому я действительно рекомендую вам прочитать его целиком и попытаться освоить его, если вы заинтересованы в таком типе анализа в будущем.


    library(multilevel) # To get the data
    library(MASS) # To get the polr modeling function
    library(arm) # To get the tools, insight and expertise of Andrew Gelman and his team

    # The data
    weight <- runif(length(bhr2000$GRP),min=1,max=10)
    bhr2000 <- data.frame(bhr2000,weight)
    head(bhr2000)

    # The model
    m <- polr(factor(AF06) ~ AP34 + factor(GRP),weights = weight, data = bhr2000, Hess=TRUE,  method = "logistic")
    summary(m)
    coefplot(m,cex.var=.6) # from the arm package
person miles2know    schedule 19.10.2014

Ознакомьтесь с пакетом lfe - он выполняет фиксированные эффекты в стиле экон, и вы можете указать кластеризацию.

person John Horton    schedule 12.10.2014
comment
Спасибо, Джон, но я не смог найти способ указать веса выборки с помощью lfe. Я что-то пропустил? - person Peutch; 12.10.2014