Регрессионный кригинг биномиальных данных

Я использую gstat для прогнозирования биномиальных данных, но прогнозируемые значения выше 1 и ниже 0. Кто-нибудь знает, как я могу решить эту проблему? Спасибо.

data(meuse)
data(meuse.grid)
coordinates(meuse) <- ~x+y
coordinates(meuse.grid) <- ~x+y
gridded(meuse.grid) <- TRUE

#glm model
glm.lime <- glm(lime~dist+ffreq, meuse, family=binomial(link="logit"))
summary(glm.lime)

#variogram of residuals
var <- variogram(lime~dist+ffreq, data=meuse)
fit.var <- fit.variogram(var, vgm(nugget=0.9, "Sph", range=sqrt(diff(meuse@bbox\[1,\])^2 + diff(meuse@bbox\[2,\])^2)/4, psill=var(glm.lime$residuals)))   
plot(var, fit.var, plot.nu=T)

#universal kriging
kri <- krige(lime~dist+ffreq, meuse, meuse.grid, fit.var)
spplot(kri[1])

введите здесь описание изображения


person Geo-sp    schedule 02.09.2013    source источник


Ответы (1)


В целом, при таком подходе регрессионного кригинга нет гарантии, что модель будет достоверной, поскольку расчет тренда и остатков разделены. Несколько замечаний по вашему коду. Обратите внимание, что вы используете variogram для расчета остаточной вариограммы, но variogram использует нормальную линейную модель для расчета тренда и, таким образом, также остатков. Вам нужно определить остатки по glm, а затем рассчитать на их основе остаточную вариограмму.

Вы можете сделать это вручную или посмотреть на функцию fit.gstatModel из пакета GSIF. Вы также можете ознакомиться с binom.krige из пакета geoRglm. Эта ветка на R-sig-geo может также быть интересным:

Взятие остатков из GLM несколько отличается от использования индикаторных переменных. Также могут быть даже некоторые различия в зависимости от того, какие остатки GLM вы берете. Запустите GLM и изучите остатки, например. с помощью вариограмм, это то, что я считаю обычной практикой, но она не всегда рассказывает вам всю историю. Подгонка GLGM (обобщенная линейная геостатическая модель) может быть более убедительной, поскольку вы можете сделать выводы о параметрах модели и получить более объективный доступ к релевантности пространственного члена. Это было первоначальным мотивом для geoRglm, выполняющего все моделирование сразу, а не в два этапа, таких как подгонка модели без корреляции, а затем моделирование остатков. Это связано с дополнительным бременем калибровки алгоритмов MCMC. Позже на сцену вышел spBayes, который действительно выглядит многообещающе, предлагая более общую структуру, тогда как geoRglm довольно специфичен для одномерных биномиальных и ядовитых моделей.

Как говорит Роджер, есть возможности поиграть с другими альтернативами, такими как GLMM или, возможно, MCMCpack, но это, конечно, не готово «из коробки», и код необходимо будет адаптировать для пространственных целей.

person Paul Hiemstra    schedule 02.09.2013