Este documento se compone de un ejemplo de aplicación de la regresión binomial en R. El articulo del cual se ha tomado, se puede encontrar en el siguiente enlace: https://link.springer.com/article/10.1007/s12517-020-05451-2.
Modelar el cambio de uso del suelo utilizando regresión logística y regresión logística multinomial de la provincia de Krabi, Tailandia, en 2000, 2009 y 2018 y evidenciar las limitaciones de cada uno de los modelos.
Se aplicaron los modelos de regresión logística y regresión logística multinomial a los datos de una encuesta sobre el uso de la tierra en la provincia de Krabi, Tailandia, en 2000, 2009 y 2018.
Para ello, se siguieron los siguientes pasos:
Las observaciones del uso de la tierra se clasificaron en cuatro, a saber, tierras desarrolladas (DE), plantaciones de caucho (PC), agrícolas (AG) y no desarrolladas (UN).
| Tipo uso de suelo | Descripciones |
|---|---|
| DE | Tierras urbanas, comerciales, de aldeas, de trasporte, de servicios |
| AG | Huertas, pastizales, granjas y tierras de agricultura. |
| PC | Para caucho. |
| UN | Tierras forestales, cuerpos de agua y tierras misceláneas. |
Los datos se basan en una conversión de lo analógico a lo digital que reemplaza formas poligonales por puntos de cuadrícula codificados.
La modelización del cambio de uso de la tierra a lo largo del tiempo brinda información útil relacionada con el desarrollo de la tierra. Podría decirse que la regresión logística es una de las más utilizadas en el estudio del uso de la tierra cuando se trata de una variable de resultado binaria.
Es importante resaltar que extensos estudios sobre el uso de la tierra en los campos de sistemas de información geográfica (SIG) y sensores remotos (Manonmani y Suganya 2010; Thothong et al.2011) se basaron principalmente en software comercial. Podría decirse que pocos autores han empleado métodos estadísticos para modelar el cambio de uso de la tierra.
El modelo de regresión logística es un modelo que se utiliza para predecir la probabilidad de cierta clase dado un conjunto de variables independientes.
\[log(\frac{p}{1-p}) = \beta_{0}+\beta_{1}x\]
donde,
\[p = \frac{1}{1+e^{-(\beta_{0}+\beta_{1})}} \] Nota:
Este modelo se aplica a eventos binarios, es decir, eventos que ocurra una opción o la otra opción. Ejemplo: Tener cierta enfermedad o no tenerla.
En nuestro caso el modelo estima la probabilidad de que un tipo de uso de la tierra en particular aparezca en un píxel específico dado un conjunto de predictores.
El modelo de regresión logística multinomial generaliza el modelo Rergresión logística para problemas multiclase, es decir, con más de dos posibles resultados discretos.
Nota: * La regresión logística multinoial (RLM) se usa cuando las variables dependientes del estudio tienen tres o más categorías.
El resultado de los modelos LR y MNL fue similar en todos los tipos de uso del suelo.
Los hallazgos muestran que las tierras desarrolladas y agrícolas aumentaron en dos períodos de estudio, 2000-2009 y 2009-2018. Mientras que la plantación de caucho disminuyó en dos periodos observados.
El hallazgo reveló un aumento en DE y AG; sin embargo, se observó una disminución de PC. Las áreas urbanas ubicadas y más cercanas a las zonas urbanas prevalecientes tenían más probabilidades de DE, mientras que la reducción de PC debido al cambio a AG podría deberse al precio más bajo del caucho natural.
Los resultados mostraron que la modelación del uso del suelo en 2009 y 2018 con regresión logística y regresión logística multinomial no difiere por el área bajo las curvas y la precisión de la predicción. Por lo tanto, la regresión logística se puede utilizar para modelar el cambio de uso de la tierra usando el uso de la tierra en el año anterior como predictores en lugar de la regresión logística multinomial.