Ahora vamos a hablar de modelos para variables dependientes ordinales. Las variables ordinales tienen varias categorías como respuestas y dichas categorías pueden ser ordenadas de menor a mayor. Más allá del ranking (orden) los valores numéricos no tienen ningún otro significado.
Como ejemplo de una variable dependiente ordinal, vamos a usar de nuevo datos del CSES, esta vez del estudio de Singh (2014b) que estudia los determinantes de satisfacción con democracia. Nuestra base de datos tiene 66,908 respuestas obtenidas de 62 elecciones.
La variables que nos interesan son las siguientes:
El archivo está en formato de Stata, así que cargamos los datos de la forma siguiente:
library(foreign)
singh2 <- read.dta("/Users/sergiobejar/Downloads/SinghEJPR.dta", convert.factors = FALSE)
En este ejemplo queremos modelar el nivel de satisfacción con la democracia de los individuos (satisfaction). Esta variable toma los valores 1, 2, 3 y 4. Un valor más alto nos indica que hay una mayor satisfacción con la democracia, pero no nos dice que tanta más satisfacción hay porque los números no tienen otro significado más que ordenar los niveles de satisfacción.
Para modelos de regresión ordinales tenemos que utilizar la función
polr (proportional odds logistic regression), que es parte
del paquete MASS. Casi todas las versiones de
R instalan automaticamente el paquete MASS,
pero de cualquier forma tenemos que llamarlo antes de estimar la
regresión.
library(MASS)
singh2$satisfaction <- ordered(as.factor(singh2$satisfaction)) ## Recodificamos VD como factor
modelo_ol <- polr(satisfaction ~ voted_ideo + winner + voted_ideo*winner + abstained + educ + efficacy +
majoritarian_prez + freedom + gdppercapPPP + gdpgrowth + CPI + prez,
method = "logistic", data = singh2) ## estima modelo ordered logit
summary(modelo_ol) ## reporta objeto con los resultados de regresión
##
## Re-fitting to get Hessian
## Call:
## polr(formula = satisfaction ~ voted_ideo + winner + voted_ideo *
## winner + abstained + educ + efficacy + majoritarian_prez +
## freedom + gdppercapPPP + gdpgrowth + CPI + prez, data = singh2,
## method = "logistic")
##
## Coefficients:
## Value Std. Error t value
## voted_ideo -0.02170 0.023596 -0.9198
## winner 0.21813 0.020638 10.5694
## abstained -0.25425 0.020868 -12.1838
## educ 0.08238 0.020180 4.0824
## efficacy 0.16246 0.006211 26.1569
## majoritarian_prez 0.05705 0.018049 3.1609
## freedom 0.04770 0.014087 3.3863
## gdppercapPPP 0.01975 0.001385 14.2578
## gdpgrowth 0.06653 0.003188 20.8673
## CPI -0.23153 0.005810 -39.8537
## prez -0.11503 0.026185 -4.3930
## voted_ideo:winner 0.19004 0.037294 5.0957
##
## Intercepts:
## Value Std. Error t value
## 1|2 -2.0501 0.0584 -35.1284
## 2|3 -0.0588 0.0575 -1.0228
## 3|4 2.7315 0.0586 46.6423
##
## Residual Deviance: 146397.33
## AIC: 146427.33
Los odds ratios (razones de momios) y el cambio porcentual en los momios (odds) lo podemos obtener de la siguiente forma:
exp(-modelo_ol$coefficients) ## odds ratio
## voted_ideo winner abstained educ
## 1.0219419 0.8040234 1.2894914 0.9209200
## efficacy majoritarian_prez freedom gdppercapPPP
## 0.8500534 0.9445465 0.9534169 0.9804453
## gdpgrowth CPI prez voted_ideo:winner
## 0.9356304 1.2605318 1.1219077 0.8269262
100*(exp(-modelo_ol$coefficients) - 1) ## cambio % en odds
## voted_ideo winner abstained educ
## 2.194186 -19.597657 28.949139 -7.908003
## efficacy majoritarian_prez freedom gdppercapPPP
## -14.994659 -5.545347 -4.658313 -1.955471
## gdpgrowth CPI prez voted_ideo:winner
## -6.436961 26.053177 12.190773 -17.307376
Si queremos interpretar el efecto de efficacy podemos
decir que por un punto de incremento en la escala de dicha variable, los
momios (odds) de que un individuo reporte que esta “nada satisfecho” con
la democracia relativo to cualquiera de las otras tres categorías
disminuye un 15%, ceteris paribus. Los momios (odds) de que una
persona indique que esta “nada satisfecha” o “no muy satisfecha” con la
democracia respecto a las dos categorias más altas disminuye 15%,
manteniendo todas las otras variables constantes. En general el odds
ratio nos dice la probabilidad de estar debajo de un cierto treshold
relativo a las opciones encima de ese treshold.