Variables Ordinales

Ahora vamos a hablar de modelos para variables dependientes ordinales. Las variables ordinales tienen varias categorías como respuestas y dichas categorías pueden ser ordenadas de menor a mayor. Más allá del ranking (orden) los valores numéricos no tienen ningún otro significado.

Ejemplo

Como ejemplo de una variable dependiente ordinal, vamos a usar de nuevo datos del CSES, esta vez del estudio de Singh (2014b) que estudia los determinantes de satisfacción con democracia. Nuestra base de datos tiene 66,908 respuestas obtenidas de 62 elecciones.

La variables que nos interesan son las siguientes:

El archivo está en formato de Stata, así que cargamos los datos de la forma siguiente:

library(foreign)
singh2 <- read.dta("/Users/sergiobejar/Downloads/SinghEJPR.dta", convert.factors = FALSE)

En este ejemplo queremos modelar el nivel de satisfacción con la democracia de los individuos (satisfaction). Esta variable toma los valores 1, 2, 3 y 4. Un valor más alto nos indica que hay una mayor satisfacción con la democracia, pero no nos dice que tanta más satisfacción hay porque los números no tienen otro significado más que ordenar los niveles de satisfacción.

Estimación del Modelo

Para modelos de regresión ordinales tenemos que utilizar la función polr (proportional odds logistic regression), que es parte del paquete MASS. Casi todas las versiones de R instalan automaticamente el paquete MASS, pero de cualquier forma tenemos que llamarlo antes de estimar la regresión.

library(MASS)
singh2$satisfaction <- ordered(as.factor(singh2$satisfaction)) ## Recodificamos VD como factor
modelo_ol <- polr(satisfaction ~ voted_ideo + winner + voted_ideo*winner + abstained + educ + efficacy +
                    majoritarian_prez + freedom + gdppercapPPP + gdpgrowth + CPI + prez,
                    method = "logistic", data = singh2) ## estima modelo ordered logit 
summary(modelo_ol) ## reporta objeto con los resultados de regresión
## 
## Re-fitting to get Hessian
## Call:
## polr(formula = satisfaction ~ voted_ideo + winner + voted_ideo * 
##     winner + abstained + educ + efficacy + majoritarian_prez + 
##     freedom + gdppercapPPP + gdpgrowth + CPI + prez, data = singh2, 
##     method = "logistic")
## 
## Coefficients:
##                      Value Std. Error  t value
## voted_ideo        -0.02170   0.023596  -0.9198
## winner             0.21813   0.020638  10.5694
## abstained         -0.25425   0.020868 -12.1838
## educ               0.08238   0.020180   4.0824
## efficacy           0.16246   0.006211  26.1569
## majoritarian_prez  0.05705   0.018049   3.1609
## freedom            0.04770   0.014087   3.3863
## gdppercapPPP       0.01975   0.001385  14.2578
## gdpgrowth          0.06653   0.003188  20.8673
## CPI               -0.23153   0.005810 -39.8537
## prez              -0.11503   0.026185  -4.3930
## voted_ideo:winner  0.19004   0.037294   5.0957
## 
## Intercepts:
##     Value    Std. Error t value 
## 1|2  -2.0501   0.0584   -35.1284
## 2|3  -0.0588   0.0575    -1.0228
## 3|4   2.7315   0.0586    46.6423
## 
## Residual Deviance: 146397.33 
## AIC: 146427.33

Interpretación de los Coeficientes

Los odds ratios (razones de momios) y el cambio porcentual en los momios (odds) lo podemos obtener de la siguiente forma:

exp(-modelo_ol$coefficients) ## odds ratio
##        voted_ideo            winner         abstained              educ 
##         1.0219419         0.8040234         1.2894914         0.9209200 
##          efficacy majoritarian_prez           freedom      gdppercapPPP 
##         0.8500534         0.9445465         0.9534169         0.9804453 
##         gdpgrowth               CPI              prez voted_ideo:winner 
##         0.9356304         1.2605318         1.1219077         0.8269262
100*(exp(-modelo_ol$coefficients) - 1) ## cambio % en odds 
##        voted_ideo            winner         abstained              educ 
##          2.194186        -19.597657         28.949139         -7.908003 
##          efficacy majoritarian_prez           freedom      gdppercapPPP 
##        -14.994659         -5.545347         -4.658313         -1.955471 
##         gdpgrowth               CPI              prez voted_ideo:winner 
##         -6.436961         26.053177         12.190773        -17.307376

Si queremos interpretar el efecto de efficacy podemos decir que por un punto de incremento en la escala de dicha variable, los momios (odds) de que un individuo reporte que esta “nada satisfecho” con la democracia relativo to cualquiera de las otras tres categorías disminuye un 15%, ceteris paribus. Los momios (odds) de que una persona indique que esta “nada satisfecha” o “no muy satisfecha” con la democracia respecto a las dos categorias más altas disminuye 15%, manteniendo todas las otras variables constantes. En general el odds ratio nos dice la probabilidad de estar debajo de un cierto treshold relativo a las opciones encima de ese treshold.