Introducción
El objetivo de la presente práctica dirigida es evaluar la validez de constructo de un índice de actitudes políticas multidimensional. Las dimensiones propuestas son: eficacia política interna, eficacia política externa y la confianza política.
El instrumento que contiene la escala de actitudes políticas que ahora se analiza, fue aplicado por el Instituto de Opinión Pública de la PUCP(IOP, 2012) en el marco del estudio Representación Política y Conflictos Sociales.
La data del IOP puede ser consutlada en la siguiente direccción:
http://datos.pucp.edu.pe/dataverse/iop?q=&fq0=productionDate_s%3A%222012%22&types= dataverses%3Adatasets&sort=dateSort&order=desc
Actitudes políticas
La pregunta 4 (A-H) del cuestionario recoge información acerca del nivel de eficacia política del ciudadano. La eficacia política es definida como la percepción del ciudadano sobre la propia capacidad política. La eficacia política presenta dos dimensiones: (1) eficacia política interna o la percepción del ciudadano sobre su propia capacidad para entender los temas políticos, así como el funcionamiento del sistema y (2) eficacia política externa o la percepción del ciudadano sobre la disposición, interés y/ o capacidad de los políticos para responder satisfactoriamente a las demandas de los ciudadanos.
Carga de paquetes
Como la extensión en la que el IOP ha archivado la data del estudio es de SPSS(“.sav”), vamos a necesitar el paquete “foreign” para su importación.
library(foreign)
#library(haven)
Luego importamos el archivo como “data.frame” y le colocamos el nombre “conflictos12”. Si cotejamos con el cuestionario del estudio, podemos ver que las variables de interés van desde la pregutna P4A hasta P4G.
conflictos12<-read.spss("IOP_1112_01_D.sav", to.data.frame=T, use.value.labels = F)
## re-encoding from UTF-8
Inspeccionamos el nombre de las variables (“names”):
names(conflictos12) [1:20]
## [1] "NUM" "SEXO" "EDAD" "P1A" "P1A_OTRO" "P1B"
## [7] "P1B_OTRO" "P2" "P3" "P4A" "P4B" "P4C"
## [13] "P4D" "P4E" "P4F" "P4G" "P5" "P6"
## [19] "P7A" "P7B"
Variables en la base. la eficacia política del ciudadano se evalúa con una escala de respuesta de 4 puntos en donde 1 significa “Muy de acuerdo” y 4 “Muy en desacuero”. La consigna en el encabezado de la escala le solicita al participante responder sobre su grado de acuerdo ( o desacuerdo) con las siguientes afirmaciones:
Preparación de la data
conflictos.s<-conflictos12[names(conflictos12)[c(1,10:16)]]
Recodificación de variables
Recodificamos 9 por “NA”, pero tenemos cuidado de no recodificar el 9 de la columna con el identificador de casos.
NUM <- conflictos.s[, 1]
df <- conflictos.s[, 2:8]
df[df==9] <- NA
df.p4 <- cbind(NUM, df)
1. Análisis preliminar descriptivo
Para organizar mejor los estadísticos descriptivos de las variables de interés, podemos utilizar el paquete “stargazer”. En este caso, dado que el tipo de variable es ordinal, es mejor utilizar la mediana.
library(stargazer)
stargazer(df.p4[-1], type="text", median=T)
##
## ===================================================================
## Statistic N Mean St. Dev. Min Pctl(25) Median Pctl(75) Max
## -------------------------------------------------------------------
## P4A 1,131 2.340 0.719 1.000 2.000 2.000 3.000 4.000
## P4B 1,144 2.066 0.666 1.000 2.000 2.000 2.000 4.000
## P4C 1,142 1.958 0.654 1.000 2.000 2.000 2.000 4.000
## P4D 1,144 1.955 0.658 1.000 2.000 2.000 2.000 4.000
## P4E 1,154 1.731 0.641 1.000 1.000 2.000 2.000 4.000
## P4F 1,148 1.747 0.654 1.000 1.000 2.000 2.000 4.000
## P4G 1,108 2.550 0.814 1.000 2.000 3.000 3.000 4.000
## -------------------------------------------------------------------
Preguntas
¿Los ciudadanos se perciben a si mismo como competentes en temas de políticas?
¿Cómo se percibe a las autoridades?
¿Aqué items pertenecerían a la dimensión de eficacio política interna y cuáles a la dimendión de eficacia política externa?
2. Matriz de correlaciones
## TABLA DE CORRELACIONES
correla1 <- round(cor(df.p4[,-1], use = "complete.obs"),2)
correla1
## P4A P4B P4C P4D P4E P4F P4G
## P4A 1.00 0.23 0.26 0.21 0.12 0.06 0.15
## P4B 0.23 1.00 0.26 0.29 0.23 0.22 0.05
## P4C 0.26 0.26 1.00 0.44 0.36 0.39 0.01
## P4D 0.21 0.29 0.44 1.00 0.36 0.35 0.08
## P4E 0.12 0.23 0.36 0.36 1.00 0.55 0.08
## P4F 0.06 0.22 0.39 0.35 0.55 1.00 0.02
## P4G 0.15 0.05 0.01 0.08 0.08 0.02 1.00
Calcule la matriz de correlaciones para los items de la escala de participación política y responda:
¿Es pertinente realizar un análisis de Componentes Principales?
¿Hay algún item que podría ser retirado de la matriz antes de realizar el análisis de Componentes Principales?
Si retira algún item, justifique su decisión
3. Análisis de componentes principales
Para completar el análisis de Componentes Principales, desarrolle los siguientes puntos:
Cálcule una primera solución que contenga tantos componentes como variables [utilice la función “principal” del paquete “psych”]
Seleccione un número adecuado de Componentes Principales con las reglas del autovalor, varianza acumulada y método gráfico
Calcule una nueva solución que contenga solo el número de componentes seleccionados
- ¿Cuál es el item que se explica mejor en la solución?
- ¿Cuál es el item que peor es explicado por la solución?library(psych)
pca1 <- principal(df.p4[, c(-1, -8)], nfactors = 6, rotate = "none")
pca1
## Principal Components Analysis
## Call: principal(r = df.p4[, c(-1, -8)], nfactors = 6, rotate = "none")
## Standardized loadings (pattern matrix) based upon correlation matrix
## PC1 PC2 PC3 PC4 PC5 PC6 h2 u2 com
## P4A 0.38 0.73 -0.37 0.42 0.09 0.08 1 -1.1e-15 2.8
## P4B 0.51 0.44 0.74 0.00 -0.07 -0.01 1 1.9e-15 2.5
## P4C 0.72 0.10 -0.26 -0.32 -0.54 -0.12 1 3.3e-16 2.8
## P4D 0.72 0.06 -0.12 -0.46 0.51 0.03 1 4.4e-16 2.7
## P4E 0.70 -0.41 0.02 0.37 0.11 -0.44 1 8.9e-16 3.1
## P4F 0.70 -0.46 0.03 0.21 -0.08 0.49 1 7.8e-16 2.9
##
## PC1 PC2 PC3 PC4 PC5 PC6
## SS loadings 2.42 1.12 0.76 0.67 0.58 0.46
## Proportion Var 0.40 0.19 0.13 0.11 0.10 0.08
## Cumulative Var 0.40 0.59 0.72 0.83 0.92 1.00
## Proportion Explained 0.40 0.19 0.13 0.11 0.10 0.08
## Cumulative Proportion 0.40 0.59 0.72 0.83 0.92 1.00
##
## Mean item complexity = 2.8
## Test of the hypothesis that 6 components are sufficient.
##
## The root mean square of the residuals (RMSR) is 0
## with the empirical chi square 0 with prob < NA
##
## Fit based upon off diagonal values = 1
pca2 <- principal(df.p4[, c(-1, -8)], nfactors = 2, rotate = "none")
pca2
## Principal Components Analysis
## Call: principal(r = df.p4[, c(-1, -8)], nfactors = 2, rotate = "none")
## Standardized loadings (pattern matrix) based upon correlation matrix
## PC1 PC2 h2 u2 com
## P4A 0.38 0.73 0.68 0.32 1.5
## P4B 0.51 0.44 0.45 0.55 1.9
## P4C 0.72 0.10 0.52 0.48 1.0
## P4D 0.72 0.06 0.52 0.48 1.0
## P4E 0.70 -0.41 0.66 0.34 1.6
## P4F 0.70 -0.46 0.71 0.29 1.7
##
## PC1 PC2
## SS loadings 2.42 1.12
## Proportion Var 0.40 0.19
## Cumulative Var 0.40 0.59
## Proportion Explained 0.68 0.32
## Cumulative Proportion 0.68 1.00
##
## Mean item complexity = 1.5
## Test of the hypothesis that 2 components are sufficient.
##
## The root mean square of the residuals (RMSR) is 0.13
## with the empirical chi square 603 with prob < 3.5e-129
##
## Fit based upon off diagonal values = 0.81
4. Rotación de componentes
pca3 <- principal(df.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
pca3
## Principal Components Analysis
## Call: principal(r = df.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
## Standardized loadings (pattern matrix) based upon correlation matrix
## RC1 RC2 h2 u2 com
## P4A -0.08 0.82 0.68 0.32 1.0
## P4B 0.19 0.65 0.45 0.55 1.2
## P4C 0.54 0.48 0.52 0.48 2.0
## P4D 0.56 0.45 0.52 0.48 1.9
## P4E 0.81 0.04 0.66 0.34 1.0
## P4F 0.84 0.00 0.71 0.29 1.0
##
## RC1 RC2
## SS loadings 2.02 1.51
## Proportion Var 0.34 0.25
## Cumulative Var 0.34 0.59
## Proportion Explained 0.57 0.43
## Cumulative Proportion 0.57 1.00
##
## Mean item complexity = 1.3
## Test of the hypothesis that 2 components are sufficient.
##
## The root mean square of the residuals (RMSR) is 0.13
## with the empirical chi square 603 with prob < 3.5e-129
##
## Fit based upon off diagonal values = 0.81
Para terminar, realice una rotación de Componentes Principales que le permita interpretar mejor los componentes rotados
¿De qué trata el primer componente?
¿Cuánta varianza explica el segundo componente luego de la rotación?
¿Existe validez de constructo de eficacia política para la propuesta señalada en la introducción?
¿Cómo podría evalaur la validez convergente del índice de eficacia política?
Ejercicio final
Repetir el procedimiento con los items de la pregunta P42 sobre actitudes políticas del estudio de Comunicación Política realizado por el IOP EN EL 2013. Considere los siguientes pasos:
Realice un análisis descriptivos con los items
Realizar un Análsis de Componentes Principales
Seleccionar un número adecuado de componentes
Realizar la rotación e interpretar los componentes
Exportación con etiquetas con “haven”
library(haven)
library(sjlabelled)
dt <- haven::read_sav("IOP_1112_01_D.sav")
dt2 <- dt[c(1,10:16)]
NUM <- dt2[, 1]
variables <- dt2[, 2:8]
variables[variables==9] <- NA
datos.p4 <- cbind(NUM, variables)
pca4 <- principal(datos.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
pca4
## Principal Components Analysis
## Call: principal(r = datos.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
## Standardized loadings (pattern matrix) based upon correlation matrix
## RC1 RC2 h2 u2 com
## P4A -0.08 0.82 0.68 0.32 1.0
## P4B 0.19 0.65 0.45 0.55 1.2
## P4C 0.54 0.48 0.52 0.48 2.0
## P4D 0.56 0.45 0.52 0.48 1.9
## P4E 0.81 0.04 0.66 0.34 1.0
## P4F 0.84 0.00 0.71 0.29 1.0
##
## RC1 RC2
## SS loadings 2.02 1.51
## Proportion Var 0.34 0.25
## Cumulative Var 0.34 0.59
## Proportion Explained 0.57 0.43
## Cumulative Proportion 0.57 1.00
##
## Mean item complexity = 1.3
## Test of the hypothesis that 2 components are sufficient.
##
## The root mean square of the residuals (RMSR) is 0.13
## with the empirical chi square 603 with prob < 3.5e-129
##
## Fit based upon off diagonal values = 0.81
Items <- get_label(dt2[c(-1, -8)])
B <- pca3$loadings[,1:2]
tabla <- data.frame(Items,B)
tabla
## Items
## P4A 4a. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: La política es tan complicada que la gente como yo no puede entender lo que pasa?
## P4B 4b. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: El voto es la única manera que tiene la gente como yo de influir en política?
## P4C 4c. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: Los políticos no se preocupan mucho de lo que piensa la gente como yo?
## P4D 4d. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: La gente como yo tiene muy poca influencia en las decisiones del gobierno?
## P4E 4e. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: La mayoría de los políticos están en política solo por lo que pueden obtener de ella?
## P4F 4f. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: Los políticos prometen más de lo que saben que pueden cumplir?
## RC1 RC2
## P4A -0.08473744 0.819026929
## P4B 0.18726214 0.645759435
## P4C 0.54498821 0.475613249
## P4D 0.56328916 0.445139055
## P4E 0.81070858 0.041420577
## P4F 0.84053926 0.002577918
write.csv(tabla, file = "tabla.csv")