Práctica dirigida: Análisis de Componentes Principales II

Introducción

El objetivo de la presente práctica dirigida es evaluar la validez de constructo de un índice de actitudes políticas multidimensional. Las dimensiones propuestas son: eficacia política interna, eficacia política externa y la confianza política.

El instrumento que contiene la escala de actitudes políticas que ahora se analiza, fue aplicado por el Instituto de Opinión Pública de la PUCP(IOP, 2012) en el marco del estudio Representación Política y Conflictos Sociales.

La data del IOP puede ser consutlada en la siguiente direccción:

http://datos.pucp.edu.pe/dataverse/iop?q=&fq0=productionDate_s%3A%222012%22&types= dataverses%3Adatasets&sort=dateSort&order=desc

Actitudes políticas

La pregunta 4 (A-H) del cuestionario recoge información acerca del nivel de eficacia política del ciudadano. La eficacia política es definida como la percepción del ciudadano sobre la propia capacidad política. La eficacia política presenta dos dimensiones: (1) eficacia política interna o la percepción del ciudadano sobre su propia capacidad para entender los temas políticos, así como el funcionamiento del sistema y (2) eficacia política externa o la percepción del ciudadano sobre la disposición, interés y/ o capacidad de los políticos para responder satisfactoriamente a las demandas de los ciudadanos.

Carga de paquetes

Como la extensión en la que el IOP ha archivado la data del estudio es de SPSS(“.sav”), vamos a necesitar el paquete “foreign” para su importación.


library(foreign)

#library(haven)

Luego importamos el archivo como “data.frame” y le colocamos el nombre “conflictos12”. Si cotejamos con el cuestionario del estudio, podemos ver que las variables de interés van desde la pregutna P4A hasta P4G.


conflictos12<-read.spss("IOP_1112_01_D.sav", to.data.frame=T, use.value.labels = F)
## re-encoding from UTF-8

Inspeccionamos el nombre de las variables (“names”):


names(conflictos12) [1:20]
##  [1] "NUM"      "SEXO"     "EDAD"     "P1A"      "P1A_OTRO" "P1B"     
##  [7] "P1B_OTRO" "P2"       "P3"       "P4A"      "P4B"      "P4C"     
## [13] "P4D"      "P4E"      "P4F"      "P4G"      "P5"       "P6"      
## [19] "P7A"      "P7B"

Variables en la base. la eficacia política del ciudadano se evalúa con una escala de respuesta de 4 puntos en donde 1 significa “Muy de acuerdo” y 4 “Muy en desacuero”. La consigna en el encabezado de la escala le solicita al participante responder sobre su grado de acuerdo ( o desacuerdo) con las siguientes afirmaciones:

Preparación de la data


conflictos.s<-conflictos12[names(conflictos12)[c(1,10:16)]]

Recodificación de variables

Recodificamos 9 por “NA”, pero tenemos cuidado de no recodificar el 9 de la columna con el identificador de casos.


NUM <- conflictos.s[, 1] 
df <- conflictos.s[, 2:8] 
df[df==9] <- NA
df.p4 <- cbind(NUM, df)

1. Análisis preliminar descriptivo

Para organizar mejor los estadísticos descriptivos de las variables de interés, podemos utilizar el paquete “stargazer”. En este caso, dado que el tipo de variable es ordinal, es mejor utilizar la mediana.


library(stargazer)
stargazer(df.p4[-1], type="text", median=T)
## 
## ===================================================================
## Statistic   N   Mean  St. Dev.  Min  Pctl(25) Median Pctl(75)  Max 
## -------------------------------------------------------------------
## P4A       1,131 2.340  0.719   1.000  2.000   2.000   3.000   4.000
## P4B       1,144 2.066  0.666   1.000  2.000   2.000   2.000   4.000
## P4C       1,142 1.958  0.654   1.000  2.000   2.000   2.000   4.000
## P4D       1,144 1.955  0.658   1.000  2.000   2.000   2.000   4.000
## P4E       1,154 1.731  0.641   1.000  1.000   2.000   2.000   4.000
## P4F       1,148 1.747  0.654   1.000  1.000   2.000   2.000   4.000
## P4G       1,108 2.550  0.814   1.000  2.000   3.000   3.000   4.000
## -------------------------------------------------------------------

Preguntas

2. Matriz de correlaciones


## TABLA DE CORRELACIONES

correla1 <- round(cor(df.p4[,-1], use = "complete.obs"),2)
correla1
##      P4A  P4B  P4C  P4D  P4E  P4F  P4G
## P4A 1.00 0.23 0.26 0.21 0.12 0.06 0.15
## P4B 0.23 1.00 0.26 0.29 0.23 0.22 0.05
## P4C 0.26 0.26 1.00 0.44 0.36 0.39 0.01
## P4D 0.21 0.29 0.44 1.00 0.36 0.35 0.08
## P4E 0.12 0.23 0.36 0.36 1.00 0.55 0.08
## P4F 0.06 0.22 0.39 0.35 0.55 1.00 0.02
## P4G 0.15 0.05 0.01 0.08 0.08 0.02 1.00

Calcule la matriz de correlaciones para los items de la escala de participación política y responda:

3. Análisis de componentes principales

Para completar el análisis de Componentes Principales, desarrolle los siguientes puntos:


library(psych)

pca1 <- principal(df.p4[, c(-1, -8)], nfactors = 6, rotate = "none")
pca1
## Principal Components Analysis
## Call: principal(r = df.p4[, c(-1, -8)], nfactors = 6, rotate = "none")
## Standardized loadings (pattern matrix) based upon correlation matrix
##      PC1   PC2   PC3   PC4   PC5   PC6 h2       u2 com
## P4A 0.38  0.73 -0.37  0.42  0.09  0.08  1 -1.1e-15 2.8
## P4B 0.51  0.44  0.74  0.00 -0.07 -0.01  1  1.9e-15 2.5
## P4C 0.72  0.10 -0.26 -0.32 -0.54 -0.12  1  3.3e-16 2.8
## P4D 0.72  0.06 -0.12 -0.46  0.51  0.03  1  4.4e-16 2.7
## P4E 0.70 -0.41  0.02  0.37  0.11 -0.44  1  8.9e-16 3.1
## P4F 0.70 -0.46  0.03  0.21 -0.08  0.49  1  7.8e-16 2.9
## 
##                        PC1  PC2  PC3  PC4  PC5  PC6
## SS loadings           2.42 1.12 0.76 0.67 0.58 0.46
## Proportion Var        0.40 0.19 0.13 0.11 0.10 0.08
## Cumulative Var        0.40 0.59 0.72 0.83 0.92 1.00
## Proportion Explained  0.40 0.19 0.13 0.11 0.10 0.08
## Cumulative Proportion 0.40 0.59 0.72 0.83 0.92 1.00
## 
## Mean item complexity =  2.8
## Test of the hypothesis that 6 components are sufficient.
## 
## The root mean square of the residuals (RMSR) is  0 
##  with the empirical chi square  0  with prob <  NA 
## 
## Fit based upon off diagonal values = 1

pca2 <- principal(df.p4[, c(-1, -8)], nfactors = 2, rotate = "none")
pca2
## Principal Components Analysis
## Call: principal(r = df.p4[, c(-1, -8)], nfactors = 2, rotate = "none")
## Standardized loadings (pattern matrix) based upon correlation matrix
##      PC1   PC2   h2   u2 com
## P4A 0.38  0.73 0.68 0.32 1.5
## P4B 0.51  0.44 0.45 0.55 1.9
## P4C 0.72  0.10 0.52 0.48 1.0
## P4D 0.72  0.06 0.52 0.48 1.0
## P4E 0.70 -0.41 0.66 0.34 1.6
## P4F 0.70 -0.46 0.71 0.29 1.7
## 
##                        PC1  PC2
## SS loadings           2.42 1.12
## Proportion Var        0.40 0.19
## Cumulative Var        0.40 0.59
## Proportion Explained  0.68 0.32
## Cumulative Proportion 0.68 1.00
## 
## Mean item complexity =  1.5
## Test of the hypothesis that 2 components are sufficient.
## 
## The root mean square of the residuals (RMSR) is  0.13 
##  with the empirical chi square  603  with prob <  3.5e-129 
## 
## Fit based upon off diagonal values = 0.81

4. Rotación de componentes


pca3 <- principal(df.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
pca3
## Principal Components Analysis
## Call: principal(r = df.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
## Standardized loadings (pattern matrix) based upon correlation matrix
##       RC1  RC2   h2   u2 com
## P4A -0.08 0.82 0.68 0.32 1.0
## P4B  0.19 0.65 0.45 0.55 1.2
## P4C  0.54 0.48 0.52 0.48 2.0
## P4D  0.56 0.45 0.52 0.48 1.9
## P4E  0.81 0.04 0.66 0.34 1.0
## P4F  0.84 0.00 0.71 0.29 1.0
## 
##                        RC1  RC2
## SS loadings           2.02 1.51
## Proportion Var        0.34 0.25
## Cumulative Var        0.34 0.59
## Proportion Explained  0.57 0.43
## Cumulative Proportion 0.57 1.00
## 
## Mean item complexity =  1.3
## Test of the hypothesis that 2 components are sufficient.
## 
## The root mean square of the residuals (RMSR) is  0.13 
##  with the empirical chi square  603  with prob <  3.5e-129 
## 
## Fit based upon off diagonal values = 0.81

Para terminar, realice una rotación de Componentes Principales que le permita interpretar mejor los componentes rotados

Ejercicio final

Repetir el procedimiento con los items de la pregunta P42 sobre actitudes políticas del estudio de Comunicación Política realizado por el IOP EN EL 2013. Considere los siguientes pasos:

Exportación con etiquetas con “haven”


library(haven)
library(sjlabelled)

dt <- haven::read_sav("IOP_1112_01_D.sav")

dt2 <- dt[c(1,10:16)]

NUM <- dt2[, 1] 
variables <- dt2[, 2:8] 
variables[variables==9] <- NA
datos.p4 <- cbind(NUM, variables)

pca4 <- principal(datos.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
pca4
## Principal Components Analysis
## Call: principal(r = datos.p4[, c(-1, -8)], nfactors = 2, rotate = "varimax")
## Standardized loadings (pattern matrix) based upon correlation matrix
##       RC1  RC2   h2   u2 com
## P4A -0.08 0.82 0.68 0.32 1.0
## P4B  0.19 0.65 0.45 0.55 1.2
## P4C  0.54 0.48 0.52 0.48 2.0
## P4D  0.56 0.45 0.52 0.48 1.9
## P4E  0.81 0.04 0.66 0.34 1.0
## P4F  0.84 0.00 0.71 0.29 1.0
## 
##                        RC1  RC2
## SS loadings           2.02 1.51
## Proportion Var        0.34 0.25
## Cumulative Var        0.34 0.59
## Proportion Explained  0.57 0.43
## Cumulative Proportion 0.57 1.00
## 
## Mean item complexity =  1.3
## Test of the hypothesis that 2 components are sufficient.
## 
## The root mean square of the residuals (RMSR) is  0.13 
##  with the empirical chi square  603  with prob <  3.5e-129 
## 
## Fit based upon off diagonal values = 0.81

Items <- get_label(dt2[c(-1, -8)])

B <- pca3$loadings[,1:2]

tabla <- data.frame(Items,B)


tabla
##                                                                                                                                                          Items
## P4A     4a. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: La política es tan complicada que la gente como yo no puede entender lo que pasa?
## P4B         4b. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: El voto es la única manera que tiene la gente como yo de influir en política?
## P4C                4c. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: Los políticos no se preocupan mucho de lo que piensa la gente como yo?
## P4D            4d. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: La gente como yo tiene muy poca influencia en las decisiones del gobierno?
## P4E 4e. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: La mayoría de los políticos están en política solo por lo que pueden obtener de ella?
## P4F                        4f. ¿Qué tan de acuerdo o en desacuerdo está con la siguiente frase: Los políticos prometen más de lo que saben que pueden cumplir?
##             RC1         RC2
## P4A -0.08473744 0.819026929
## P4B  0.18726214 0.645759435
## P4C  0.54498821 0.475613249
## P4D  0.56328916 0.445139055
## P4E  0.81070858 0.041420577
## P4F  0.84053926 0.002577918

write.csv(tabla, file = "tabla.csv")