library(rio)
lapop = import("Peru LAPOP AmericasBarometer 2019 v1.0_W.dta")

Nivel de confianza el sistema político será mi eje “y” Y nivel de confianza en la comunidad será mi eje “x” Primero elboramos un índice aditivo con las 5 variables ordinales propuestas por la docente: - b1: ¿Hasta qué punto cree usted que los tribunales de justicia de Perú garantizan un juicio justo? - b2: ¿Hasta qué punto tiene usted respeto por las instituciones políticas de Perú? - b3: ¿Hasta qué punto cree usted que los derechos básicos del ciudadano están bien protegidos por el sistema político peruano? - b4: ¿Hasta qué punto se siente usted orgulloso de vivir bajo el sistema político del Perú? - b6: ¿Hasta qué punto piensa usted que se debe apoyar al sistema político del Perú? A nuestro índice aditivo le vamos a restar 4 porque queremos que nuestro mínimo sea 1

lapop$apoyo=lapop$b1+lapop$b2+lapop$b3+lapop$b4+lapop$b6-4

Comprobamos si fracasé o lo hice bien

summary(lapop$apoyo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    1.00    9.00   14.00   13.56   18.00   31.00      45

Pero tengo mucho NA’s :c. Lo limpio

lapop = lapop[complete.cases(lapop$apoyo),]

Comprobamos

summary(lapop$apoyo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    9.00   14.00   13.56   18.00   31.00

Trabajemos con la variable “it1”: confianza interpersonal

class(lapop$it1)
## [1] "numeric"

Vemos que es numérica así que lo pasamos a factor

lapop$it1 = factor(lapop$it1,
                   levels = c(1:4),
                   labels = c("Muy confiable","Algo confiable","Poco confiable","Nada confiable"))

Comprobamos:

class(lapop$it1)
## [1] "factor"
str(lapop$it1)
##  Factor w/ 4 levels "Muy confiable",..: 3 3 3 2 2 3 2 2 4 3 ...

Exploramos las frecuencias

table(lapop$it1)
## 
##  Muy confiable Algo confiable Poco confiable Nada confiable 
##            154            463            625            221

Vemos si hay datos perdidos

sum(is.na(lapop$it1))
## [1] 13
#hay 14 NA's así que limpiamos
lapop = lapop[complete.cases(lapop$it1),]
sum(is.na(lapop$it1))
## [1] 0
library(gplots)
## 
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
## 
##     lowess
plotmeans(lapop$apoyo ~ lapop$it1, connect=F, barwidth=3, xlab="Nivel de confianza interpersonal",
          ylab="Nivel de apoyo al sistema político",
          main="No sé qué poner")

anova <- aov(lapop$apoyo~lapop$it1)
summary(anova)
##               Df Sum Sq Mean Sq F value  Pr(>F)   
## lapop$it1      3    515  171.53   4.549 0.00352 **
## Residuals   1459  55017   37.71                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Observamos que el P-value es menor a 0.05 así que podemos afirmar que existe diferencia de promedios de nivel de confianza interpersonal entre, al menos dos grupos. Ello coincide con el gráfico mostrado anteriormente Aplicamos la prueba Tukey para ver entre qué grupos sucede esta diferencia de medias

TukeyHSD(anova)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = lapop$apoyo ~ lapop$it1)
## 
## $`lapop$it1`
##                                     diff        lwr        upr     p adj
## Algo confiable-Muy confiable  -1.0797453 -2.5489517  0.3894611 0.2326452
## Poco confiable-Muy confiable  -1.9092779 -3.3301646 -0.4883912 0.0031606
## Nada confiable-Muy confiable  -1.2026209 -2.8604900  0.4552482 0.2433685
## Poco confiable-Algo confiable -0.8295326 -1.7979778  0.1389125 0.1228352
## Nada confiable-Algo confiable -0.1228756 -1.4141915  1.1684403 0.9948491
## Nada confiable-Poco confiable  0.7066570 -0.5294046  1.9427186 0.4557454

Como se observa, el único grupo que presenta una diferencia de media estadísticamente signficativa es el que presenta una confianza interpersonal “poco confiable”, pues presenta un P-value de 0.0031606. Por lo tanto, podemos concluir que las personas que tienen poca confianza en su comunidad tienen, en promedio, un menor nivel de apoyo a las instituciones que las personas que aseveraron tener mucha confianza en su comunidad. No se presentan diferencias entre los otros grupos. El hecho de que las personas que no tienen nada de confianza no presenten diferencia estadísticamente significativas con las personas que tienen mucha confianza en la comunidad nos sugiere que no existe una correlación importante entre las dos variables de estudio

plot(TukeyHSD(anova))

En este segundo grupo observamos que el único intervalo que cruza la línea 0 es el de “poco confiable”, así que llegamos a los mismos resutlados explicados anteriormente.