library(rio)
lapop = import("Peru LAPOP AmericasBarometer 2019 v1.0_W.dta")
Nivel de confianza el sistema político será mi eje “y” Y nivel de confianza en la comunidad será mi eje “x” Primero elboramos un índice aditivo con las 5 variables ordinales propuestas por la docente: - b1: ¿Hasta qué punto cree usted que los tribunales de justicia de Perú garantizan un juicio justo? - b2: ¿Hasta qué punto tiene usted respeto por las instituciones políticas de Perú? - b3: ¿Hasta qué punto cree usted que los derechos básicos del ciudadano están bien protegidos por el sistema político peruano? - b4: ¿Hasta qué punto se siente usted orgulloso de vivir bajo el sistema político del Perú? - b6: ¿Hasta qué punto piensa usted que se debe apoyar al sistema político del Perú? A nuestro índice aditivo le vamos a restar 4 porque queremos que nuestro mínimo sea 1
lapop$apoyo=lapop$b1+lapop$b2+lapop$b3+lapop$b4+lapop$b6-4
Comprobamos si fracasé o lo hice bien
summary(lapop$apoyo)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.00 9.00 14.00 13.56 18.00 31.00 45
Pero tengo mucho NA’s :c. Lo limpio
lapop = lapop[complete.cases(lapop$apoyo),]
Comprobamos
summary(lapop$apoyo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 9.00 14.00 13.56 18.00 31.00
Trabajemos con la variable “it1”: confianza interpersonal
class(lapop$it1)
## [1] "numeric"
Vemos que es numérica así que lo pasamos a factor
lapop$it1 = factor(lapop$it1,
levels = c(1:4),
labels = c("Muy confiable","Algo confiable","Poco confiable","Nada confiable"))
Comprobamos:
class(lapop$it1)
## [1] "factor"
str(lapop$it1)
## Factor w/ 4 levels "Muy confiable",..: 3 3 3 2 2 3 2 2 4 3 ...
Exploramos las frecuencias
table(lapop$it1)
##
## Muy confiable Algo confiable Poco confiable Nada confiable
## 154 463 625 221
Vemos si hay datos perdidos
sum(is.na(lapop$it1))
## [1] 13
#hay 14 NA's así que limpiamos
lapop = lapop[complete.cases(lapop$it1),]
sum(is.na(lapop$it1))
## [1] 0
library(gplots)
##
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
##
## lowess
plotmeans(lapop$apoyo ~ lapop$it1, connect=F, barwidth=3, xlab="Nivel de confianza interpersonal",
ylab="Nivel de apoyo al sistema político",
main="No sé qué poner")
anova <- aov(lapop$apoyo~lapop$it1)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## lapop$it1 3 515 171.53 4.549 0.00352 **
## Residuals 1459 55017 37.71
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Observamos que el P-value es menor a 0.05 así que podemos afirmar que existe diferencia de promedios de nivel de confianza interpersonal entre, al menos dos grupos. Ello coincide con el gráfico mostrado anteriormente Aplicamos la prueba Tukey para ver entre qué grupos sucede esta diferencia de medias
TukeyHSD(anova)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = lapop$apoyo ~ lapop$it1)
##
## $`lapop$it1`
## diff lwr upr p adj
## Algo confiable-Muy confiable -1.0797453 -2.5489517 0.3894611 0.2326452
## Poco confiable-Muy confiable -1.9092779 -3.3301646 -0.4883912 0.0031606
## Nada confiable-Muy confiable -1.2026209 -2.8604900 0.4552482 0.2433685
## Poco confiable-Algo confiable -0.8295326 -1.7979778 0.1389125 0.1228352
## Nada confiable-Algo confiable -0.1228756 -1.4141915 1.1684403 0.9948491
## Nada confiable-Poco confiable 0.7066570 -0.5294046 1.9427186 0.4557454
Como se observa, el único grupo que presenta una diferencia de media estadísticamente signficativa es el que presenta una confianza interpersonal “poco confiable”, pues presenta un P-value de 0.0031606. Por lo tanto, podemos concluir que las personas que tienen poca confianza en su comunidad tienen, en promedio, un menor nivel de apoyo a las instituciones que las personas que aseveraron tener mucha confianza en su comunidad. No se presentan diferencias entre los otros grupos. El hecho de que las personas que no tienen nada de confianza no presenten diferencia estadísticamente significativas con las personas que tienen mucha confianza en la comunidad nos sugiere que no existe una correlación importante entre las dos variables de estudio
plot(TukeyHSD(anova))
En este segundo grupo observamos que el único intervalo que cruza la
línea 0 es el de “poco confiable”, así que llegamos a los mismos
resutlados explicados anteriormente.