Esta sección se realizará en base al análisis de una base de datos que contiene indicadores de la Encuesta Mundial de Valores.La Encuesta Mundial de Valores (EMV) o World Values Survey (WVS) es un proyecto global de investigación social que explora los valores y opiniones de la gente, cómo estos cambian con el tiempo, y su impacto social y político. Desde 1981 una red mundial de científicos sociales y politólogos llevan a cabo esta investigación, haciendo encuestas nacionales representativas en casi 100 países. La WVS es la única fuente de datos empíricos sobre actitudes y valores humanos que abarca a la mayoría de la población mundial (casi el 90%).
library(rio)
data = import("wvs_VF.rda")
#vemos la variavles
str(data$Q65)
## Factor w/ 4 levels "Mucha","Algo",..: 1 3 1 2 3 3 1 4 2 1 ...
str(data$Q71)
## Factor w/ 4 levels "Mucha","Algo",..: 1 1 3 4 4 3 3 4 4 3 ...
table(data$Q71)
##
## Mucha Algo Poca Nada
## 25 128 432 796
#table
tabla1.1=table(data$Q65,data$Q71)
tabla1.1
##
## Mucha Algo Poca Nada
## Mucha 11 25 45 58
## Algo 7 64 133 156
## Poca 5 30 205 324
## Nada 2 9 47 250
#no le sacamos porcentaje ni gráfico porque no hay tiempo (me da flojera) #prueba de Chi cuadrado
chisq.test(tabla1.1)
## Warning in chisq.test(tabla1.1): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: tabla1.1
## X-squared = 177.44, df = 9, p-value < 2.2e-16
#el p valor es menos a 0,05, por lo que rechamos la hipotesis nula y decimos que hay dependencia entre las dos variables #medidas de asociación:
library(DescTools)
GoodmanKruskalGamma(tabla1.1)
## [1] 0.4268329
KendallTauB(tabla1.1)
## [1] 0.2748657
StuartTauC(tabla1.1)
## [1] 0.2300893
#relacion simetrica o asimetrica:
SomersDelta(tabla1.1, direction = "row")
## [1] 0.3069338
#HLa dependecia entre ambas variables es baja. Es decir, que se apoye a las fuerzas armadas no quiere decir completamente que tambien apoya al gobierno nacional.
#vemos las variables
str(data$Q144)
## Factor w/ 2 levels "Si","No": NA 2 2 1 2 2 2 2 2 2 ...
str(data$Q121)
## Ord.factor w/ 5 levels "Muy bueno"<"Bueno"<..: 5 3 2 3 2 2 2 3 4 2 ...
table(data$Q121)
##
## Muy bueno Bueno Ni bueno ni malo Malo
## 15 177 647 440
## Muy Malo
## 91
data=data[complete.cases(data$Q144), ]
data=data[complete.cases(data$Q121), ]
#hacemos el cuadro:
tabla2.1=table(data$Q144, data$Q121)
tabla2.1
##
## Muy bueno Bueno Ni bueno ni malo Malo Muy Malo
## Si 3 38 133 81 19
## No 12 139 513 359 71
tabla2.2 = prop.table(tabla2.1, 2)*100
tabla2.2
##
## Muy bueno Bueno Ni bueno ni malo Malo Muy Malo
## Si 20.00000 21.46893 20.58824 18.40909 21.11111
## No 80.00000 78.53107 79.41176 81.59091 78.88889
#chi cuadrado
chisq.test(tabla2.1)
## Warning in chisq.test(tabla2.1): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: tabla2.1
## X-squared = 1.1419, df = 4, p-value = 0.8876
#el P valor es mayor a 0,05; es decir, no rechamos la hipotesis nula de dependencia. Las variables puedens ser dependientes. Lo que nos dice que no hay asociación entre si fue victima de un delito y su evaluación a la población migrante. Muchas veces en los medios de comunicación se asocia el nivel de nivel alto de criminalidad con la altas tazas de población migrantes, por lo que está data nos muestra que no hay asociación entre ambas.
str(data$ind_confianza)
## num [1:1368] 5.93 6.67 8.52 9.63 6.67 ...
str(data$Q262)
## num [1:1368] 79 82 35 20 58 24 33 62 39 69 ...
table(data$ind_confianza)
##
## 0 0.37037037037037 0.740740740740741 1.85185185185185
## 2 1 1 2
## 2.22222222222222 2.59259259259259 2.96296296296296 3.33333333333333
## 4 1 5 20
## 3.7037037037037 4.07407407407407 4.44444444444444 4.81481481481481
## 13 11 16 16
## 5.18518518518519 5.55555555555556 5.92592592592593 6.2962962962963
## 22 26 45 52
## 6.66666666666667 7.03703703703704 7.40740740740741 7.77777777777778
## 69 61 71 92
## 8.14814814814815 8.51851851851852 8.88888888888889 9.25925925925926
## 115 131 152 120
## 9.62962962962963 10
## 93 108
#grafico:
plot(data$Q262, data$ind_confianza, xlab = "Edad", ylab = "Nivel de confianza")
#Como vemos en el gráfico, #Hipotesis de normalidad
library(nortest)
lillie.test(data$ind_confianza)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: data$ind_confianza
## D = 0.14289, p-value < 2.2e-16
cor.test(data$ind_confianza, data$Q262, method = c("spearman"))
## Warning in cor.test.default(data$ind_confianza, data$Q262, method =
## c("spearman")): Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: data$ind_confianza and data$Q262
## S = 300134350, p-value = 0.007385
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.07577031
#el P valor es menor a o,05, por lo que rechamos la hipotesis nula no correlación, y decimos que sí hay correlacin. Sin embargo, esta correlación postiva es baja, casi insignificante. Se ve una pequena correlación entre nivel de confianza de las instituciones y edad (a mayor edad, menor confianza), pero es baja, casi nada.