PARTE 2

Esta sección se realizará en base al análisis de una base de datos que contiene indicadores de la Encuesta Mundial de Valores.La Encuesta Mundial de Valores (EMV) o World Values Survey (WVS) es un proyecto global de investigación social que explora los valores y opiniones de la gente, cómo estos cambian con el tiempo, y su impacto social y político. Desde 1981 una red mundial de científicos sociales y politólogos llevan a cabo esta investigación, haciendo encuestas nacionales representativas en casi 100 países. La WVS es la única fuente de datos empíricos sobre actitudes y valores humanos que abarca a la mayoría de la población mundial (casi el 90%).

library(rio)
data = import("wvs_VF.rda")

Pregunta 1 (3 puntos). ¿Existe asociación entre las variables de Confianza en las fuerzas armadas (Q65) y confianza en el gobierno nacional (Q71)? Calcule la prueba y medidas de asociación pertinentes

#vemos la variavles
str(data$Q65)
##  Factor w/ 4 levels "Mucha","Algo",..: 1 3 1 2 3 3 1 4 2 1 ...
str(data$Q71)
##  Factor w/ 4 levels "Mucha","Algo",..: 1 1 3 4 4 3 3 4 4 3 ...
table(data$Q71)
## 
## Mucha  Algo  Poca  Nada 
##    25   128   432   796

#table

tabla1.1=table(data$Q65,data$Q71)
tabla1.1
##        
##         Mucha Algo Poca Nada
##   Mucha    11   25   45   58
##   Algo      7   64  133  156
##   Poca      5   30  205  324
##   Nada      2    9   47  250

#no le sacamos porcentaje ni gráfico porque no hay tiempo (me da flojera) #prueba de Chi cuadrado

chisq.test(tabla1.1)
## Warning in chisq.test(tabla1.1): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  tabla1.1
## X-squared = 177.44, df = 9, p-value < 2.2e-16

#el p valor es menos a 0,05, por lo que rechamos la hipotesis nula y decimos que hay dependencia entre las dos variables #medidas de asociación:

library(DescTools)

GoodmanKruskalGamma(tabla1.1)
## [1] 0.4268329
KendallTauB(tabla1.1)
## [1] 0.2748657
StuartTauC(tabla1.1)
## [1] 0.2300893

#relacion simetrica o asimetrica:

SomersDelta(tabla1.1, direction = "row")
## [1] 0.3069338

#HLa dependecia entre ambas variables es baja. Es decir, que se apoye a las fuerzas armadas no quiere decir completamente que tambien apoya al gobierno nacional.

Pregunta 2 (3 puntos).¿Existe asociación entre las personas que han sido víctima de algún delito (Q144) y la evaluación que hacen las personas sobre el impacto que tienen los inmigrantes en el desarrollo del Perú (Q121)? Calcule la prueba y medidas de asociación pertinentes

#vemos las variables
str(data$Q144)
##  Factor w/ 2 levels "Si","No": NA 2 2 1 2 2 2 2 2 2 ...
str(data$Q121)
##  Ord.factor w/ 5 levels "Muy bueno"<"Bueno"<..: 5 3 2 3 2 2 2 3 4 2 ...
table(data$Q121)
## 
##        Muy bueno            Bueno Ni bueno ni malo             Malo 
##               15              177              647              440 
##         Muy Malo 
##               91
data=data[complete.cases(data$Q144), ]
data=data[complete.cases(data$Q121), ]

#hacemos el cuadro:

tabla2.1=table(data$Q144, data$Q121)
tabla2.1
##     
##      Muy bueno Bueno Ni bueno ni malo Malo Muy Malo
##   Si         3    38              133   81       19
##   No        12   139              513  359       71
tabla2.2 = prop.table(tabla2.1, 2)*100
tabla2.2
##     
##      Muy bueno    Bueno Ni bueno ni malo     Malo Muy Malo
##   Si  20.00000 21.46893         20.58824 18.40909 21.11111
##   No  80.00000 78.53107         79.41176 81.59091 78.88889

#chi cuadrado

chisq.test(tabla2.1)
## Warning in chisq.test(tabla2.1): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  tabla2.1
## X-squared = 1.1419, df = 4, p-value = 0.8876

#el P valor es mayor a 0,05; es decir, no rechamos la hipotesis nula de dependencia. Las variables puedens ser dependientes. Lo que nos dice que no hay asociación entre si fue victima de un delito y su evaluación a la población migrante. Muchas veces en los medios de comunicación se asocia el nivel de nivel alto de criminalidad con la altas tazas de población migrantes, por lo que está data nos muestra que no hay asociación entre ambas.

Pregunta 3 (4 puntos). En la base de datos hay un indice (ind_confianza) que evalua la confianza de los peruanos en las instituciones públicas. Este indice va del 1 al 10, donde más cerca al 1 es mucha confianza, y más cerca al 10 es nada de confianza. Elabore un diagrama de dispersión para analizar la relación entre dicho indice y la edad del entrevistado (Q262). Interprete.

str(data$ind_confianza)
##  num [1:1368] 5.93 6.67 8.52 9.63 6.67 ...
str(data$Q262)
##  num [1:1368] 79 82 35 20 58 24 33 62 39 69 ...
table(data$ind_confianza)
## 
##                 0  0.37037037037037 0.740740740740741  1.85185185185185 
##                 2                 1                 1                 2 
##  2.22222222222222  2.59259259259259  2.96296296296296  3.33333333333333 
##                 4                 1                 5                20 
##   3.7037037037037  4.07407407407407  4.44444444444444  4.81481481481481 
##                13                11                16                16 
##  5.18518518518519  5.55555555555556  5.92592592592593   6.2962962962963 
##                22                26                45                52 
##  6.66666666666667  7.03703703703704  7.40740740740741  7.77777777777778 
##                69                61                71                92 
##  8.14814814814815  8.51851851851852  8.88888888888889  9.25925925925926 
##               115               131               152               120 
##  9.62962962962963                10 
##                93               108

#grafico:

plot(data$Q262, data$ind_confianza, xlab = "Edad", ylab = "Nivel de confianza")

#Como vemos en el gráfico, #Hipotesis de normalidad

library(nortest)
lillie.test(data$ind_confianza)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  data$ind_confianza
## D = 0.14289, p-value < 2.2e-16
cor.test(data$ind_confianza, data$Q262, method = c("spearman"))
## Warning in cor.test.default(data$ind_confianza, data$Q262, method =
## c("spearman")): Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  data$ind_confianza and data$Q262
## S = 300134350, p-value = 0.007385
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## 0.07577031

#el P valor es menor a o,05, por lo que rechamos la hipotesis nula no correlación, y decimos que sí hay correlacin. Sin embargo, esta correlación postiva es baja, casi insignificante. Se ve una pequena correlación entre nivel de confianza de las instituciones y edad (a mayor edad, menor confianza), pero es baja, casi nada.