PARTE 2

library(rio)
data = import("ENARES2019_FINAL.csv")

PREGUNTA 1

#Indice aditivo:

data$violencia=data$C1P402_1+data$C1P402_2+data$C1P402_3+data$C1P402_4+data$C1P402_5+data$C1P402_6+data$C1P402_7+data$C1P402_8+data$C1P402_9+data$C1P402_10+data$C1P402_11+data$C1P402_12+data$C1P402_13+data$C1P402_14+data$C1P402_15+data$C1P402_16+data$C1P402_17+data$C1P402_18+data$C1P402_19+data$C1P403_1+data$C1P403_2+data$C1P403_3+data$C1P403_4+data$C1P403_5+data$C1P403_6+data$C1P403_7+data$C1P404_1+data$C1P404_2+data$C1P404_3+data$C1P404_4+data$C1P404_5+data$C1P404_6+data$C1P404_7+data$C1P404_8+data$C1P404_9+data$C1P404_10+data$C1P404_11+data$C1P404_12+data$C1P404_13+data$C1P404_14+data$C1P404_15-40
summary(data$violencia)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -27.00  -19.00  -17.00  -17.73  -15.00  -11.00

#eliminamos los Na’s

data=data[complete.cases(data$violencia),]
data$violencia=((data$violencia+27)/-38)*2
table(data$violencia)
## 
##  -0.842105263157895  -0.789473684210526  -0.736842105263158  -0.684210526315789 
##                   1                   5                   7                  21 
##  -0.631578947368421  -0.578947368421053  -0.526315789473684  -0.473684210526316 
##                  57                  41                  43                  32 
##  -0.421052631578947  -0.368421052631579  -0.315789473684211  -0.263157894736842 
##                  33                  23                  13                  11 
##  -0.210526315789474  -0.157894736842105  -0.105263157894737 -0.0526315789473684 
##                   4                   9                   8                   8 
##                   0 
##                   1

PREGUNTA 2

#Hipotesis Nula: No existe diferencia entre las medias poblacionales de los grupos evaluados en esta pregunta. HA: Al menos una media poblacional es diferente

#str(data1$C1P408)
#table(data1$C1P408)
data1<-data[complete.cases(data$C1P408), ]
sum(is.na(data1$violencia))
## [1] 0
data1$C1P408=factor(data1$C1P408, levels = c(1:3), labels = c("Siempre/casi siempre","algunas veces","rara vez"))

#veamos informalmente si existe diferencia

library(gplots)
## 
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
## 
##     lowess
plotmeans(data1$violencia~data1$C1P408, connect = F, barwidth = 3, xlab = "Frecuencia", ylab = "Nivel de violencia", main="Nivel de violencia")

#Por el grafico, podemos ver que algunis datos se interpolan, pero no sabemos con exactitud cuales.

#Diferencia de promedios

library(psych)
describe.by(data1$violencia, data1$C1P408)
## Warning: describe.by is deprecated. Please use the describeBy function
## 
##  Descriptive statistics by group 
## group: Siempre/casi siempre
##    vars  n  mean  sd median trimmed  mad   min max range skew kurtosis   se
## X1    1 59 -0.39 0.2  -0.42   -0.39 0.23 -0.74   0  0.74 0.15    -1.05 0.03
## ------------------------------------------------------------ 
## group: algunas veces
##    vars   n  mean   sd median trimmed  mad   min   max range skew kurtosis   se
## X1    1 142 -0.51 0.14  -0.53   -0.52 0.16 -0.84 -0.05  0.79 0.56     0.55 0.01
## ------------------------------------------------------------ 
## group: rara vez
##    vars  n  mean   sd median trimmed  mad   min   max range skew kurtosis   se
## X1    1 66 -0.49 0.18  -0.58   -0.52 0.08 -0.79 -0.05  0.74 1.07     0.21 0.02

#Vemos anova

anova<- aov(data1$violencia~data1$C1P408)
summary(anova)
##               Df Sum Sq Mean Sq F value   Pr(>F)    
## data1$C1P408   2  0.601 0.30056   10.91 2.81e-05 ***
## Residuals    264  7.275 0.02756                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#El p valor es menos a 0,05, por lo que podemos decir que rechazamos la H0, hipotezis nula; por lo que podemos decir que hay diferencia entre por lo menos dos grupos.

#vemos cuales grupos son:

TukeyHSD(anova)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = data1$violencia ~ data1$C1P408)
## 
## $`data1$C1P408`
##                                           diff        lwr         upr     p adj
## algunas veces-Siempre/casi siempre -0.11905241 -0.1796581 -0.05844671 0.0000171
## rara vez-Siempre/casi siempre      -0.09853215 -0.1686361 -0.02842818 0.0030142
## rara vez-algunas veces              0.02052025 -0.0377707  0.07881120 0.6849010

#graficamente:

plot(TukeyHSD(anova))

#podemos decir que hay diferencia entre los grupos de “rara vez” y “siempre/casi siempre” y entre “algunas veces” y “Siempre casi siempre”. Podemos ver que la violencia aumenta cuando el conviviente toma bebidas alcoholicas con mayor veces.

PREGUNTA 3

#Hpotesis nula: No existe diferencia entre las medias poblacionales de los grupos evaluados en esta pregunta. HA: Al menos una media poblacional es diferente

str(data$C1P307)
##  int [1:317] 1 1 1 1 1 1 1 1 1 1 ...
data$C1P307=factor(data$C1P307, levels = c(1:2), labels=c("Si","No"))
table(data$C1P307)
## 
##  Si  No 
## 202 115

#Metodo informal:

library(gplots)
plotmeans(data$violencia~data$C1P307, connect = F, barwidth = 3, xlab = "Respuesta", ylab = "Magnitud de violencia", main="trabaja?")

#vemos anova

anova1<-aov(data$violencia~data$C1P307)
summary(anova1)
##              Df Sum Sq Mean Sq F value Pr(>F)  
## data$C1P307   1  0.092 0.09239   3.253 0.0722 .
## Residuals   315  8.947 0.02840                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#Vemos que el p valor es mayor a 0,05,por lo que no rechamoz la hipotesis nula, pued afirmar que hay igualdad entre los grupos

TukeyHSD(anova1
        )
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = data$violencia ~ data$C1P307)
## 
## $`data$C1P307`
##              diff         lwr         upr     p adj
## No-Si -0.03550762 -0.07424247 0.003227224 0.0722497
plot(TukeyHSD(anova1))

PREGUNTA 4

str(data$C1P410)
##  int [1:317] NA NA 2 NA NA 4 NA NA 1 2 ...
table(data$C1P410)
## 
##  1  2  3  4 
##  9 19 21 97
sum(is.na(data$C1P410))
## [1] 171
data2<-data[complete.cases(data$C1P410),]
data2$C1P410=factor(data2$C1P410, levels = c(1:4), labels = c("siempre/casi siempre","Algunas veces","rara vez","no ha acurrido"))

#informar

library(gplots)
plotmeans(data2$violencia~data2$C1P410, connect = F)

#Vemos anova

anova3<- aov(data2$violencia~data2$C1P410)
summary(anova3)
##               Df Sum Sq Mean Sq F value   Pr(>F)    
## data2$C1P410   3  0.522 0.17391   6.097 0.000623 ***
## Residuals    142  4.050 0.02852                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#vemos que el p valor es menos a 0,05, por lo que podemos rechazamos la hipotesis nula, por lo que hay diferencas entre los grupos

#grafico

TukeyHSD(anova3)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = data2$violencia ~ data2$C1P410)
## 
## $`data2$C1P410`
##                                             diff        lwr         upr
## Algunas veces-siempre/casi siempre  -0.241305017 -0.4189666 -0.06364343
## rara vez-siempre/casi siempre       -0.211361738 -0.3862829 -0.03644060
## no ha acurrido-siempre/casi siempre -0.249472478 -0.4024608 -0.09648412
## rara vez-Algunas veces               0.029943279 -0.1090699  0.16895651
## no ha acurrido-Algunas veces        -0.008167462 -0.1183160  0.10198112
## no ha acurrido-rara vez             -0.038110741 -0.1437823  0.06756081
##                                         p adj
## Algunas veces-siempre/casi siempre  0.0031037
## rara vez-siempre/casi siempre       0.0109015
## no ha acurrido-siempre/casi siempre 0.0002332
## rara vez-Algunas veces              0.9436790
## no ha acurrido-Algunas veces        0.9974501
## no ha acurrido-rara vez             0.7846782
plot(TukeyHSD(anova3))

#vemos que hay diferencia entre ’Algunas veces-siempre/casi siempre”, no ha acurrido-siempre/casi siempre