library(rio)
data = import("ENARES2019_FINAL.csv")
#Indice aditivo:
data$violencia=data$C1P402_1+data$C1P402_2+data$C1P402_3+data$C1P402_4+data$C1P402_5+data$C1P402_6+data$C1P402_7+data$C1P402_8+data$C1P402_9+data$C1P402_10+data$C1P402_11+data$C1P402_12+data$C1P402_13+data$C1P402_14+data$C1P402_15+data$C1P402_16+data$C1P402_17+data$C1P402_18+data$C1P402_19+data$C1P403_1+data$C1P403_2+data$C1P403_3+data$C1P403_4+data$C1P403_5+data$C1P403_6+data$C1P403_7+data$C1P404_1+data$C1P404_2+data$C1P404_3+data$C1P404_4+data$C1P404_5+data$C1P404_6+data$C1P404_7+data$C1P404_8+data$C1P404_9+data$C1P404_10+data$C1P404_11+data$C1P404_12+data$C1P404_13+data$C1P404_14+data$C1P404_15-40
summary(data$violencia)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -27.00 -19.00 -17.00 -17.73 -15.00 -11.00
#eliminamos los Na’s
data=data[complete.cases(data$violencia),]
data$violencia=((data$violencia+27)/-38)*2
table(data$violencia)
##
## -0.842105263157895 -0.789473684210526 -0.736842105263158 -0.684210526315789
## 1 5 7 21
## -0.631578947368421 -0.578947368421053 -0.526315789473684 -0.473684210526316
## 57 41 43 32
## -0.421052631578947 -0.368421052631579 -0.315789473684211 -0.263157894736842
## 33 23 13 11
## -0.210526315789474 -0.157894736842105 -0.105263157894737 -0.0526315789473684
## 4 9 8 8
## 0
## 1
#Hipotesis Nula: No existe diferencia entre las medias poblacionales de los grupos evaluados en esta pregunta. HA: Al menos una media poblacional es diferente
#str(data1$C1P408)
#table(data1$C1P408)
data1<-data[complete.cases(data$C1P408), ]
sum(is.na(data1$violencia))
## [1] 0
data1$C1P408=factor(data1$C1P408, levels = c(1:3), labels = c("Siempre/casi siempre","algunas veces","rara vez"))
#veamos informalmente si existe diferencia
library(gplots)
##
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
##
## lowess
plotmeans(data1$violencia~data1$C1P408, connect = F, barwidth = 3, xlab = "Frecuencia", ylab = "Nivel de violencia", main="Nivel de violencia")
#Por el grafico, podemos ver que algunis datos se interpolan, pero no
sabemos con exactitud cuales.
#Diferencia de promedios
library(psych)
describe.by(data1$violencia, data1$C1P408)
## Warning: describe.by is deprecated. Please use the describeBy function
##
## Descriptive statistics by group
## group: Siempre/casi siempre
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 59 -0.39 0.2 -0.42 -0.39 0.23 -0.74 0 0.74 0.15 -1.05 0.03
## ------------------------------------------------------------
## group: algunas veces
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 142 -0.51 0.14 -0.53 -0.52 0.16 -0.84 -0.05 0.79 0.56 0.55 0.01
## ------------------------------------------------------------
## group: rara vez
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 66 -0.49 0.18 -0.58 -0.52 0.08 -0.79 -0.05 0.74 1.07 0.21 0.02
#Vemos anova
anova<- aov(data1$violencia~data1$C1P408)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## data1$C1P408 2 0.601 0.30056 10.91 2.81e-05 ***
## Residuals 264 7.275 0.02756
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#El p valor es menos a 0,05, por lo que podemos decir que rechazamos la H0, hipotezis nula; por lo que podemos decir que hay diferencia entre por lo menos dos grupos.
#vemos cuales grupos son:
TukeyHSD(anova)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = data1$violencia ~ data1$C1P408)
##
## $`data1$C1P408`
## diff lwr upr p adj
## algunas veces-Siempre/casi siempre -0.11905241 -0.1796581 -0.05844671 0.0000171
## rara vez-Siempre/casi siempre -0.09853215 -0.1686361 -0.02842818 0.0030142
## rara vez-algunas veces 0.02052025 -0.0377707 0.07881120 0.6849010
#graficamente:
plot(TukeyHSD(anova))
#podemos decir que hay diferencia entre los grupos de “rara vez” y
“siempre/casi siempre” y entre “algunas veces” y “Siempre casi siempre”.
Podemos ver que la violencia aumenta cuando el conviviente toma bebidas
alcoholicas con mayor veces.
#Hpotesis nula: No existe diferencia entre las medias poblacionales de los grupos evaluados en esta pregunta. HA: Al menos una media poblacional es diferente
str(data$C1P307)
## int [1:317] 1 1 1 1 1 1 1 1 1 1 ...
data$C1P307=factor(data$C1P307, levels = c(1:2), labels=c("Si","No"))
table(data$C1P307)
##
## Si No
## 202 115
#Metodo informal:
library(gplots)
plotmeans(data$violencia~data$C1P307, connect = F, barwidth = 3, xlab = "Respuesta", ylab = "Magnitud de violencia", main="trabaja?")
#vemos anova
anova1<-aov(data$violencia~data$C1P307)
summary(anova1)
## Df Sum Sq Mean Sq F value Pr(>F)
## data$C1P307 1 0.092 0.09239 3.253 0.0722 .
## Residuals 315 8.947 0.02840
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Vemos que el p valor es mayor a 0,05,por lo que no rechamoz la hipotesis nula, pued afirmar que hay igualdad entre los grupos
TukeyHSD(anova1
)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = data$violencia ~ data$C1P307)
##
## $`data$C1P307`
## diff lwr upr p adj
## No-Si -0.03550762 -0.07424247 0.003227224 0.0722497
plot(TukeyHSD(anova1))
str(data$C1P410)
## int [1:317] NA NA 2 NA NA 4 NA NA 1 2 ...
table(data$C1P410)
##
## 1 2 3 4
## 9 19 21 97
sum(is.na(data$C1P410))
## [1] 171
data2<-data[complete.cases(data$C1P410),]
data2$C1P410=factor(data2$C1P410, levels = c(1:4), labels = c("siempre/casi siempre","Algunas veces","rara vez","no ha acurrido"))
#informar
library(gplots)
plotmeans(data2$violencia~data2$C1P410, connect = F)
#Vemos anova
anova3<- aov(data2$violencia~data2$C1P410)
summary(anova3)
## Df Sum Sq Mean Sq F value Pr(>F)
## data2$C1P410 3 0.522 0.17391 6.097 0.000623 ***
## Residuals 142 4.050 0.02852
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#vemos que el p valor es menos a 0,05, por lo que podemos rechazamos la hipotesis nula, por lo que hay diferencas entre los grupos
#grafico
TukeyHSD(anova3)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = data2$violencia ~ data2$C1P410)
##
## $`data2$C1P410`
## diff lwr upr
## Algunas veces-siempre/casi siempre -0.241305017 -0.4189666 -0.06364343
## rara vez-siempre/casi siempre -0.211361738 -0.3862829 -0.03644060
## no ha acurrido-siempre/casi siempre -0.249472478 -0.4024608 -0.09648412
## rara vez-Algunas veces 0.029943279 -0.1090699 0.16895651
## no ha acurrido-Algunas veces -0.008167462 -0.1183160 0.10198112
## no ha acurrido-rara vez -0.038110741 -0.1437823 0.06756081
## p adj
## Algunas veces-siempre/casi siempre 0.0031037
## rara vez-siempre/casi siempre 0.0109015
## no ha acurrido-siempre/casi siempre 0.0002332
## rara vez-Algunas veces 0.9436790
## no ha acurrido-Algunas veces 0.9974501
## no ha acurrido-rara vez 0.7846782
plot(TukeyHSD(anova3))
#vemos que hay diferencia entre ’Algunas veces-siempre/casi siempre”, no
ha acurrido-siempre/casi siempre