library(readxl)
library(dplyr)
library(DataExplorer)
#1. ¿Existe diferencia entre la escolaridad de la víctima por sexo?
datos <- read.csv("C:/Users/USUARIO/Downloads/datos", sep="")
attach(datos)
escolaridad_sexo <- datos %>%
group_by(Sexo) %>%
summarise(
n = n(),
Media_Escolaridad = mean(Escolaridad, na.rm = TRUE),
Desv_Escolaridad = sd(Escolaridad, na.rm = TRUE),
Varianza = var(Escolaridad)
)
print(escolaridad_sexo)
## # A tibble: 2 × 5
## Sexo n Media_Escolaridad Desv_Escolaridad Varianza
## <chr> <int> <dbl> <dbl> <dbl>
## 1 H 148 7.84 1.88 3.52
## 2 M 52 7.98 1.90 3.63
resultado <- t.test(Escolaridad ~ Sexo, data = datos, conf.level = 0.95)
print(resultado)
##
## Welch Two Sample t-test
##
## data: Escolaridad by Sexo
## t = -0.44526, df = 88.153, p-value = 0.6572
## alternative hypothesis: true difference in means between group H and group M is not equal to 0
## 95 percent confidence interval:
## -0.7439411 0.4715919
## sample estimates:
## mean in group H mean in group M
## 7.844595 7.980769
Solución : El intervalo de confianza [-0.7439411 , 0.4715919] contiene el valor cero. Esto significa que no hay evidencia suficiente, con un 95% de confiabilidad, para afirmar que existe una diferencia significativa en la escolaridad promedio de la víctima por sexo.
#2. ¿Existe diferencia entre la escolaridad de la víctima por agresor?
attach(datos)
escolaridad_agresor <- datos %>%
group_by(Agresor) %>%
summarise(
n = n(),
Media_Escolaridad = mean(Escolaridad, na.rm = TRUE),
Desv_Escolaridad = sd(Escolaridad, na.rm = TRUE),
Varianza = var(Escolaridad)
)
print(escolaridad_agresor)
## # A tibble: 2 × 5
## Agresor n Media_Escolaridad Desv_Escolaridad Varianza
## <chr> <int> <dbl> <dbl> <dbl>
## 1 Familiar 77 7.96 2.01 4.04
## 2 No Familiar 123 7.83 1.80 3.24
resultado <- t.test(Escolaridad ~ Agresor, data = datos, conf.level = 0.95)
print(resultado)
##
## Welch Two Sample t-test
##
## data: Escolaridad by Agresor
## t = 0.46944, df = 148.25, p-value = 0.6394
## alternative hypothesis: true difference in means between group Familiar and group No Familiar is not equal to 0
## 95 percent confidence interval:
## -0.4229146 0.6864559
## sample estimates:
## mean in group Familiar mean in group No Familiar
## 7.961039 7.829268
Solución: Dado que el intervalo [-0.4229146 , 0.6864559] contiene el valor cero, no hay evidencia suficiente (con un 95% de confianza) para afirmar que existe una diferencia significativa en la escolaridad de la victima por agresor.
#3. Con una confiabilidad del 95%, determine la edad promedio y los años de escolaridad de la víctima
attach(datos)
ic_edad <- t.test(Edad, conf.level = 0.95)
ic_escolaridad<- t.test(Escolaridad, conf.level = 0.95)
print(ic_edad)
##
## One Sample t-test
##
## data: Edad
## t = 134.94, df = 199, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 43.11067 44.38933
## sample estimates:
## mean of x
## 43.75
print(ic_escolaridad)
##
## One Sample t-test
##
## data: Escolaridad
## t = 59.286, df = 199, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 7.617898 8.142102
## sample estimates:
## mean of x
## 7.88
Solución: Con un 95% de confiabilidad, la edad promedio de la población de víctimas se encuentra entre 43.11067 y 44.38933 años.
Con un 95% de confiabilidad, los años de escolaridad promedio de la población de víctimas se encuentran entre 7.617898 y 8.142102 años.
#4. Con una confiabilidad del 92%, determine la variabilidad en los años de escolaridad y la edad de la víctima.
attach(datos)
nivel_conf <- 0.92
alpha <- 1 - nivel_conf
alpha
## [1] 0.08
df <- 199
chi2_sup<- qchisq(1 - (alpha / 2), df)
chi2_inf <- qchisq(alpha / 2, df)
print(chi2_inf)
## [1] 165.488
print(chi2_sup)
## [1] 235.2635
sedad <- var(Edad)
lim_inf_edad <- ((df) * sedad) / chi2_sup
lim_sup_edad <- ((df) * sedad) / chi2_inf
print(lim_inf_edad)
## [1] 17.78219
print(lim_sup_edad)
## [1] 25.27978
sescolaridad <- var(Escolaridad)
lim_inf_escolaridad <- ((df) * sescolaridad) / chi2_sup
lim_sup_escolaridad <- ((df) * sescolaridad) / chi2_inf
print(lim_inf_escolaridad)
## [1] 2.988649
print(lim_sup_escolaridad)
## [1] 4.248767
Solución: Con un 92% de confiabilidad, se estima que la variabilidad poblacional de la escolaridad se encuentra entre 2.988649 y 4.248767 años.
Con un 92% de confiabilidad, se estima que la variabilidad poblacional de la edad se encuentra entre 17.78219 y 25.27978 años.
#5. ¿Existe diferencia entre la edad de la víctima por sexo?
attach(datos)
edad_sexo <- datos %>%
group_by(Sexo) %>%
summarise(
n = n(),
Media_Edad = mean(Edad, na.rm = TRUE),
Desv_Edad= sd(Edad, na.rm = TRUE),
Varianza = var(Edad)
)
print(edad_sexo)
## # A tibble: 2 × 5
## Sexo n Media_Edad Desv_Edad Varianza
## <chr> <int> <dbl> <dbl> <dbl>
## 1 H 148 44.0 4.47 20.0
## 2 M 52 43.1 4.87 23.7
resultado <- t.test(Edad ~ Sexo, data = datos, conf.level = 0.95)
print(resultado)
##
## Welch Two Sample t-test
##
## data: Edad by Sexo
## t = 1.217, df = 83.197, p-value = 0.2271
## alternative hypothesis: true difference in means between group H and group M is not equal to 0
## 95 percent confidence interval:
## -0.593436 2.464538
## sample estimates:
## mean in group H mean in group M
## 43.99324 43.05769
Solución: Dado que el intervalo [-0.593436 , 2.464538] contiene el valor cero, no hay evidencia suficiente (con un 95% de confianza) para afirmar que existe una diferencia significativa entre la edad de la víctima por sexo
#6. ¿Existe diferencia entre la edad de la víctima por agresor?
attach(datos)
edad_agresor <- datos %>%
group_by(Agresor) %>%
summarise(
n = n(),
Media_edad = mean(Edad, na.rm = TRUE),
Des_edad= sd(Edad, na.rm = TRUE),
Varianza = var(Edad)
)
print(edad_agresor)
## # A tibble: 2 × 5
## Agresor n Media_edad Des_edad Varianza
## <chr> <int> <dbl> <dbl> <dbl>
## 1 Familiar 77 42.9 4.81 23.1
## 2 No Familiar 123 44.3 4.39 19.2
resultado <- t.test(Edad ~ Agresor, data = datos, conf.level = 0.95)
print(resultado)
##
## Welch Two Sample t-test
##
## data: Edad by Agresor
## t = -1.9301, df = 150.43, p-value = 0.05548
## alternative hypothesis: true difference in means between group Familiar and group No Familiar is not equal to 0
## 95 percent confidence interval:
## -2.63889180 0.03093065
## sample estimates:
## mean in group Familiar mean in group No Familiar
## 42.94805 44.25203
Solución: Dado que el intervalo [-2.63889180 , 0.03093065] contiene el valor cero, no hay evidencia suficiente (con un 95% de confianza) para afirmar que existe una diferencia significativa entre la edad de la víctima por agresor