library(readxl)
library(dplyr)
library(DataExplorer) 

#1. ¿Existe diferencia entre la escolaridad de la víctima por sexo?

datos <- read.csv("C:/Users/USUARIO/Downloads/datos", sep="")
attach(datos)
escolaridad_sexo <- datos %>%
  group_by(Sexo) %>%
  summarise(
    n = n(),
    Media_Escolaridad = mean(Escolaridad, na.rm = TRUE),
    Desv_Escolaridad = sd(Escolaridad, na.rm = TRUE),
    Varianza = var(Escolaridad)
    )
print(escolaridad_sexo)
## # A tibble: 2 × 5
##   Sexo      n Media_Escolaridad Desv_Escolaridad Varianza
##   <chr> <int>             <dbl>            <dbl>    <dbl>
## 1 H       148              7.84             1.88     3.52
## 2 M        52              7.98             1.90     3.63
resultado <- t.test(Escolaridad ~ Sexo, data = datos, conf.level = 0.95)
print(resultado)
## 
##  Welch Two Sample t-test
## 
## data:  Escolaridad by Sexo
## t = -0.44526, df = 88.153, p-value = 0.6572
## alternative hypothesis: true difference in means between group H and group M is not equal to 0
## 95 percent confidence interval:
##  -0.7439411  0.4715919
## sample estimates:
## mean in group H mean in group M 
##        7.844595        7.980769

Solución : El intervalo de confianza [-0.7439411 , 0.4715919] contiene el valor cero. Esto significa que no hay evidencia suficiente, con un 95% de confiabilidad, para afirmar que existe una diferencia significativa en la escolaridad promedio de la víctima por sexo.

#2. ¿Existe diferencia entre la escolaridad de la víctima por agresor?

attach(datos)
escolaridad_agresor <- datos %>%
  group_by(Agresor) %>%
  summarise(
    n = n(),
    Media_Escolaridad = mean(Escolaridad, na.rm = TRUE),
    Desv_Escolaridad = sd(Escolaridad, na.rm = TRUE),
    Varianza = var(Escolaridad)
    )
print(escolaridad_agresor)
## # A tibble: 2 × 5
##   Agresor         n Media_Escolaridad Desv_Escolaridad Varianza
##   <chr>       <int>             <dbl>            <dbl>    <dbl>
## 1 Familiar       77              7.96             2.01     4.04
## 2 No Familiar   123              7.83             1.80     3.24
resultado <- t.test(Escolaridad ~ Agresor, data = datos, conf.level = 0.95)
print(resultado)
## 
##  Welch Two Sample t-test
## 
## data:  Escolaridad by Agresor
## t = 0.46944, df = 148.25, p-value = 0.6394
## alternative hypothesis: true difference in means between group Familiar and group No Familiar is not equal to 0
## 95 percent confidence interval:
##  -0.4229146  0.6864559
## sample estimates:
##    mean in group Familiar mean in group No Familiar 
##                  7.961039                  7.829268

Solución: Dado que el intervalo [-0.4229146 , 0.6864559] contiene el valor cero, no hay evidencia suficiente (con un 95% de confianza) para afirmar que existe una diferencia significativa en la escolaridad de la victima por agresor.

#3. Con una confiabilidad del 95%, determine la edad promedio y los años de escolaridad de la víctima

attach(datos)
ic_edad <- t.test(Edad, conf.level = 0.95)
ic_escolaridad<- t.test(Escolaridad, conf.level = 0.95)
print(ic_edad)
## 
##  One Sample t-test
## 
## data:  Edad
## t = 134.94, df = 199, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  43.11067 44.38933
## sample estimates:
## mean of x 
##     43.75
print(ic_escolaridad)
## 
##  One Sample t-test
## 
## data:  Escolaridad
## t = 59.286, df = 199, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  7.617898 8.142102
## sample estimates:
## mean of x 
##      7.88

Solución: Con un 95% de confiabilidad, la edad promedio de la población de víctimas se encuentra entre 43.11067 y 44.38933 años.

Con un 95% de confiabilidad, los años de escolaridad promedio de la población de víctimas se encuentran entre 7.617898 y 8.142102 años.

#4. Con una confiabilidad del 92%, determine la variabilidad en los años de escolaridad y la edad de la víctima.

attach(datos)
nivel_conf <- 0.92
alpha <- 1 - nivel_conf
alpha
## [1] 0.08
df <- 199
chi2_sup<- qchisq(1 - (alpha / 2), df)
chi2_inf <- qchisq(alpha / 2, df)
print(chi2_inf)
## [1] 165.488
print(chi2_sup)
## [1] 235.2635
sedad <- var(Edad)
lim_inf_edad <- ((df) * sedad) / chi2_sup
lim_sup_edad <- ((df) * sedad) / chi2_inf
print(lim_inf_edad)
## [1] 17.78219
print(lim_sup_edad)
## [1] 25.27978
sescolaridad <- var(Escolaridad)
lim_inf_escolaridad <- ((df) * sescolaridad) / chi2_sup
lim_sup_escolaridad <- ((df) * sescolaridad) / chi2_inf
print(lim_inf_escolaridad)
## [1] 2.988649
print(lim_sup_escolaridad)
## [1] 4.248767

Solución: Con un 92% de confiabilidad, se estima que la variabilidad poblacional de la escolaridad se encuentra entre 2.988649 y 4.248767 años.

Con un 92% de confiabilidad, se estima que la variabilidad poblacional de la edad se encuentra entre 17.78219 y 25.27978 años.

#5. ¿Existe diferencia entre la edad de la víctima por sexo?

attach(datos)
edad_sexo <- datos %>%
  group_by(Sexo) %>%
  summarise(
    n = n(),
    Media_Edad = mean(Edad, na.rm = TRUE),
    Desv_Edad= sd(Edad, na.rm = TRUE),
    Varianza = var(Edad)
    )
print(edad_sexo)
## # A tibble: 2 × 5
##   Sexo      n Media_Edad Desv_Edad Varianza
##   <chr> <int>      <dbl>     <dbl>    <dbl>
## 1 H       148       44.0      4.47     20.0
## 2 M        52       43.1      4.87     23.7
resultado <- t.test(Edad ~ Sexo, data = datos, conf.level = 0.95)
print(resultado)
## 
##  Welch Two Sample t-test
## 
## data:  Edad by Sexo
## t = 1.217, df = 83.197, p-value = 0.2271
## alternative hypothesis: true difference in means between group H and group M is not equal to 0
## 95 percent confidence interval:
##  -0.593436  2.464538
## sample estimates:
## mean in group H mean in group M 
##        43.99324        43.05769

Solución: Dado que el intervalo [-0.593436 , 2.464538] contiene el valor cero, no hay evidencia suficiente (con un 95% de confianza) para afirmar que existe una diferencia significativa entre la edad de la víctima por sexo

#6. ¿Existe diferencia entre la edad de la víctima por agresor?

attach(datos)
edad_agresor <- datos %>%
  group_by(Agresor) %>%
  summarise(
    n = n(),
    Media_edad = mean(Edad, na.rm = TRUE),
    Des_edad= sd(Edad, na.rm = TRUE),
    Varianza = var(Edad)
    )
print(edad_agresor)
## # A tibble: 2 × 5
##   Agresor         n Media_edad Des_edad Varianza
##   <chr>       <int>      <dbl>    <dbl>    <dbl>
## 1 Familiar       77       42.9     4.81     23.1
## 2 No Familiar   123       44.3     4.39     19.2
resultado <- t.test(Edad ~ Agresor, data = datos, conf.level = 0.95)
print(resultado)
## 
##  Welch Two Sample t-test
## 
## data:  Edad by Agresor
## t = -1.9301, df = 150.43, p-value = 0.05548
## alternative hypothesis: true difference in means between group Familiar and group No Familiar is not equal to 0
## 95 percent confidence interval:
##  -2.63889180  0.03093065
## sample estimates:
##    mean in group Familiar mean in group No Familiar 
##                  42.94805                  44.25203

Solución: Dado que el intervalo [-2.63889180 , 0.03093065] contiene el valor cero, no hay evidencia suficiente (con un 95% de confianza) para afirmar que existe una diferencia significativa entre la edad de la víctima por agresor