# Se quiere ver si hay evidencia estadistica de diferencias en los salarios entre hombres y mujeres

# Cargar base de datos
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.1
db <- read_excel("C:/Clases/Nueva carpeta/Clase de econometria/cps_ch3.xlsx")

# Filtrar los datos por los años de interés
years_of_interest = c(1992, 1996, 2000, 2004, 2008)
filtered_data = db[db$year %in% years_of_interest, ]

# Verificar la estructura de los datos filtrados
table(filtered_data$year)
## 
## 1992 1996 2000 2004 2008 
## 2962 2609 2484 3629 3709
# Crear un loop para iterar sobre los años de interés
for (year in years_of_interest) {
  # Filtrar los datos por año
  year_data = filtered_data[filtered_data$year == year, ]
  
  # Separar los datos por género
  male_salaries = year_data$ahe08[year_data$a_sex == 1]
  female_salaries = year_data$ahe08[year_data$a_sex == 2]
  
  # Realizar la prueba t de Student
  t_test_result = t.test(male_salaries, female_salaries)
  
  # Imprimir los resultados
  cat("\nResultados para el año", year, ":\n")
  print(t_test_result)
}
## 
## Resultados para el año 1992 :
## 
##  Welch Two Sample t-test
## 
## data:  male_salaries and female_salaries
## t = 9.7238, df = 2929.3, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  2.576710 3.878347
## sample estimates:
## mean of x mean of y 
##  23.27382  20.04629 
## 
## 
## Resultados para el año 1996 :
## 
##  Welch Two Sample t-test
## 
## data:  male_salaries and female_salaries
## t = 9.8685, df = 2567.9, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  2.800505 4.189416
## sample estimates:
## mean of x mean of y 
##  22.47544  18.98048 
## 
## 
## Resultados para el año 2000 :
## 
##  Welch Two Sample t-test
## 
## data:  male_salaries and female_salaries
## t = 9.8372, df = 2449.6, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  3.317747 4.969763
## sample estimates:
## mean of x mean of y 
##  24.88314  20.73938 
## 
## 
## Resultados para el año 2004 :
## 
##  Welch Two Sample t-test
## 
## data:  male_salaries and female_salaries
## t = 11.514, df = 3538.1, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  3.400168 4.795749
## sample estimates:
## mean of x mean of y 
##  25.12169  21.02373 
## 
## 
## Resultados para el año 2008 :
## 
##  Welch Two Sample t-test
## 
## data:  male_salaries and female_salaries
## t = 11.592, df = 3545.4, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  3.409530 4.797722
## sample estimates:
## mean of x mean of y 
##  24.97840  20.87478
print("Si existe evidencia estadística para afirmar la existencia de diferencias en el salario de hombres y mujeres en los años señalados")
## [1] "Si existe evidencia estadística para afirmar la existencia de diferencias en el salario de hombres y mujeres en los años señalados"