# Se quiere ver si hay evidencia estadistica de diferencias en los salarios entre hombres y mujeres
# Cargar base de datos
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.1
db <- read_excel("C:/Clases/Nueva carpeta/Clase de econometria/cps_ch3.xlsx")
# Filtrar los datos por los años de interés
years_of_interest = c(1992, 1996, 2000, 2004, 2008)
filtered_data = db[db$year %in% years_of_interest, ]
# Verificar la estructura de los datos filtrados
table(filtered_data$year)
##
## 1992 1996 2000 2004 2008
## 2962 2609 2484 3629 3709
# Crear un loop para iterar sobre los años de interés
for (year in years_of_interest) {
# Filtrar los datos por año
year_data = filtered_data[filtered_data$year == year, ]
# Separar los datos por género
male_salaries = year_data$ahe08[year_data$a_sex == 1]
female_salaries = year_data$ahe08[year_data$a_sex == 2]
# Realizar la prueba t de Student
t_test_result = t.test(male_salaries, female_salaries)
# Imprimir los resultados
cat("\nResultados para el año", year, ":\n")
print(t_test_result)
}
##
## Resultados para el año 1992 :
##
## Welch Two Sample t-test
##
## data: male_salaries and female_salaries
## t = 9.7238, df = 2929.3, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 2.576710 3.878347
## sample estimates:
## mean of x mean of y
## 23.27382 20.04629
##
##
## Resultados para el año 1996 :
##
## Welch Two Sample t-test
##
## data: male_salaries and female_salaries
## t = 9.8685, df = 2567.9, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 2.800505 4.189416
## sample estimates:
## mean of x mean of y
## 22.47544 18.98048
##
##
## Resultados para el año 2000 :
##
## Welch Two Sample t-test
##
## data: male_salaries and female_salaries
## t = 9.8372, df = 2449.6, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.317747 4.969763
## sample estimates:
## mean of x mean of y
## 24.88314 20.73938
##
##
## Resultados para el año 2004 :
##
## Welch Two Sample t-test
##
## data: male_salaries and female_salaries
## t = 11.514, df = 3538.1, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.400168 4.795749
## sample estimates:
## mean of x mean of y
## 25.12169 21.02373
##
##
## Resultados para el año 2008 :
##
## Welch Two Sample t-test
##
## data: male_salaries and female_salaries
## t = 11.592, df = 3545.4, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.409530 4.797722
## sample estimates:
## mean of x mean of y
## 24.97840 20.87478
print("Si existe evidencia estadística para afirmar la existencia de diferencias en el salario de hombres y mujeres en los años señalados")
## [1] "Si existe evidencia estadística para afirmar la existencia de diferencias en el salario de hombres y mujeres en los años señalados"