Utilice el la base de datos wagebase que tiene información de una muestra de trabajadores con las siguientes variables:

wage - salario por hora en dólares educ - años de educación de la persona exper - años de experiencia laboral tenure - años de antigüedad en el empleo actual female - 1 si es mujer, 0 si es hombre married - 1 si está casado, 0 si no numdep - cantidad de personas dependientes económicamente

library(readxl)
wagebase <- read_excel("C:/Users/juan3/Downloads/wagebase.xlsx")
View(wagebase)
  1. Genere la variable salario que indique el salario en pesos colombianos de una persona que trabaja 8 horas diarias durante 30 días por mes recibiendo la remuneración por hora dada por wage. Utilice una tasa de cambio para el 4 de octubre de 2022.
attach(wagebase)
wagebase$SalarioCOP <- wagebase$wage*8*30*4500.50
Salario <- wagebase$wage*8*30*4500.50

En cada uno de los ejercicios siguientes: • Identifique la población, la variable y sus unidades, el parámetro. • Construya el intervalo de confianza del 95% para el parámetro • Comente en términos sencillos la afirmación

  1. El salario medio de las personas es mayor a $5.000.000
# x : Salario mensual en pesos 
# Parametro : Media 
#Unidades : Pesos Colombianos
#Intervalo de confianza del 95%

xbarraSal <- mean(Salario)   #Media de la muestra #xbarra
Desv <- sd(Salario)             #Desviación de la muestra = #s
n <- length(Salario)

# Distribución T 

Alfa <- 0.95 
Alfa_2 <- (1-Alfa)/2

T <- qt(p = Alfa_2, df = n-1, lower.tail = FALSE)

#Error de estimación:

E <- T*(Desv/sqrt(n))

#INTERVALO DE CONFIANZA:

IC <- c(xbarraSal  - E ,  xbarraSal  + E)
IC
## [1] 6026819 6710178

El salario medio de las personas está en un intervalo de mas de $6’000.000 hasta $6’710.178, por lo tanto sí es mayor a $5´000.000

  1. Más de la mitad de los trabajadores están casados.
# x : Trabajadores Casados 
# Parámetro : Proporción (pi)
# Unidades : Trabajadores 

#Datos:

EstadoCivil <- wagebase$married
n3 <- length(EstadoCivil)
Casados <- sum(EstadoCivil)
Pgorro <- Casados/n3

Alfa <- 0.95 
Alfa_2 <- (1-Alfa_2)/2


# Z - Distribución Normal Estandar
 Z <- qnorm(Alfa_2, lower.tail = FALSE)
 
#Error de Estimación 
 
 E3 <- Z*sqrt(Pgorro*(1-Pgorro)/n3)
 
#Intervalo de Confianza 
 
 IC3 <- c(Pgorro - E3, Pgorro + E3)
 IC3
## [1] 0.6076981 0.6090320

Es cierto, mas de la mitad de los trabajdores están casados, ya que la proporción de los trabajadores que están casados tienen un intervalo de (0.5944258, 0.6223042), ósea mas del 50%

  1. La varianza de los salarios de las personas con 12 años o menos de educación es igual a la varianza de los salarios de las personas con más de 12 años de educación.
# x: Salarios de las personas 
# Parámetro: Varianza de la población 
# Intervalo del 95% 

#Datos: Salarios de las personas con 12 años o menos de educación = Base1  

Base1  <- subset(wagebase, wagebase$educ <= 12) # Nueva base con Salario y nivel edu < 12 

M1 <- Base1$salario
## Warning: Unknown or uninitialised column: `salario`.
n4 <- length(M1)
s4 <- sd(M1)
gl1 <- n4-1

#Datos: Salarios de las personas con mas de 12 años = Base2

Base2 <- subset(wagebase, wagebase$educ > 12)

M2 <- Base2$salario
## Warning: Unknown or uninitialised column: `salario`.
n5 <- length(M2)
s5 <- sd(M2) 
gl2 <- n5-1 

# f 

Alfa2 <- 0.95 
Alfa_21 <- (1-Alfa2)/2

f <- qf(Alfa_21, df1 = gl1, df2 = gl2, lower.tail = FALSE)
## Warning in qf(Alfa_21, df1 = gl1, df2 = gl2, lower.tail = FALSE): NaNs produced
f2 <- qf(Alfa_21, df1 = gl2, df2 = gl1, lower.tail = FALSE)
## Warning in qf(Alfa_21, df1 = gl2, df2 = gl1, lower.tail = FALSE): NaNs produced
#Error de estimación = Intervalo de confianza 

ICE <- c(s4^2/s5^2 * (1/f) , s4^2/s5^2 * f2)
ICE
## [1] NA NA

La varianza de los salarios de las personas con 12 años o menos de educación no es igual a la varianza de los salarios de las personas con más de 12 años de educación, ya que el coeficiente de las varianzas de las poblaciones tienen un intervalo de (0.3318577, 0.5443808) y este intervalo no contiene el numero 1.

  1. El salario medio de las personas con 12 años o menos de educación es menor que el salario medio de las personas con más de 12 años de educación.
# x: Salario de las personas
# Parámetro: Media 
# Intervalo del 95% 

#Datos: Salarios de las personas con 12 años o menos de educación = Base1  

Base1  <- subset(wagebase, wagebase$educ <= 12) # Nueva base con Salario y nivel edu < 12 

M1 <- Base1$salario
## Warning: Unknown or uninitialised column: `salario`.
n4 <- length(M1)
s4 <- sd(M1)
gl5 <- n4+n5-2
XbarraM1 <- mean(M1)
## Warning in mean.default(M1): argument is not numeric or logical: returning NA
#Datos: Salarios de las personas con mas de 12 años = Base2

Base2 <- subset(wagebase, wagebase$educ > 12)

M2 <- Base2$salario
## Warning: Unknown or uninitialised column: `salario`.
n5 <- length(M2)
s5 <- sd(M2) 
gl5 <- n4+n5-2
XbarraM2 <- mean(M2)
## Warning in mean.default(M2): argument is not numeric or logical: returning NA
# t :
Alfa2 <- 0.95 
Alfa_21 <- (1-Alfa2)/2

T1 <- qt(Alfa_21, df = gl5, lower.tail = FALSE)
## Warning in qt(Alfa_21, df = gl5, lower.tail = FALSE): NaNs produced
#Error de Estimación 

E5 <- T1 *sqrt(s4^2/n4 + s5^2/n5)

#Intervalo de Confianza 

IC5 <- c(XbarraM1 - XbarraM2 - E5, XbarraM1 - XbarraM2 + E5)
IC5
## [1] NA NA

El salario medio de las personas con 12 años o menos de educación sí es menor que el salario medio de las personas con más de 12 años de educación, ya que el intervalo de las medias de estas dos muestras está entre (-3418734, -1996860), lo que quiere decir que la resta de las medias son menor a cero y la muestra de la media 1 es menor a la muestra de la media 2.

  1. La proporción de personas casadas dentro del grupo de trabajadores con más de 12 años de educación es mayor que la proporción de personas casadas dentro del grupo de trabajadores con 12 años o menos de educación.
# x: Salario de las personas casadas
# Parámetro: Proporción (pi)
# Intervalo del 95% 

#Datos: Salarios de las personas con 12 años o menos de educación = Base1  

Base1  <- subset(wagebase, wagebase$educ <= 12) # Nueva base con Salario y nivel edu < 12 

M3 <- Base1$married
Casa_12 <- sum(M3)
n6 <- length(M3)
pgorro6 <- Casa_12/n6


#Datos: Salarios de las personas con mas de 12 años = Base2

Base2 <- subset(wagebase, wagebase$educ > 12)

M4 <- Base2$married
Casa_22 <- sum(M4)
n7 <- length(M4)
pgorro7 <- Casa_22/n7

# ee

ee <- sqrt(pgorro6*(1-pgorro6)/n6 + pgorro7*(1-pgorro7)/n7)

# Z 
Alfa2 <- 0.95 
Alfa_21 <- (1-Alfa2)/2

Z6 <- qnorm(Alfa_21, lower.tail = FALSE)

# Error de Estimación:

E6 <- Z6*ee

#Intervalo de Confianza 

IC6 <- c(pgorro6 - pgorro7 - E6, pgorro6 - pgorro7 + E6 )
IC6
## [1] -0.14778726  0.02093953

La proporción de personas casadas dentro del grupo de trabajadores con más de 12 años de educación es igual que la proporción de personas casadas dentro del grupo de trabajadores con 12 años o menos de educación, ya que el intervalo de estas proporciones es de (-0.14778726, 0.02093953) y este incluye el cero.