Utilice el la base de datos wagebase que tiene información de una muestra de trabajadores con las siguientes variables:
wage - salario por hora en dólares educ - años de educación de la persona exper - años de experiencia laboral tenure - años de antigüedad en el empleo actual female - 1 si es mujer, 0 si es hombre married - 1 si está casado, 0 si no numdep - cantidad de personas dependientes económicamente
library(readxl)
wagebase <- read_excel("C:/Users/juan3/Downloads/wagebase.xlsx")
View(wagebase)
attach(wagebase)
wagebase$SalarioCOP <- wagebase$wage*8*30*4500.50
Salario <- wagebase$wage*8*30*4500.50
En cada uno de los ejercicios siguientes: • Identifique la población, la variable y sus unidades, el parámetro. • Construya el intervalo de confianza del 95% para el parámetro • Comente en términos sencillos la afirmación
# x : Salario mensual en pesos
# Parametro : Media
#Unidades : Pesos Colombianos
#Intervalo de confianza del 95%
xbarraSal <- mean(Salario) #Media de la muestra #xbarra
Desv <- sd(Salario) #Desviación de la muestra = #s
n <- length(Salario)
# Distribución T
Alfa <- 0.95
Alfa_2 <- (1-Alfa)/2
T <- qt(p = Alfa_2, df = n-1, lower.tail = FALSE)
#Error de estimación:
E <- T*(Desv/sqrt(n))
#INTERVALO DE CONFIANZA:
IC <- c(xbarraSal - E , xbarraSal + E)
IC
## [1] 6026819 6710178
El salario medio de las personas está en un intervalo de mas de $6’000.000 hasta $6’710.178, por lo tanto sí es mayor a $5´000.000
# x : Trabajadores Casados
# Parámetro : Proporción (pi)
# Unidades : Trabajadores
#Datos:
EstadoCivil <- wagebase$married
n3 <- length(EstadoCivil)
Casados <- sum(EstadoCivil)
Pgorro <- Casados/n3
Alfa <- 0.95
Alfa_2 <- (1-Alfa_2)/2
# Z - Distribución Normal Estandar
Z <- qnorm(Alfa_2, lower.tail = FALSE)
#Error de Estimación
E3 <- Z*sqrt(Pgorro*(1-Pgorro)/n3)
#Intervalo de Confianza
IC3 <- c(Pgorro - E3, Pgorro + E3)
IC3
## [1] 0.6076981 0.6090320
Es cierto, mas de la mitad de los trabajdores están casados, ya que la proporción de los trabajadores que están casados tienen un intervalo de (0.5944258, 0.6223042), ósea mas del 50%
# x: Salarios de las personas
# Parámetro: Varianza de la población
# Intervalo del 95%
#Datos: Salarios de las personas con 12 años o menos de educación = Base1
Base1 <- subset(wagebase, wagebase$educ <= 12) # Nueva base con Salario y nivel edu < 12
M1 <- Base1$salario
## Warning: Unknown or uninitialised column: `salario`.
n4 <- length(M1)
s4 <- sd(M1)
gl1 <- n4-1
#Datos: Salarios de las personas con mas de 12 años = Base2
Base2 <- subset(wagebase, wagebase$educ > 12)
M2 <- Base2$salario
## Warning: Unknown or uninitialised column: `salario`.
n5 <- length(M2)
s5 <- sd(M2)
gl2 <- n5-1
# f
Alfa2 <- 0.95
Alfa_21 <- (1-Alfa2)/2
f <- qf(Alfa_21, df1 = gl1, df2 = gl2, lower.tail = FALSE)
## Warning in qf(Alfa_21, df1 = gl1, df2 = gl2, lower.tail = FALSE): NaNs produced
f2 <- qf(Alfa_21, df1 = gl2, df2 = gl1, lower.tail = FALSE)
## Warning in qf(Alfa_21, df1 = gl2, df2 = gl1, lower.tail = FALSE): NaNs produced
#Error de estimación = Intervalo de confianza
ICE <- c(s4^2/s5^2 * (1/f) , s4^2/s5^2 * f2)
ICE
## [1] NA NA
La varianza de los salarios de las personas con 12 años o menos de educación no es igual a la varianza de los salarios de las personas con más de 12 años de educación, ya que el coeficiente de las varianzas de las poblaciones tienen un intervalo de (0.3318577, 0.5443808) y este intervalo no contiene el numero 1.
# x: Salario de las personas
# Parámetro: Media
# Intervalo del 95%
#Datos: Salarios de las personas con 12 años o menos de educación = Base1
Base1 <- subset(wagebase, wagebase$educ <= 12) # Nueva base con Salario y nivel edu < 12
M1 <- Base1$salario
## Warning: Unknown or uninitialised column: `salario`.
n4 <- length(M1)
s4 <- sd(M1)
gl5 <- n4+n5-2
XbarraM1 <- mean(M1)
## Warning in mean.default(M1): argument is not numeric or logical: returning NA
#Datos: Salarios de las personas con mas de 12 años = Base2
Base2 <- subset(wagebase, wagebase$educ > 12)
M2 <- Base2$salario
## Warning: Unknown or uninitialised column: `salario`.
n5 <- length(M2)
s5 <- sd(M2)
gl5 <- n4+n5-2
XbarraM2 <- mean(M2)
## Warning in mean.default(M2): argument is not numeric or logical: returning NA
# t :
Alfa2 <- 0.95
Alfa_21 <- (1-Alfa2)/2
T1 <- qt(Alfa_21, df = gl5, lower.tail = FALSE)
## Warning in qt(Alfa_21, df = gl5, lower.tail = FALSE): NaNs produced
#Error de Estimación
E5 <- T1 *sqrt(s4^2/n4 + s5^2/n5)
#Intervalo de Confianza
IC5 <- c(XbarraM1 - XbarraM2 - E5, XbarraM1 - XbarraM2 + E5)
IC5
## [1] NA NA
El salario medio de las personas con 12 años o menos de educación sí es menor que el salario medio de las personas con más de 12 años de educación, ya que el intervalo de las medias de estas dos muestras está entre (-3418734, -1996860), lo que quiere decir que la resta de las medias son menor a cero y la muestra de la media 1 es menor a la muestra de la media 2.
# x: Salario de las personas casadas
# Parámetro: Proporción (pi)
# Intervalo del 95%
#Datos: Salarios de las personas con 12 años o menos de educación = Base1
Base1 <- subset(wagebase, wagebase$educ <= 12) # Nueva base con Salario y nivel edu < 12
M3 <- Base1$married
Casa_12 <- sum(M3)
n6 <- length(M3)
pgorro6 <- Casa_12/n6
#Datos: Salarios de las personas con mas de 12 años = Base2
Base2 <- subset(wagebase, wagebase$educ > 12)
M4 <- Base2$married
Casa_22 <- sum(M4)
n7 <- length(M4)
pgorro7 <- Casa_22/n7
# ee
ee <- sqrt(pgorro6*(1-pgorro6)/n6 + pgorro7*(1-pgorro7)/n7)
# Z
Alfa2 <- 0.95
Alfa_21 <- (1-Alfa2)/2
Z6 <- qnorm(Alfa_21, lower.tail = FALSE)
# Error de Estimación:
E6 <- Z6*ee
#Intervalo de Confianza
IC6 <- c(pgorro6 - pgorro7 - E6, pgorro6 - pgorro7 + E6 )
IC6
## [1] -0.14778726 0.02093953
La proporción de personas casadas dentro del grupo de trabajadores con más de 12 años de educación es igual que la proporción de personas casadas dentro del grupo de trabajadores con 12 años o menos de educación, ya que el intervalo de estas proporciones es de (-0.14778726, 0.02093953) y este incluye el cero.