Taller de estimaciones por intervalo de confianza

1. Un analista financiero está evaluando el rendimiento diario de un portafolio de acciones. La desviación estándar histórica del rendimiento diario es de 15 puntos básicos (0.15%). En una muestra aleatoria de 25 días, el rendimiento medio observado fue de 100 puntos básicos (1.00%). El analista desea calcular un intervalo de confianza del 95% para el verdadero rendimiento medio diario del portafolio.

x_bar <- 100  
sigma <- 15   
n <- 25       
z_alpha <- 1.96  

error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")
## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n")
## ( 94.12 , 105.88 ) puntos básicos

2.** Un auditor desea hacer una estimación con un intervalo de confianza del 95% del valor promedio de los gastos diarios de una pequeña empresa. El auditor ha determinado que los valores diarios de los gastos están distribuidos normalmente.**

A partir de una muestra aleatoria de 36 días, los gastos diarios muestran: - Media muestral (x¯ ) = $16,500 - Desviación estándar poblacional (σ ) = $2,000 - Tamaño de la muestra (n ) = 36 - Nivel de confianza = 95%

x_bar <- 16500  
sigma <- 2000   
n <- 36         
z_alpha <- 1.96 
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")
## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")
## ( 15846.67 , 17153.33 ) dólares

3. Un analista de relaciones internacionales está evaluando el porcentaje de países en una muestra aleatoria que han incumplido acuerdos comerciales internacionales.

En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.

El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.

n <- 85   
x <- 10   
p_hat <- x / n  

z_critico <- qnorm(0.975)  

error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)

cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")
## Proporción muestral (p̂): 0.1176
cat("Error estándar:", round(error_estandar, 4), "\n")
## Error estándar: 0.0349
## Intervalo de confianza (95%): 0.0492 a 0.1861

4. Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino.

De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años. De 141 mujeres encuestadas, 73 tenían la misma expectativa. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años.

Datos

Muestra de hombres: n1=120

Hombres con expectativa de trabajo: x1=107

Proporción muestral de hombres: p^1=x1n1

Muestra de mujeres: n2=141

Mujeres con expectativa de trabajo: x2=73

Proporción muestral de mujeres: p^2=x2n2

Nivel de confianza: 95%

Valor crítico: Zα/2=1.96

Cálculo del Intervalo de Confianza

El intervalo de confianza para la diferencia de proporciones se basa en la distribución normal estándar y se calcula como:

IC=(p1−p2)±Zα/2×p1(1−p1)n1+p2(1−p2)n2−−−−−−−−−−−−−−−−−−−−√

Donde: Zα/2=1.96 para un 95% de confianza.

p^1 y p^2 son las proporciones muestrales.

n1 y n2 son los tamaños de muestra.

n1 <- 120   
x1 <- 107   
p1_hat <- x1 / n1  
n2 <- 141   
x2 <- 73    
p2_hat <- x2 / n2  


diff_p <- p1_hat - p2_hat  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))


IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)



cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")
## Proporción de hombres (p̂1): 0.8917
cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")
## Proporción de mujeres (p̂2): 0.5177
cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")
## Diferencia de proporciones (p1 - p2): 0.3739
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.2745 a 0.4734
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}
## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.

5. ** Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 horas, con una desviación típica muestral de 1,09 horas. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 horas, con una desviación típica muestral de 1,01 horas. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales de absentismo laboral.**

Datos

Muestra de fumadores: n1=321 Media muestral: x¯1=3.01

Desviación estándar muestral: s1=1.09 Muestra de no fumadores: n2=94 Media muestral: x¯2=2.88

Desviación estándar muestral: s2=1.01 Nivel de confianza: 95% Valor crítico: Zα/2=1.96 Cálculo del Intervalo de Confianza para la Diferencia de Medias

Dado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar para calcular el intervalo de confianza:

IC=(x¯1−x¯2)±Zα/2×s21n1+s22n2−−−−−−−−√

Zα/2=1.96 para un 95% de confianza.

s21 y s22 son las varianzas muestrales.

n1 y n2 son los tamaños de muestra.

n1 <- 321   
x1_bar <- 3.01  
s1 <- 1.09  

n2 <- 94    
x2_bar <- 2.88  
s2 <- 1.01  


diff_means <- x1_bar - x2_bar  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))


IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)



cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")
## Media de fumadores (x̄1): 3.01
cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")
## Media de no fumadores (x̄2): 2.88
cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")
## Diferencia de medias (x̄1 - x̄2): 0.13
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): -0.1064 a 0.3664
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
}
## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.