Taller de Estimaciones por Intervalo de Confianza

Intervalo de confianza para la media

1. Un analista financiero está evaluando el rendimiento diario de un portafolio de acciones. La desviación estándar histórica del rendimiento diario es de 15 puntos básicos (0.15%). En una muestra aleatoria de 25 días, el rendimiento medio observado fue de 100 puntos básicos (1.00%). El analista desea calcular un intervalo de confianza del 95% para el verdadero rendimiento medio diario del portafolio.

x_bar <- 100  
sigma <- 15   
n <- 25       
z_alpha <- 1.96  

error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")
## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n")
## ( 94.12 , 105.88 ) puntos básicos

Conclusión: Con un 95% de confianza, el rendimiento promedio real del portafolio está entre 94.12 y 105.88 puntos básicos. Esto significa que, aunque en la muestra se obtuvo un promedio de 100, el valor verdadero probablemente se encuentra dentro de ese rango. Además, como el intervalo no es muy amplio, la estimación es bastante confiable.

2. Un auditor desea hacer una estimación con un intervalo de confianza del 95% del valor promedio de los gastos diarios de una pequeña empresa. El auditor ha determinado que los valores diarios de los gastos están distribuidos normalmente.

A partir de una muestra aleatoria de 36 días, los gastos diarios muestran: - Media muestral (x¯ ) = $16,500 - Desviación estándar poblacional (σ ) = $2,000 - Tamaño de la muestra (n ) = 36 - Nivel de confianza = 95%

x_bar <- 16500  
sigma <- 2000   
n <- 36         
z_alpha <- 1.96 
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")
## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")
## ( 15846.67 , 17153.33 ) dólares

Conclusión: Con un 95% de confianza, el gasto promedio diario de la empresa está entre $15,846.67 y $17,153.33. Esto significa que, aunque la media de la muestra fue $16,500, el valor real probablemente se encuentra dentro de ese rango. Como el intervalo es relativamente pequeño, la estimación es bastante precisa.

Intervalo de confianza para la Proporción

3. Un analista de relaciones internacionales está evaluando el porcentaje de países en una muestra aleatoria que han incumplido acuerdos comerciales internacionales.

En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.

El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.

n <- 85   
x <- 10   
p_hat <- x / n  

z_critico <- qnorm(0.975)  

error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)

cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")
## Proporción muestral (p̂): 0.1176
cat("Error estándar:", round(error_estandar, 4), "\n")
## Error estándar: 0.0349
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.0492 a 0.1861

Conclusión: Con un 95% de confianza, se puede afirmar que la proporción real de países que han incumplido acuerdos comerciales está entre 4.92% y 18.61%. Esto indica que la proporción observada en la muestra (11.76%) es una estimación confiable y que el porcentaje de incumplimiento puede variar dentro de ese rango en la población total, lo cual es útil para el análisis de riesgos en relaciones internacionales.

Intervalo de confianza para la dif de Porporciones

4. Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino.

De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años. De 141 mujeres encuestadas, 73 tenían la misma expectativa. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años.

\[\begin{align*} \text{Muestra de hombres:} \quad & n_1 = 120 \\ \text{Hombres con expectativa de trabajo:} \quad & x_1 = 107 \\ \text{Proporción muestral de hombres:} \quad & \hat{p}_1 = \frac{x_1}{n_1} \\[6pt] \text{Muestra de mujeres:} \quad & n_2 = 141 \\ \text{Mujeres con expectativa de trabajo:} \quad & x_2 = 73 \\ \text{Proporción muestral de mujeres:} \quad & \hat{p}_2 = \frac{x_2}{n_2} \\[6pt] \text{Nivel de confianza:} \quad & 95\% \\ \text{Valor crítico:} \quad & Z_{\alpha/2} = 1.96 \end{align*}\]

El intervalo de confianza para la diferencia de proporciones se basa en la distribución normal estándar y se calcula como:

\[ IC = (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{ \frac{\hat{p}_1 (1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2 (1 - \hat{p}_2)}{n_2} } \]

\[\begin{align*} Z_{\alpha/2} &= 1.96 \quad \text{para un 95% de confianza} \\ \hat{p}_1, \hat{p}_2 &\text{ son las proporciones muestrales} \\ n_1, n_2 &\text{ son los tamaños de muestra} \end{align*}\]

n1 <- 120   
x1 <- 107   
p1_hat <- x1 / n1  
n2 <- 141   
x2 <- 73    
p2_hat <- x2 / n2  


diff_p <- p1_hat - p2_hat  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))


IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)



cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")
## Proporción de hombres (p̂1): 0.8917
cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")
## Proporción de mujeres (p̂2): 0.5177
cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")
## Diferencia de proporciones (p1 - p2): 0.3739
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.2745 a 0.4734
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}
## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.

Intervalo de confianza para la Dif de Medias

5.Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 horas, con una desviación típica muestral de 1,09 horas. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 horas, con una desviación típica muestral de 1,01 horas. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales de absentismo laboral.

Muestra de fumadores: \(n_1 = 321\)

Media muestral: \(\bar{x}_1 = 3.01\)

Desviación estándar muestral: \(s_1 = 1.09\)

Muestra de no fumadores: \(n_2 = 94\)

Media muestral: \(\bar{x}_2 = 2.88\)

Desviación estándar muestral: \(s_2 = 1.01\)

Nivel de confianza: \(95\%\)

Valor crítico: \(Z_{\alpha/2} = 1.96\)

Dado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar para calcular el intervalo de confianza:

\[ IC = (\bar{x}_1-\bar{x}_2) \pm Z{\alpha/2} \times \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \] \[ Z_{\alpha/2} = 1.96 \quad \text{para un } 95\% \text{ de confianza} \] \[ s_1^2 \text{ y } s_2^2 \text{ son las varianzas muestrales} \] \[ n_1 \text{ y } n_2 \text{ son los tamaños de muestra} \]

n1 <- 321   
x1_bar <- 3.01  
s1 <- 1.09  

n2 <- 94    
x2_bar <- 2.88  
s2 <- 1.01  


diff_means <- x1_bar - x2_bar  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))


IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)



cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")
## Media de fumadores (x̄1): 3.01
cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")
## Media de no fumadores (x̄2): 2.88
cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")
## Diferencia de medias (x̄1 - x̄2): 0.13
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): -0.1064 a 0.3664
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
}
## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.