taller de estimaciones por intervalo de confianza

1Un analista financiero está evaluando el rendimiento diario de un portafolio de acciones. La desviación estándar histórica del rendimiento diario es de 15 puntos básicos (0.15%). En una muestra aleatoria de 25 días, el rendimiento medio observado fue de 100 puntos básicos (1.00%). El analista desea calcular un intervalo de confianza del 95% para el verdadero rendimiento medio diario del portafolio.

x_bar <- 100  
sigma <- 15   
n <- 25       
z_alpha <- 1.96  

error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")
## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n") 
## ( 94.12 , 105.88 ) puntos básicos

** Un auditor desea hacer una estimación con un intervalo de confianza del 95% del valor promedio de los gastos diarios de una pequeña empresa. El auditor ha determinado que los valores diarios de los gastos están distribuidos normalmente.

A partir de una muestra aleatoria de 36 días, los gastos diarios muestran: - Media muestral (𝑥¯) = $16,500 - Desviación estándar poblacional (𝜎) = $2,000 - Tamaño de la muestra (𝑛) = 36 - Nivel de confianza = 95%**

x_bar <- 16500  
sigma <- 2000   
n <- 36         
z_alpha <- 1.96 
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")
## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")
## ( 15846.67 , 17153.33 ) dólares

** Un analista de relaciones internacionales está evaluando el porcentaje de países en una muestra aleatoria que han incumplido acuerdos comerciales internacionales.En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.**

n <- 85   
x <- 10   
p_hat <- x / n  

z_critico <- qnorm(0.975)  

error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)

cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")
## Proporción muestral (p̂): 0.1176
cat("Error estándar:", round(error_estandar, 4), "\n")
## Error estándar: 0.0349
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.0492 a 0.1861

Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino.De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años.De 141 mujeres encuestadas, 73 tenían la misma expectativa.El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años.DatosMuestra de hombres: 𝑛1=120Hombres con expectativa de trabajo: 𝑥1=107Proporción muestral de hombres: 𝑝̂1=𝑥1𝑛1Muestra de mujeres: 𝑛2=141Mujeres con expectativa de trabajo: 𝑥2=73Proporción muestral de mujeres: 𝑝̂2=𝑥2𝑛2Nivel de confianza: 95%Valor crítico: 𝑍𝛼/2=1.96Cálculo del Intervalo de ConfianzaEl intervalo de confianza para la diferencia de proporciones se basa en la distribución normal estándar y se calcula como:𝐼𝐶=(𝑝̂1−𝑝̂2)±𝑍𝛼/2×𝑝̂1(1−𝑝̂1)𝑛1+𝑝̂2(1−𝑝̂2)𝑛2‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√Donde:𝑍𝛼/2=1.96 para un 95% de confianza.𝑝̂1 y 𝑝̂2 son las proporciones muestrales.𝑛1 y 𝑛2 son los tamaños de muestra.

n1 <- 120   
x1 <- 107   
p1_hat <- x1 / n1  
n2 <- 141   
x2 <- 73    
p2_hat <- x2 / n2  


diff_p <- p1_hat - p2_hat  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))


IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)



cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")
## Proporción de hombres (p̂1): 0.8917
cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")
## Proporción de mujeres (p̂2): 0.5177
cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")
## Diferencia de proporciones (p1 - p2): 0.3739
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.2745 a 0.4734
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}
## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.

** Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 horas, con una desviación típica muestral de 1,09 horas. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 horas, con una desviación típica muestral de 1,01 horas. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales de absentismo laboral.DatosMuestra de fumadores: 𝑛1=321Media muestral: 𝑥¯1=3.01Desviación estándar muestral: 𝑠1=1.09Muestra de no fumadores: 𝑛2=94Media muestral: 𝑥¯2=2.88Desviación estándar muestral: 𝑠2=1.01Nivel de confianza: 95%Valor crítico: 𝑍𝛼/2=1.96Cálculo del Intervalo de Confianza para la Diferencia de MediasDado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar para calcular el intervalo de confianza:𝐼𝐶=(𝑥¯1−𝑥¯2)±𝑍𝛼/2×𝑠21𝑛1+𝑠22𝑛2‾‾‾‾‾‾‾‾‾√𝑍𝛼/2=1.96 para un 95% de confianza.𝑠21 y 𝑠22 son las varianzas muestrales.𝑛1 y 𝑛2 son los tamaños de muestra.**

n1 <- 321   
x1_bar <- 3.01  
s1 <- 1.09  

n2 <- 94    
x2_bar <- 2.88  
s2 <- 1.01  


diff_means <- x1_bar - x2_bar  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))


IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)

cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")
## Media de no fumadores (x̄2): 2.88
cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")
## Diferencia de medias (x̄1 - x̄2): 0.13
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): -0.1064 a 0.3664
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
  
}
## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.
cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")
## Media de fumadores (x̄1): 3.01

🔹 Ejercicio 1 – Intervalo de confianza para la mediaCon un nivel de confianza del 95%, el rendimiento promedio diario del portafolio está entre 94.12 y 105.88 puntos básicos. En otras palabras, es muy probable que el valor real del rendimiento se encuentre dentro de ese intervalo. Ejercicio 3 – Intervalo de confianza para la proporciónInterpretación (parafraseada):Se calcula que entre el 4.92% y el 18.61% de los países no han cumplido acuerdos comerciales. Esto quiere decir que, con un 95% de confianza, la proporción verdadera está dentro de ese rango. Ejercicio 4 – Diferencia de proporcionesInterpretación (parafraseada):Como el intervalo no contiene el valor 0, se concluye que sí hay una diferencia entre hombres y mujeres. En este caso, los hombres tienen mayor probabilidad de esperar trabajar a tiempo completo en un máximo de 6 años.Ejercicio 5 – Diferencia de mediasInterpretación (parafraseada):Dado que el intervalo sí incluye el 0, no se puede afirmar que exista una diferencia real entre fumadores y no fumadores. Es decir, no hay suficiente evidencia para decir que uno tenga más ausencias que el otro.