Taller de estimaciones por intervalo de confianza

  1. Un analista financiero está evaluando el rendimiento diario de un portafolio de acciones. La desviación estándar histórica del rendimiento diario es de 15 puntos básicos (0.15%). En una muestra aleatoria de 25 días, el rendimiento medio observado fue de 100 puntos básicos (1.00%). El analista desea calcular un intervalo de confianza del 95% para el verdadero rendimiento medio diario del portafolio.
x_bar <- 100  
sigma <- 15   
n <- 25       
z_alpha <- 1.96  

error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")
## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n")
## ( 94.12 , 105.88 ) puntos básicos

Interpretacion: Con los datos que tomó el analista, el rendimiento promedio diario del portafolio no es exactamente 100 puntos básicos, sino que ese valor solo corresponde a la muestra; como siempre existe incertidumbre, se construye un intervalo de confianza, y lo que indica el resultado de (94.12 , 105.88) puntos básicos es que, si este análisis se repitiera muchas veces, en el 95% de los casos el verdadero rendimiento promedio diario del portafolio estaría dentro de ese rango.

  1. Un auditor desea hacer una estimación con un intervalo de confianza del 95% del valor promedio de los gastos diarios de una pequeña empresa. El auditor ha determinado que los valores diarios de los gastos están distribuidos normalmente.

A partir de una muestra aleatoria de 36 días, los gastos diarios muestran: - Media muestral (x¯ ) = $16,500 - Desviación estándar poblacional (σ ) = $2,000 - Tamaño de la muestra (n ) = 36 - Nivel de confianza = 95%

x_bar <- 16500  
sigma <- 2000   
n <- 36         
z_alpha <- 1.96 
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")
## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")
## ( 15846.67 , 17153.33 ) dólares

Interpretacion: Con la información analizada, esos $16,500 no representan el valor exacto del gasto diario promedio, sino una aproximación basada en la muestra; debido a que siempre hay un margen de error, se utiliza un intervalo de confianza, y lo que muestra el intervalo (15,846.67 , 17,153.33) dólares es que, si se realizara este procedimiento muchas veces, en el 95% de las ocasiones el verdadero promedio de los gastos diarios estaría dentro de ese rango

  1. Un analista de relaciones internacionales está evaluando el porcentaje de países en una muestra aleatoria que han incumplido acuerdos comerciales internacionales.

En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.

El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.

n <- 85   
x <- 10   
p_hat <- x / n  

z_critico <- qnorm(0.975)  

error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)

cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")
## Proporción muestral (p̂): 0.1176
cat("Error estándar:", round(error_estandar, 4), "\n")
## Error estándar: 0.0349
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.0492 a 0.1861

Interpretacion: Con los datos que analizó, ese 11.76% no representa exactamente la proporción real de países que han incumplido acuerdos, sino que es solo una estimación obtenida de la muestra; como siempre existe incertidumbre, se construye un intervalo de confianza, y lo que indica el rango (0.0492 a 0.1861) es que, si este análisis se repitiera muchas veces, en el 95% de los casos la verdadera proporción de países que incumplen acuerdos comerciales estaría dentro de esos valores.

  1. Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino.

De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años. De 141 mujeres encuestadas, 73 tenían la misma expectativa. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años.

Datos

Muestra de hombres: n1=120

Hombres con expectativa de trabajo: x1=107

Proporción muestral de hombres: p^1=x1n1

Muestra de mujeres: n2=141

Mujeres con expectativa de trabajo: x2=73

Proporción muestral de mujeres: p^2=x2n2

Nivel de confianza: 95%

Valor crítico: Zα/2=1.96

Cálculo del Intervalo de Confianza

El intervalo de confianza para la diferencia de proporciones se basa en la distribución normal estándar y se calcula como:

\(IC = (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}\)

Donde: Zα/2=1.96 para un 95% de confianza.

p^1 y p^2 son las proporciones muestrales.

n1 y n2 son los tamaños de muestra.

n1 <- 120   
x1 <- 107   
p1_hat <- x1 / n1  
n2 <- 141   
x2 <- 73    
p2_hat <- x2 / n2  


diff_p <- p1_hat - p2_hat  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))


IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)



cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")
## Proporción de hombres (p̂1): 0.8917
cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")
## Proporción de mujeres (p̂2): 0.5177
cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")
## Diferencia de proporciones (p1 - p2): 0.3739
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.2745 a 0.4734
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}
## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.

Interpretacion: Con la información obtenida, esa diferencia de 0.3739 entre hombres y mujeres no representa el valor real exacto, sino una aproximación calculada a partir de las muestras; como siempre hay un margen de error, se utiliza un intervalo de confianza, y lo que muestra el intervalo (0.2745 a 0.4734) es que, si se realizara este procedimiento muchas veces, en el 95% de las ocasiones la verdadera diferencia entre las proporciones se encontraría dentro de ese rango, indicando además que la proporción de hombres es mayor que la de mujeres.

  1. Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 horas, con una desviación típica muestral de 1,09 horas. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 horas, con una desviación típica muestral de 1,01 horas. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales de absentismo laboral.

Datos

Muestra de fumadores: n1=321 Media muestral: x¯1=3.01

Desviación estándar muestral: s1=1.09 Muestra de no fumadores: n2=94 Media muestral: x¯2=2.88

Desviación estándar muestral: s2=1.01 Nivel de confianza: 95% Valor crítico: Zα/2=1.96 Cálculo del Intervalo de Confianza para la Diferencia de Medias

Dado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar para calcular el intervalo de confianza:

\(IC = (\bar{x}_1 - \bar{x}_2) \pm Z_{\alpha/2} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}\)

Zα/2=1.96 para un 95% de confianza.

s21 y s22 son las varianzas muestrales.

n1 y n2 son los tamaños de muestra.

n1 <- 321   
x1_bar <- 3.01  
s1 <- 1.09  

n2 <- 94    
x2_bar <- 2.88  
s2 <- 1.01  


diff_means <- x1_bar - x2_bar  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))


IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)



cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")
## Media de fumadores (x̄1): 3.01
cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")
## Media de no fumadores (x̄2): 2.88
cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")
## Diferencia de medias (x̄1 - x̄2): 0.13
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): -0.1064 a 0.3664
if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
}
## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.

Interpretacion: lo que estos datos nos dicen es que, aunque a simple vista parece que los fumadores faltan más al trabajo, estadísticamente esa pequeña diferencia de 0,13 horas no es lo suficientemente sólida como para asegurar que se deba al hábito de fumar. Al calcular el intervalo de confianza, el resultado incluye el valor cero, lo que significa que existe una probabilidad real de que la diferencia entre ambos grupos sea nula; por lo tanto, con un 95% de certeza, no podemos afirmar que los fumadores tengan un mayor nivel de ausentismo laboral, ya que cualquier variación observada podría deberse simplemente al azar y no a una tendencia real.

  1. Un analista financiero está evaluando la variabilidad en la rentabilidad diaria de una cartera de inversiones. La desviación estándar muestral de la rentabilidad diaria es 0.8% en una muestra de 15 observaciones.

El objetivo es calcular un intervalo de confianza del 90% tanto para la varianza como para la desviación estándar poblacional de la rentabilidad diaria de la cartera.

Datos

Tamaño de la muestra: n=15

Desviación estándar muestral: s=0.8

Grados de libertad: v=n−1=14

Valores críticos de Chi-cuadrado: χ20.05,14=23.68

χ20.95,14=6.57

Nivel de confianza: 90% Cálculo del Intervalo de Confianza para la Varianza

El intervalo de confianza para la varianza poblacional se basa en la distribución Chi-cuadrado:

\(\left(\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}}, \frac{(n-1)s^2}{\chi^2_{\alpha/2}}\right)\)

Donde:

χ21−α/2 y χ2α/2 son los valores críticos de la distribución Chi-cuadrado.

s2 es la varianza muestral.

n−1 son los grados de libert ad.

n <- 15   
s <- 0.8  
gl <- n - 1  


chi2_inf <- qchisq(0.95, df = gl)  
chi2_sup <- qchisq(0.05, df = gl)  #


varianza_inf <- (gl * s^2) / chi2_inf
varianza_sup <- (gl * s^2) / chi2_sup
IC_varianza <- c(varianza_inf, varianza_sup)


IC_desviacion <- sqrt(IC_varianza)


cat("### Intervalo de Confianza del 90% para la varianza ###\n")
## ### Intervalo de Confianza del 90% para la varianza ###
cat("Intervalo de confianza (90%):", round(IC_varianza[1], 4), "a", round(IC_varianza[2], 4), "\n")
## Intervalo de confianza (90%): 0.3783 a 1.3636
cat("\n### Intervalo de Confianza del 90% para la desviación estándar ###\n")
## 
## ### Intervalo de Confianza del 90% para la desviación estándar ###
cat("Intervalo de confianza (90%):", round(IC_desviacion[1], 4), "a", round(IC_desviacion[2], 4), "\n")
## Intervalo de confianza (90%): 0.6151 a 1.1678

Interpretacion: Visto de una forma sencilla, estos números sirven para ponerle límites realistas a la incertidumbre del mercado. Al calcular los intervalos para la varianza y la desviación estándar, estamos admitiendo que el 0,8% que medimos inicialmente es solo una foto momentánea y que el valor real de riesgo es un rango. Con un nivel de confianza del 90%, podemos afirmar que la volatilidad poblacional no es un número fijo, sino que oscila entre 0,61% y 1,16%; esto es clave porque le da al inversionista un “colchón” de seguridad para saber qué tan grandes podrían llegar a ser los cambios diarios en sus ganancias.

  1. Una compañía fabrica propulsores para motores de turbinas. Una de las operaciones consiste en esmerilar el terminado de una superficie particular con aleación de titanio. Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rigurosidad superficial promedio.

El ingeniero de manufactura desea seleccionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie.

Para ello, toma una muestra de 12 partes del primer proceso, con una desviación estándar muestral de 5.1 micro pulgadas.

En el segundo proceso, se toma una muestra aleatoria de 15 partes, con una desviación estándar muestral de 4.7 micro pulgadas.

Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas.

Datos

Muestra del primer proceso: n1=12 Desviación estándar muestral: s1=5.1

Varianza muestral: s21 Muestra del segundo proceso: n2=15 Desviación estándar muestral: s2=4.7

Varianza muestral: s22 Nivel de confianza: 90% Distribución F: Usaremos los grados de libertad df1=n1−1 y df2=n2−1 . Cálculo del Intervalo de Confianza para el Cociente de Varianzas

El intervalo de confianza para la razón de varianzas se basa en la distribución F:

\(IC = \left(\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{1-\alpha/2,\,df_1,\,df_2}}, \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2,\,df_1,\,df_2}\right)\)

Donde:

Fα/2,df1,df2 y F1−α/2,df1,df2 son los valores críticos de la distribución F.

s21 y s22 son las varianzas muestrales.

n1−1 y n2−1 son los grados de libertad.

n1 <- 12  
s1 <- 5.1  
var1 <- s1^2  

n2 <- 15  
s2 <- 4.7  
var2 <- s2^2  


F_stat <- var1 / var2  

df1 <- n1 - 1  
df2 <- n2 - 1  

F_inf <- qf(0.95, df1, df2)  
F_sup <- qf(0.05, df1, df2)  



cat("### Intervalo de Confianza del 90% para el Cociente de Varianzas ###\n")
## ### Intervalo de Confianza del 90% para el Cociente de Varianzas ###
cat("Cociente de varianzas (s1² / s2²):", round(F_stat, 4), "\n")
## Cociente de varianzas (s1² / s2²): 1.1775
cat("Valores críticos de F:", round(F_inf, 4), "y", round(F_sup, 4), "\n")
## Valores críticos de F: 2.5655 y 0.3651

Interpretacion: En términos simples, lo que estamos haciendo es una división entre las variabilidades de ambos procesos para ver si se alejan mucho de la igualdad. Si el cociente fuera muy alto o muy bajo, sabríamos que un método es mejor que el otro, pero con un valor de 1,17 estamos ante una situación de empate estadístico. Con un 90% de confianza, podemos interpretar que las ligeras diferencias observadas en las muestras de 12 y 15 piezas se deben más al azar que a una falla real en el sistema de producción. En conclusión, no hay motivos de peso para afirmar que existe una menor variabilidad en el segundo proceso, por lo que ambos métodos de esmerilado funcionan con una precisión muy similar en la práctica.

  1. La longitud de barras de metal producidas por una cadena de producción es una variable aleatoria con distribución normal y desviación estándar de 1.8 milímetros. Con una muestra aleatoria de 9 observaciones, se obtuvo el siguiente intervalo de confianza del 99% para la longitud media poblacional:

194.65<μ<197.75

Sin embargo, el director de producción considera que este intervalo es demasiado amplio y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada lado de la media muestral no supere 0.5 milímetros.

Se requiere calcular el tamaño muestral necesario para construir tal intervalo.

Datos

Error máximo permitido: e=0.5 mm Desviación estándar poblacional: σ=1.8 mm Nivel de confianza: 99% Valor crítico: Zα/2=Z0.005=2.575 Cálculo del Tamaño Muestral

El tamaño muestral necesario se obtiene con la siguiente fórmula:

\[ n = \left( \frac{Z_{\alpha/2} \sigma}{e} \right)^2 \] Donde: Zα/2 es el valor crítico de la distribución normal estándar para un 99% de confianza.

σ es la desviación estándar poblacional.

e es el error máximo permitido en cada lado del intervalo.

e <- 0.5    
sigma <- 1.8 
z_alpha_2 <- qnorm(0.995) 


n <- ( (z_alpha_2 * sigma) / e )^2
n_requerido <- ceiling(n)  

cat("Nivel de confianza:", "99%\n")
## Nivel de confianza: 99%
cat("Valor crítico Zα/2:", round(z_alpha_2, 4), "\n")
## Valor crítico Zα/2: 2.5758
cat("Desviación estándar σ:", sigma, "mm\n")
## Desviación estándar σ: 1.8 mm
cat("Error permitido e:", e, "mm\n")
## Error permitido e: 0.5 mm
cat("Tamaño muestral necesario n:", round(n, 2), "\n")
## Tamaño muestral necesario n: 85.99
cat("Tamaño muestral requerido (redondeado):", n_requerido, "observaciones\n")
## Tamaño muestral requerido (redondeado): 86 observaciones

Interpretacion: Lo que vemos aquí es una respuesta directa a la necesidad de mayor exactitud en el control de calidad de las barras de metal. El intervalo inicial era demasiado vago para el director, por lo que al fijar un error máximo de solo 0,5 mm, la matemática nos indica que el tamaño de la muestra debe crecer significativamente hasta llegar a las 86 unidades. Esta interpretación nos confirma que, si queremos un nivel de confianza tan exigente como el 99% sin perder precisión, no podemos depender de muestras pequeñas; necesitamos este nuevo volumen de datos para garantizar que el promedio poblacional esté realmente dentro del rango permitido.

  1. Se ha construido un intervalo de confianza del 95% para la proporción de directores de recursos humanos que consideran que el expediente académico es muy importante en la evaluación de un candidato. El intervalo obtenido fue:

\[ 0.533 \leq \pi \leq 0.693 \] Ahora, se desea construir un intervalo de confianza del 95% con una longitud a cada lado de la proporción muestral que no supere 0.06.

Se requiere determinar cuántas observaciones son necesarias para obtener este nuevo intervalo más preciso.

Datos

Error máximo permitido: e=0.06

Nivel de confianza: 95% Valor crítico: Zα/2=Z0.025=1.96

Dado que p es desconocido, usamos p=0.5 (máxima varianza). Cálculo del Tamaño Muestral

El tamaño muestral necesario se obtiene con la siguiente fórmula:

\[ n = \frac{(0.25)\, Z_{\alpha/2}^{2}}{e^{2}} \] Donde:

Zα/2 es el valor crítico de la distribución normal estándar para un 95% de confianza.

0.25 es la varianza máxima posible de una proporción cuando p es desconocido.

e es el error máximo permitido en cada lado del intervalo.

e <- 0.06    
p <- 0.5     
z_alpha_2 <- qnorm(0.975) 

n <- (0.25 * (z_alpha_2^2)) / (e^2)
n_requerido <- ceiling(n)  

cat("Nivel de confianza:", "95%\n")
## Nivel de confianza: 95%
cat("Valor crítico Zα/2:", round(z_alpha_2, 4), "\n")
## Valor crítico Zα/2: 1.96
cat("Proporción asumida p:", p, "\n")
## Proporción asumida p: 0.5
cat("Error permitido e:", e, "\n")
## Error permitido e: 0.06
cat("Tamaño muestral necesario n:", round(n, 2), "\n")
## Tamaño muestral necesario n: 266.77
cat("Tamaño muestral requerido (redondeado):", n_requerido, "observaciones\n")
## Tamaño muestral requerido (redondeado): 267 observaciones

Interpretacion: Este análisis nos permite saber a cuántos directores de recursos humanos necesitamos consultar para que nuestra encuesta sea verdaderamente precisa y no se base en simples suposiciones. Como inicialmente no conocemos qué porcentaje exacto valora el expediente académico, la estadística nos obliga a ponernos en el “peor de los escenarios” (usando una proporción del 0,5) para asegurar que el margen de error no supere el 6%. El resultado es contundente: necesitamos recolectar 267 opiniones para poder afirmar, con un 95% de seguridad, que el dato que obtengamos refleja la realidad de lo que piensan los reclutadores sin desviarnos más de lo permitido.