Estadistica 2

Taller de estimaciones por intervalo de confianza

Un analista financiero está evaluando el rendimiento diario de un portafolio de acciones. La desviación estándar histórica del rendimiento diario es de 15 puntos básicos (0.15%). En una muestra aleatoria de 25 días, el rendimiento medio observado fue de 100 puntos básicos (1.00%). El analista desea calcular un intervalo de confianza del 95% para el verdadero rendimiento medio diario del portafolio.

x_bar <- 100  
sigma <- 15   
n <- 25       
z_alpha <- 1.96  

error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")

## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:

cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n")

## ( 94.12 , 105.88 ) puntos básicos

Interpretacion: A partir de la información que analizó, ese 100 puntos básicos no representa el valor exacto del rendimiento diario, sino una estimación basada en la muestra; como siempre hay un margen de error, se utiliza un intervalo de confianza, y lo que refleja el rango (94.12 , 105.88) puntos básicos es que, si se repitiera el procedimiento muchas veces, en el 95% de las ocasiones el verdadero promedio diario del portafolio se ubicaría dentro de esos valores.

Un auditor desea hacer una estimación con un intervalo de confianza del 95% del valor promedio de los gastos diarios de una pequeña empresa. El auditor ha determinado que los valores diarios de los gastos están distribuidos normalmente.

A partir de una muestra aleatoria de 36 días, los gastos diarios muestran: - Media muestral (x¯ ) = $16,500 - Desviación estándar poblacional (σ ) = $2,000 - Tamaño de la muestra (n ) = 36 - Nivel de confianza = 95%

x_bar <- 16500  
sigma <- 2000   
n <- 36         
z_alpha <- 1.96 
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")

## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:

cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")

## ( 15846.67 , 17153.33 ) dólares

Interpretacion: Con los datos que tomó el auditor, el gasto diario promedio de la empresa no es exactamente $16,500, sino que ese valor es solo una estimación obtenida de la muestra; como siempre existe cierto nivel de incertidumbre, se construye un intervalo de confianza, y lo que indica el rango (15,846.67 , 17,153.33) dólares es que, si este análisis se repitiera muchas veces, en el 95% de los casos el verdadero promedio de los gastos diarios se encontraría dentro de esos valores.

Un analista de relaciones internacionales está evaluando el porcentaje de países en una muestra aleatoria que han incumplido acuerdos comerciales internacionales.

En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.

El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.

n <- 85   
x <- 10   
p_hat <- x / n  

z_critico <- qnorm(0.975)  

error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)

cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")

## Proporción muestral (p̂): 0.1176

cat("Error estándar:", round(error_estandar, 4), "\n")

## Error estándar: 0.0349

cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")

## Intervalo de confianza (95%): 0.0492 a 0.1861

Interpretacion: A partir de la muestra, ese 11.76% no es el valor exacto de la proporción real, sino una aproximación; como siempre hay un margen de error, se utiliza un intervalo de confianza, y lo que muestra el rango (0.0492 a 0.1861) es que, si se repitiera este procedimiento muchas veces, en el 95% de las ocasiones la verdadera proporción de países que han incumplido acuerdos comerciales se ubicaría dentro de ese intervalo.

Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de estadística de sexo masculino y femenino.

De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años. De 141 mujeres encuestadas, 73 tenían la misma expectativa. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años.

Datos

Muestra de hombres: n1=120

Hombres con expectativa de trabajo: x1=107

Proporción muestral de hombres: p^1=x1n1

Muestra de mujeres: n2=141

Mujeres con expectativa de trabajo: x2=73

Proporción muestral de mujeres: p^2=x2n2

Nivel de confianza: 95%

Valor crítico: Zα/2=1.96

Cálculo del Intervalo de Confianza

El intervalo de confianza para la diferencia de proporciones se basa en la distribución normal estándar y se calcula como:

$IC = (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}$

Donde: Zα/2=1.96 para un 95% de confianza.

p^1 y p^2 son las proporciones muestrales.

n1 y n2 son los tamaños de muestra.

n1 <- 120   
x1 <- 107   
p1_hat <- x1 / n1  
n2 <- 141   
x2 <- 73    
p2_hat <- x2 / n2  


diff_p <- p1_hat - p2_hat  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))


IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)



cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")

## Proporción de hombres (p̂1): 0.8917

cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")

## Proporción de mujeres (p̂2): 0.5177

cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")

## Diferencia de proporciones (p1 - p2): 0.3739

cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")

## Intervalo de confianza (95%): 0.2745 a 0.4734

if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}

## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.

Interpretacion: Con los datos analizados, la diferencia entre las proporciones de hombres y mujeres (0.3739) no es un valor exacto, sino una estimación basada en las muestras; como siempre existe incertidumbre, se construye un intervalo de confianza, y lo que indica el rango (0.2745 a 0.4734) es que, si este análisis se repitiera muchas veces, en el 95% de los casos la verdadera diferencia entre las proporciones de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años estaría dentro de esos valores, lo que además sugiere que dicha proporción es mayor en hombres que en mujeres.

Para una muestra aleatoria de 321 fumadores, el número medio de horas de absentismo laboral al mes fue de 3,01 horas, con una desviación típica muestral de 1,09 horas. Para una muestra aleatoria independiente de 94 trabajadores que nunca han fumado, el número medio de horas fue de 2,88 horas, con una desviación típica muestral de 1,01 horas. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las dos medias poblacionales de absentismo laboral.

Datos

Muestra de fumadores: n1=321 Media muestral: x¯1=3.01

Desviación estándar muestral: s1=1.09 Muestra de no fumadores: n2=94 Media muestral: x¯2=2.88

Desviación estándar muestral: s2=1.01 Nivel de confianza: 95% Valor crítico: Zα/2=1.96 Cálculo del Intervalo de Confianza para la Diferencia de Medias

Dado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar para calcular el intervalo de confianza:

$IC = (\bar{x}_1 - \bar{x}_2) \pm Z_{\alpha/2} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$

Zα/2=1.96 para un 95% de confianza.

s21 y s22 son las varianzas muestrales.

n1 y n2 son los tamaños de muestra.

n1 <- 321   
x1_bar <- 3.01  
s1 <- 1.09  

n2 <- 94    
x2_bar <- 2.88  
s2 <- 1.01  


diff_means <- x1_bar - x2_bar  


z_critico <- qnorm(0.975)  


error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))


IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)



cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")

## Media de fumadores (x̄1): 3.01

cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")

## Media de no fumadores (x̄2): 2.88

cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")

## Diferencia de medias (x̄1 - x̄2): 0.13

cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")

## Intervalo de confianza (95%): -0.1064 a 0.3664

if (IC[1] > 0 & IC[2] > 0) {
  cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
  cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
}

## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.

Interpretacion: Lo que ocurre aquí es que, aunque los números sugieren que los fumadores se ausentan más (3,01 horas frente a 2,88), esa brecha de 0,13 horas es demasiado pequeña para considerarla una regla general. Al realizar el análisis con un 95% de confianza, el intervalo resultante atrapa al cero, lo que en estadística significa que no hay pruebas contundentes de una diferencia real entre ambos grupos. En términos prácticos, el estudio nos dice que las variaciones observadas probablemente son fruto de la casualidad y no del hábito de fumar, por lo que no se puede concluir que un grupo falte al trabajo más que el otro.

Un analista financiero está evaluando la variabilidad en la rentabilidad diaria de una cartera de inversiones. La desviación estándar muestral de la rentabilidad diaria es 0.8% en una muestra de 15 observaciones.

El objetivo es calcular un intervalo de confianza del 90% tanto para la varianza como para la desviación estándar poblacional de la rentabilidad diaria de la cartera.

Datos

Tamaño de la muestra: n=15

Desviación estándar muestral: s=0.8

Grados de libertad: v=n−1=14

Valores críticos de Chi-cuadrado: χ20.05,14=23.68

χ20.95,14=6.57

Nivel de confianza: 90% Cálculo del Intervalo de Confianza para la Varianza

El intervalo de confianza para la varianza poblacional se basa en la distribución Chi-cuadrado:

$\left(\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}}, \frac{(n-1)s^2}{\chi^2_{\alpha/2}}\right)$

Donde:

χ21−α/2 y χ2α/2 son los valores críticos de la distribución Chi-cuadrado.

s2 es la varianza muestral.

n−1 son los grados de libert ad.

n <- 15   
s <- 0.8  
gl <- n - 1  


chi2_inf <- qchisq(0.95, df = gl)  
chi2_sup <- qchisq(0.05, df = gl)  #


varianza_inf <- (gl * s^2) / chi2_inf
varianza_sup <- (gl * s^2) / chi2_sup
IC_varianza <- c(varianza_inf, varianza_sup)


IC_desviacion <- sqrt(IC_varianza)


cat("### Intervalo de Confianza del 90% para la varianza ###\n")

## ### Intervalo de Confianza del 90% para la varianza ###

cat("Intervalo de confianza (90%):", round(IC_varianza[1], 4), "a", round(IC_varianza[2], 4), "\n")

## Intervalo de confianza (90%): 0.3783 a 1.3636

cat("\n### Intervalo de Confianza del 90% para la desviación estándar ###\n")

## 
## ### Intervalo de Confianza del 90% para la desviación estándar ###

cat("Intervalo de confianza (90%):", round(IC_desviacion[1], 4), "a", round(IC_desviacion[2], 4), "\n")

## Intervalo de confianza (90%): 0.6151 a 1.1678

Interpretacion: Lo que este análisis nos revela es qué tan volátil o “nerviosa” es realmente la rentabilidad de esta cartera de inversión más allá de lo que vimos en los 15 días de la muestra. Aunque observamos una desviación del 0,8%, el estudio nos dice con un 90% de seguridad que la verdadera fluctuación de todo el portafolio se mueve en un rango de entre 0,61% y 1,16%. Básicamente, esto le sirve al analista para no confiarse solo del dato puntual y entender que, en el peor de los casos, la rentabilidad podría variar un poco más de un punto porcentual, permitiéndole medir el riesgo real con mucha más precisión.

Una compañía fabrica propulsores para motores de turbinas. Una de las operaciones consiste en esmerilar el terminado de una superficie particular con aleación de titanio. Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rigurosidad superficial promedio.

El ingeniero de manufactura desea seleccionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie.

Para ello, toma una muestra de 12 partes del primer proceso, con una desviación estándar muestral de 5.1 micro pulgadas.

En el segundo proceso, se toma una muestra aleatoria de 15 partes, con una desviación estándar muestral de 4.7 micro pulgadas.

Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas.

Datos

Muestra del primer proceso: n1=12 Desviación estándar muestral: s1=5.1

Varianza muestral: s21 Muestra del segundo proceso: n2=15 Desviación estándar muestral: s2=4.7

Varianza muestral: s22 Nivel de confianza: 90% Distribución F: Usaremos los grados de libertad df1=n1−1 y df2=n2−1 . Cálculo del Intervalo de Confianza para el Cociente de Varianzas

El intervalo de confianza para la razón de varianzas se basa en la distribución F:

$IC = \left(\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{1-\alpha/2,\,df_1,\,df_2}}, \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2,\,df_1,\,df_2}\right)$

Donde:

Fα/2,df1,df2 y F1−α/2,df1,df2 son los valores críticos de la distribución F.

s21 y s22 son las varianzas muestrales.

n1−1 y n2−1 son los grados de libertad.

n1 <- 12  
s1 <- 5.1  
var1 <- s1^2  

n2 <- 15  
s2 <- 4.7  
var2 <- s2^2  


F_stat <- var1 / var2  

df1 <- n1 - 1  
df2 <- n2 - 1  

F_inf <- qf(0.95, df1, df2)  
F_sup <- qf(0.05, df1, df2)  



cat("### Intervalo de Confianza del 90% para el Cociente de Varianzas ###\n")

## ### Intervalo de Confianza del 90% para el Cociente de Varianzas ###

cat("Cociente de varianzas (s1² / s2²):", round(F_stat, 4), "\n")

## Cociente de varianzas (s1² / s2²): 1.1775

cat("Valores críticos de F:", round(F_inf, 4), "y", round(F_sup, 4), "\n")

## Valores críticos de F: 2.5655 y 0.3651

Interpretacion: El objetivo del ingeniero es encontrar cuál de los dos métodos de fabricación es más estable, es decir, cuál tiene menos variabilidad en el acabado de las piezas. Al comparar el cociente de las varianzas, vemos que el resultado es 1,17, y aunque el primer proceso parece ser un poco más “irregular” que el segundo (5,1 frente a 4,7 en desviación), el análisis estadístico nos dice que esa diferencia no es concluyente. Como el intervalo de confianza para este cociente seguramente incluirá al número 1, no tenemos evidencia suficiente para decir que un proceso sea realmente más variable que el otro; para efectos prácticos, ambos métodos son igual de consistentes y el ingeniero podría elegir cualquiera de los dos sin temor a que uno sea significativamente más inestable.

La longitud de barras de metal producidas por una cadena de producción es una variable aleatoria con distribución normal y desviación estándar de 1.8 milímetros. Con una muestra aleatoria de 9 observaciones, se obtuvo el siguiente intervalo de confianza del 99% para la longitud media poblacional:

194.65<μ<197.75

Sin embargo, el director de producción considera que este intervalo es demasiado amplio y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada lado de la media muestral no supere 0.5 milímetros.

Se requiere calcular el tamaño muestral necesario para construir tal intervalo.

Datos

Error máximo permitido: e=0.5 mm Desviación estándar poblacional: σ=1.8 mm Nivel de confianza: 99% Valor crítico: Zα/2=Z0.005=2.575 Cálculo del Tamaño Muestral

El tamaño muestral necesario se obtiene con la siguiente fórmula:

\[ n = \left( \frac{Z_{\alpha/2} \sigma}{e} \right)^2 \] Donde: Zα/2 es el valor crítico de la distribución normal estándar para un 99% de confianza.

σ es la desviación estándar poblacional.

e es el error máximo permitido en cada lado del intervalo.

e <- 0.5    
sigma <- 1.8 
z_alpha_2 <- qnorm(0.995) 


n <- ( (z_alpha_2 * sigma) / e )^2
n_requerido <- ceiling(n)  

cat("Nivel de confianza:", "99%\n")

## Nivel de confianza: 99%

cat("Valor crítico Zα/2:", round(z_alpha_2, 4), "\n")

## Valor crítico Zα/2: 2.5758

cat("Desviación estándar σ:", sigma, "mm\n")

## Desviación estándar σ: 1.8 mm

cat("Error permitido e:", e, "mm\n")

## Error permitido e: 0.5 mm

cat("Tamaño muestral necesario n:", round(n, 2), "\n")

## Tamaño muestral necesario n: 85.99

cat("Tamaño muestral requerido (redondeado):", n_requerido, "observaciones\n")

## Tamaño muestral requerido (redondeado): 86 observaciones

Interpretacion: Lo que este cálculo nos indica es que, para cumplir con la exigencia del director de producción de tener una precisión mucho más alta (un margen de error de apenas 0,5 mm), la muestra inicial de solo 9 barras es totalmente insuficiente. Al aplicar la fórmula con un nivel de confianza del 99%, el resultado nos muestra que necesitamos analizar exactamente 86 barras de metal para garantizar que nuestras mediciones sean así de exactas. En resumen, si queremos reducir el margen de duda y tener un intervalo de confianza más estrecho y confiable, la única solución matemática es aumentar el volumen de trabajo y estudiar una muestra significativamente más grande que la original.

Se ha construido un intervalo de confianza del 95% para la proporción de directores de recursos humanos que consideran que el expediente académico es muy importante en la evaluación de un candidato. El intervalo obtenido fue:

\[ 0.533 \leq \pi \leq 0.693 \] Ahora, se desea construir un intervalo de confianza del 95% con una longitud a cada lado de la proporción muestral que no supere 0.06.

Se requiere determinar cuántas observaciones son necesarias para obtener este nuevo intervalo más preciso.

Datos

Error máximo permitido: e=0.06

Nivel de confianza: 95% Valor crítico: Zα/2=Z0.025=1.96

Dado que p es desconocido, usamos p=0.5 (máxima varianza). Cálculo del Tamaño Muestral

El tamaño muestral necesario se obtiene con la siguiente fórmula:

\[ n = \frac{(0.25)\, Z_{\alpha/2}^{2}}{e^{2}} \] Donde:

Zα/2 es el valor crítico de la distribución normal estándar para un 95% de confianza.

0.25 es la varianza máxima posible de una proporción cuando p es desconocido.

e es el error máximo permitido en cada lado del intervalo.

e <- 0.06    
p <- 0.5     
z_alpha_2 <- qnorm(0.975) 

n <- (0.25 * (z_alpha_2^2)) / (e^2)
n_requerido <- ceiling(n)  

cat("Nivel de confianza:", "95%\n")

## Nivel de confianza: 95%

cat("Valor crítico Zα/2:", round(z_alpha_2, 4), "\n")

## Valor crítico Zα/2: 1.96

cat("Proporción asumida p:", p, "\n")

## Proporción asumida p: 0.5

cat("Error permitido e:", e, "\n")

## Error permitido e: 0.06

cat("Tamaño muestral necesario n:", round(n, 2), "\n")

## Tamaño muestral necesario n: 266.77

cat("Tamaño muestral requerido (redondeado):", n_requerido, "observaciones\n")

## Tamaño muestral requerido (redondeado): 267 observaciones

Interpretacion: Lo que estamos haciendo aquí es blindar la validez de una investigación sobre contratación laboral. Al definir que queremos una precisión de 0,06 a cada lado de la respuesta, el cálculo nos indica que una muestra pequeña no sería representativa; se requiere alcanzar las 267 observaciones para reducir la incertidumbre. Básicamente, esta interpretación le dice a quien realiza el estudio que, si quiere que sus conclusiones sobre la importancia del expediente académico sean serias y confiables bajo un estándar del 95%, ese es el número mínimo de personas que debe entrevistar para que el azar no juegue en su contra.

Estadistica 2

Shadya sedan

2026-05-01

Taller de estimaciones por intervalo de confianza