x_bar <- 100
sigma <- 15
n <- 25
z_alpha <- 1.96
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:\n")
## Intervalo de confianza del 95% para el rendimiento medio diario del portafolio:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") puntos básicos\n")
## ( 94.12 , 105.88 ) puntos básicos
Interpretacion: A partir de la información que analizó, ese 100 puntos básicos no representa el valor exacto del rendimiento diario, sino una estimación basada en la muestra; como siempre hay un margen de error, se utiliza un intervalo de confianza, y lo que refleja el rango (94.12 , 105.88) puntos básicos es que, si se repitiera el procedimiento muchas veces, en el 95% de las ocasiones el verdadero promedio diario del portafolio se ubicaría dentro de esos valores.
A partir de una muestra aleatoria de 36 días, los gastos diarios muestran: - Media muestral (x¯ ) = $16,500 - Desviación estándar poblacional (σ ) = $2,000 - Tamaño de la muestra (n ) = 36 - Nivel de confianza = 95%
x_bar <- 16500
sigma <- 2000
n <- 36
z_alpha <- 1.96
error_estandar <- sigma / sqrt(n)
limite_inferior <- x_bar - z_alpha * error_estandar
limite_superior <- x_bar + z_alpha * error_estandar
cat("Intervalo de confianza del 95% para el valor promedio de los gastos diarios:\n")
## Intervalo de confianza del 95% para el valor promedio de los gastos diarios:
cat("(", round(limite_inferior, 2), ",", round(limite_superior, 2), ") dólares\n")
## ( 15846.67 , 17153.33 ) dólares
Interpretacion: Con los datos que tomó el auditor, el gasto diario promedio de la empresa no es exactamente $16,500, sino que ese valor es solo una estimación obtenida de la muestra; como siempre existe cierto nivel de incertidumbre, se construye un intervalo de confianza, y lo que indica el rango (15,846.67 , 17,153.33) dólares es que, si este análisis se repitiera muchas veces, en el 95% de los casos el verdadero promedio de los gastos diarios se encontraría dentro de esos valores.
En una muestra aleatoria de 85 países, 10 han incurrido en incumplimientos de acuerdos comerciales.
El analista desea calcular un intervalo de confianza del 95% para la proporción de países en la población total que han incumplido acuerdos comerciales.
n <- 85
x <- 10
p_hat <- x / n
z_critico <- qnorm(0.975)
error_estandar <- sqrt((p_hat * (1 - p_hat)) / n)
IC <- c(p_hat - z_critico * error_estandar, p_hat + z_critico * error_estandar)
cat("Proporción muestral (p̂):", round(p_hat, 4), "\n")
## Proporción muestral (p̂): 0.1176
cat("Error estándar:", round(error_estandar, 4), "\n")
## Error estándar: 0.0349
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.0492 a 0.1861
Interpretacion: A partir de la muestra, ese 11.76% no es el valor exacto de la proporción real, sino una aproximación; como siempre hay un margen de error, se utiliza un intervalo de confianza, y lo que muestra el rango (0.0492 a 0.1861) es que, si se repitiera este procedimiento muchas veces, en el 95% de las ocasiones la verdadera proporción de países que han incumplido acuerdos comerciales se ubicaría dentro de ese intervalo.
De 120 hombres, 107 esperaban disfrutar de un trabajo de tiempo completo en un máximo de 6 años. De 141 mujeres encuestadas, 73 tenían la misma expectativa. El objetivo es calcular un intervalo de confianza del 95% para la diferencia entre las proporciones poblacionales de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años.
Datos
Muestra de hombres: n1=120
Hombres con expectativa de trabajo: x1=107
Proporción muestral de hombres: p^1=x1n1
Muestra de mujeres: n2=141
Mujeres con expectativa de trabajo: x2=73
Proporción muestral de mujeres: p^2=x2n2
Nivel de confianza: 95%
Valor crítico: Zα/2=1.96
Cálculo del Intervalo de Confianza
El intervalo de confianza para la diferencia de proporciones se basa en la distribución normal estándar y se calcula como:
\(IC = (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}\)
Donde: Zα/2=1.96 para un 95% de confianza.
p^1 y p^2 son las proporciones muestrales.
n1 y n2 son los tamaños de muestra.
n1 <- 120
x1 <- 107
p1_hat <- x1 / n1
n2 <- 141
x2 <- 73
p2_hat <- x2 / n2
diff_p <- p1_hat - p2_hat
z_critico <- qnorm(0.975)
error_estandar <- sqrt((p1_hat * (1 - p1_hat) / n1) + (p2_hat * (1 - p2_hat) / n2))
IC <- c(diff_p - z_critico * error_estandar, diff_p + z_critico * error_estandar)
cat("Proporción de hombres (p̂1):", round(p1_hat, 4), "\n")
## Proporción de hombres (p̂1): 0.8917
cat("Proporción de mujeres (p̂2):", round(p2_hat, 4), "\n")
## Proporción de mujeres (p̂2): 0.5177
cat("Diferencia de proporciones (p1 - p2):", round(diff_p, 4), "\n")
## Diferencia de proporciones (p1 - p2): 0.3739
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): 0.2745 a 0.4734
if (IC[1] > 0 & IC[2] > 0) {
cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.\n")
} else {
cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa entre hombres y mujeres y oscila entre 27% y 47%\n")
}
## Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que la proporción de hombres que esperan trabajar a tiempo completo en un máximo de 6 años es mayor que la de las mujeres.
Interpretacion: Con los datos analizados, la diferencia entre las proporciones de hombres y mujeres (0.3739) no es un valor exacto, sino una estimación basada en las muestras; como siempre existe incertidumbre, se construye un intervalo de confianza, y lo que indica el rango (0.2745 a 0.4734) es que, si este análisis se repitiera muchas veces, en el 95% de los casos la verdadera diferencia entre las proporciones de hombres y mujeres que esperan trabajar a tiempo completo en un máximo de 6 años estaría dentro de esos valores, lo que además sugiere que dicha proporción es mayor en hombres que en mujeres.
Datos
Muestra de fumadores: n1=321 Media muestral: x¯1=3.01
Desviación estándar muestral: s1=1.09 Muestra de no fumadores: n2=94 Media muestral: x¯2=2.88
Desviación estándar muestral: s2=1.01 Nivel de confianza: 95% Valor crítico: Zα/2=1.96 Cálculo del Intervalo de Confianza para la Diferencia de Medias
Dado que los tamaños muestrales son grandes, utilizamos la distribución normal estándar para calcular el intervalo de confianza:
\(IC = (\bar{x}_1 - \bar{x}_2) \pm Z_{\alpha/2} \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}\)
Zα/2=1.96 para un 95% de confianza.
s21 y s22 son las varianzas muestrales.
n1 y n2 son los tamaños de muestra.
n1 <- 321
x1_bar <- 3.01
s1 <- 1.09
n2 <- 94
x2_bar <- 2.88
s2 <- 1.01
diff_means <- x1_bar - x2_bar
z_critico <- qnorm(0.975)
error_estandar <- sqrt((s1^2 / n1) + (s2^2 / n2))
IC <- c(diff_means - z_critico * error_estandar, diff_means + z_critico * error_estandar)
cat("Media de fumadores (x̄1):", round(x1_bar, 4), "\n")
## Media de fumadores (x̄1): 3.01
cat("Media de no fumadores (x̄2):", round(x2_bar, 4), "\n")
## Media de no fumadores (x̄2): 2.88
cat("Diferencia de medias (x̄1 - x̄2):", round(diff_means, 4), "\n")
## Diferencia de medias (x̄1 - x̄2): 0.13
cat("Intervalo de confianza (95%):", round(IC[1], 4), "a", round(IC[2], 4), "\n")
## Intervalo de confianza (95%): -0.1064 a 0.3664
if (IC[1] > 0 & IC[2] > 0) {
cat("Conclusión: Como el intervalo no incluye el 0, podemos afirmar con un 95% de confianza que los fumadores tienen un mayor absentismo laboral en promedio que los no fumadores.\n")
} else {
cat("Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.\n")
}
## Conclusión: Como el intervalo incluye el 0, no hay suficiente evidencia para afirmar que hay una diferencia significativa en el absentismo laboral entre fumadores y no fumadores.
Interpretacion: Lo que ocurre aquí es que, aunque los números sugieren que los fumadores se ausentan más (3,01 horas frente a 2,88), esa brecha de 0,13 horas es demasiado pequeña para considerarla una regla general. Al realizar el análisis con un 95% de confianza, el intervalo resultante atrapa al cero, lo que en estadística significa que no hay pruebas contundentes de una diferencia real entre ambos grupos. En términos prácticos, el estudio nos dice que las variaciones observadas probablemente son fruto de la casualidad y no del hábito de fumar, por lo que no se puede concluir que un grupo falte al trabajo más que el otro.
El objetivo es calcular un intervalo de confianza del 90% tanto para la varianza como para la desviación estándar poblacional de la rentabilidad diaria de la cartera.
Datos
Tamaño de la muestra: n=15
Desviación estándar muestral: s=0.8
Grados de libertad: v=n−1=14
Valores críticos de Chi-cuadrado: χ20.05,14=23.68
χ20.95,14=6.57
Nivel de confianza: 90% Cálculo del Intervalo de Confianza para la Varianza
El intervalo de confianza para la varianza poblacional se basa en la distribución Chi-cuadrado:
\(\left(\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}}, \frac{(n-1)s^2}{\chi^2_{\alpha/2}}\right)\)
Donde:
χ21−α/2 y χ2α/2 son los valores críticos de la distribución Chi-cuadrado.
s2 es la varianza muestral.
n−1 son los grados de libert ad.
n <- 15
s <- 0.8
gl <- n - 1
chi2_inf <- qchisq(0.95, df = gl)
chi2_sup <- qchisq(0.05, df = gl) #
varianza_inf <- (gl * s^2) / chi2_inf
varianza_sup <- (gl * s^2) / chi2_sup
IC_varianza <- c(varianza_inf, varianza_sup)
IC_desviacion <- sqrt(IC_varianza)
cat("### Intervalo de Confianza del 90% para la varianza ###\n")
## ### Intervalo de Confianza del 90% para la varianza ###
cat("Intervalo de confianza (90%):", round(IC_varianza[1], 4), "a", round(IC_varianza[2], 4), "\n")
## Intervalo de confianza (90%): 0.3783 a 1.3636
cat("\n### Intervalo de Confianza del 90% para la desviación estándar ###\n")
##
## ### Intervalo de Confianza del 90% para la desviación estándar ###
cat("Intervalo de confianza (90%):", round(IC_desviacion[1], 4), "a", round(IC_desviacion[2], 4), "\n")
## Intervalo de confianza (90%): 0.6151 a 1.1678
Interpretacion: Lo que este análisis nos revela es qué tan volátil o “nerviosa” es realmente la rentabilidad de esta cartera de inversión más allá de lo que vimos en los 15 días de la muestra. Aunque observamos una desviación del 0,8%, el estudio nos dice con un 90% de seguridad que la verdadera fluctuación de todo el portafolio se mueve en un rango de entre 0,61% y 1,16%. Básicamente, esto le sirve al analista para no confiarse solo del dato puntual y entender que, en el peor de los casos, la rentabilidad podría variar un poco más de un punto porcentual, permitiéndole medir el riesgo real con mucha más precisión.
El ingeniero de manufactura desea seleccionar el proceso que tenga la menor variabilidad en la rigurosidad de la superficie.
Para ello, toma una muestra de 12 partes del primer proceso, con una desviación estándar muestral de 5.1 micro pulgadas.
En el segundo proceso, se toma una muestra aleatoria de 15 partes, con una desviación estándar muestral de 4.7 micro pulgadas.
Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas.
Datos
Muestra del primer proceso: n1=12 Desviación estándar muestral: s1=5.1
Varianza muestral: s21 Muestra del segundo proceso: n2=15 Desviación estándar muestral: s2=4.7
Varianza muestral: s22 Nivel de confianza: 90% Distribución F: Usaremos los grados de libertad df1=n1−1 y df2=n2−1 . Cálculo del Intervalo de Confianza para el Cociente de Varianzas
El intervalo de confianza para la razón de varianzas se basa en la distribución F:
\(IC = \left(\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{1-\alpha/2,\,df_1,\,df_2}}, \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2,\,df_1,\,df_2}\right)\)
Donde:
Fα/2,df1,df2 y F1−α/2,df1,df2 son los valores críticos de la distribución F.
s21 y s22 son las varianzas muestrales.
n1−1 y n2−1 son los grados de libertad.
n1 <- 12
s1 <- 5.1
var1 <- s1^2
n2 <- 15
s2 <- 4.7
var2 <- s2^2
F_stat <- var1 / var2
df1 <- n1 - 1
df2 <- n2 - 1
F_inf <- qf(0.95, df1, df2)
F_sup <- qf(0.05, df1, df2)
cat("### Intervalo de Confianza del 90% para el Cociente de Varianzas ###\n")
## ### Intervalo de Confianza del 90% para el Cociente de Varianzas ###
cat("Cociente de varianzas (s1² / s2²):", round(F_stat, 4), "\n")
## Cociente de varianzas (s1² / s2²): 1.1775
cat("Valores críticos de F:", round(F_inf, 4), "y", round(F_sup, 4), "\n")
## Valores críticos de F: 2.5655 y 0.3651
Interpretacion: El objetivo del ingeniero es encontrar cuál de los dos métodos de fabricación es más estable, es decir, cuál tiene menos variabilidad en el acabado de las piezas. Al comparar el cociente de las varianzas, vemos que el resultado es 1,17, y aunque el primer proceso parece ser un poco más “irregular” que el segundo (5,1 frente a 4,7 en desviación), el análisis estadístico nos dice que esa diferencia no es concluyente. Como el intervalo de confianza para este cociente seguramente incluirá al número 1, no tenemos evidencia suficiente para decir que un proceso sea realmente más variable que el otro; para efectos prácticos, ambos métodos son igual de consistentes y el ingeniero podría elegir cualquiera de los dos sin temor a que uno sea significativamente más inestable.
194.65<μ<197.75
Sin embargo, el director de producción considera que este intervalo es demasiado amplio y exige un intervalo con el mismo nivel de confianza, pero cuya longitud a cada lado de la media muestral no supere 0.5 milímetros.
Se requiere calcular el tamaño muestral necesario para construir tal intervalo.
Datos
Error máximo permitido: e=0.5 mm Desviación estándar poblacional: σ=1.8 mm Nivel de confianza: 99% Valor crítico: Zα/2=Z0.005=2.575 Cálculo del Tamaño Muestral
El tamaño muestral necesario se obtiene con la siguiente fórmula:
\[ n = \left( \frac{Z_{\alpha/2} \sigma}{e} \right)^2 \] Donde: Zα/2 es el valor crítico de la distribución normal estándar para un 99% de confianza.
σ es la desviación estándar poblacional.
e es el error máximo permitido en cada lado del intervalo.
e <- 0.5
sigma <- 1.8
z_alpha_2 <- qnorm(0.995)
n <- ( (z_alpha_2 * sigma) / e )^2
n_requerido <- ceiling(n)
cat("Nivel de confianza:", "99%\n")
## Nivel de confianza: 99%
cat("Valor crítico Zα/2:", round(z_alpha_2, 4), "\n")
## Valor crítico Zα/2: 2.5758
cat("Desviación estándar σ:", sigma, "mm\n")
## Desviación estándar σ: 1.8 mm
cat("Error permitido e:", e, "mm\n")
## Error permitido e: 0.5 mm
cat("Tamaño muestral necesario n:", round(n, 2), "\n")
## Tamaño muestral necesario n: 85.99
cat("Tamaño muestral requerido (redondeado):", n_requerido, "observaciones\n")
## Tamaño muestral requerido (redondeado): 86 observaciones
Interpretacion: Lo que este cálculo nos indica es que, para cumplir con la exigencia del director de producción de tener una precisión mucho más alta (un margen de error de apenas 0,5 mm), la muestra inicial de solo 9 barras es totalmente insuficiente. Al aplicar la fórmula con un nivel de confianza del 99%, el resultado nos muestra que necesitamos analizar exactamente 86 barras de metal para garantizar que nuestras mediciones sean así de exactas. En resumen, si queremos reducir el margen de duda y tener un intervalo de confianza más estrecho y confiable, la única solución matemática es aumentar el volumen de trabajo y estudiar una muestra significativamente más grande que la original.
\[ 0.533 \leq \pi \leq 0.693 \] Ahora, se desea construir un intervalo de confianza del 95% con una longitud a cada lado de la proporción muestral que no supere 0.06.
Se requiere determinar cuántas observaciones son necesarias para obtener este nuevo intervalo más preciso.
Datos
Error máximo permitido: e=0.06
Nivel de confianza: 95% Valor crítico: Zα/2=Z0.025=1.96
Dado que p es desconocido, usamos p=0.5 (máxima varianza). Cálculo del Tamaño Muestral
El tamaño muestral necesario se obtiene con la siguiente fórmula:
\[ n = \frac{(0.25)\, Z_{\alpha/2}^{2}}{e^{2}} \] Donde:
Zα/2 es el valor crítico de la distribución normal estándar para un 95% de confianza.
0.25 es la varianza máxima posible de una proporción cuando p es desconocido.
e es el error máximo permitido en cada lado del intervalo.
e <- 0.06
p <- 0.5
z_alpha_2 <- qnorm(0.975)
n <- (0.25 * (z_alpha_2^2)) / (e^2)
n_requerido <- ceiling(n)
cat("Nivel de confianza:", "95%\n")
## Nivel de confianza: 95%
cat("Valor crítico Zα/2:", round(z_alpha_2, 4), "\n")
## Valor crítico Zα/2: 1.96
cat("Proporción asumida p:", p, "\n")
## Proporción asumida p: 0.5
cat("Error permitido e:", e, "\n")
## Error permitido e: 0.06
cat("Tamaño muestral necesario n:", round(n, 2), "\n")
## Tamaño muestral necesario n: 266.77
cat("Tamaño muestral requerido (redondeado):", n_requerido, "observaciones\n")
## Tamaño muestral requerido (redondeado): 267 observaciones
Interpretacion: Lo que estamos haciendo aquí es blindar la validez de una investigación sobre contratación laboral. Al definir que queremos una precisión de 0,06 a cada lado de la respuesta, el cálculo nos indica que una muestra pequeña no sería representativa; se requiere alcanzar las 267 observaciones para reducir la incertidumbre. Básicamente, esta interpretación le dice a quien realiza el estudio que, si quiere que sus conclusiones sobre la importancia del expediente académico sean serias y confiables bajo un estándar del 95%, ese es el número mínimo de personas que debe entrevistar para que el azar no juegue en su contra.