El artículo Direct Strut-and-Tie Model for Prestressed Deep Beams (K. Tan, K. Tong y C. Tang, en Journal of Structural Engineering, 2001:1076-1084) presenta mediciones de la fuerza nominal de corte (en kN) para una muestra de 15 vigas de concreto. Los resultados son:
580 400 428 825 850 875 920 550 575 750 636 360 590 735 950
¿Es adecuado utilizar la estadística t de Student para construir un intervalo de confianza de 99% para la media de la fuerza de corte? Si es así, construya el intervalo de confianza. Si no, explique por qué.
Dado que el tamaño de muestra no es grande (\(n = 15\)), y además, dado que hay evidencia empírica de que la muestra no proviene de una distribución Normal (pues la media y media muestral son disimiles y además los puntos del gráfico cuantil-cuantil no están alineados sobre la línea de 45 grados), no se recomienda utilizar la estadística t de Student para construir un intervalo de confianza de 99% para la media de la fuerza de corte.
# datos
x <- c(580, 400, 428, 825, 850, 875, 920, 550, 575, 750, 636, 360, 590, 735, 950)
# tamaño de muestra
n <- length(x)
n
## [1] 15
# tendencia central
summary(x)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 360.0 562.5 636.0 668.3 837.5 950.0
# grafico cuantil-cuantil
qqnorm(y = x, xlab = "Cuantiles teóricos", ylab = "Cuantiles observados", main = "Gráfico cuantil-cuantil")
qqline(y = x, col = 2)
En el artículo referido en el problema anterior, la fuerza compresiva cilíndrica (en MPa) fue medida para 11 vigas. Los resultados fueron:
38.43 38.43 38.39 38.83 38.45 38.35 38.43 38.31 38.32 38.48 38.50
¿Es adecuado utilizar la estadística t de Student para construir un intervalo de confianza de 95% para la media de la fuerza compresiva cilíndrica? Si es así, construya el intervalo de confianza. Si no, explique por qué.
En este caso sí es adecuado utilizar la estadística t de Student para construir un intervalo de confianza de 95% para la media de la fuerza compresiva cilíndrica, porque el tamaño de la muestra no es grande (\(n=11\)) y además no hay evidencia empírica de que la muestra no provenga de una distribución Normal (pues la media y media muestral son similares y además los puntos del gráfico cuantil-cuantil están alineados sobre la línea de 45 grados).
Así, el intervalo de confianza para la media de la media de la fuerza compresiva cilíndrica \(\mu_X\) cuando \(\sigma_X\) es desconocida es \[ \textsf{IC}_{100(1-\alpha)\%}(\mu_X)=\bar{X} \pm \textsf{t}_{n-1,1-\alpha/2}\frac{S}{\sqrt{n}} \] que al calcularse con la muestra observada da como resultado \((38.35;38.54)\). Por lo tanto, con una confiabildad del 95% se tiene que la media de la media de la fuerza compresiva cilíndrica se encuentra entre 38.35 MPa y 38.54 MPa.
# datos
x <- c(38.43, 38.43, 38.39, 38.83, 38.45, 38.35, 38.43, 38.31, 38.32, 38.48, 38.50)
# tamaño de muestra
n <- length(x)
n
## [1] 11
# tendencia central
summary(x)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 38.31 38.37 38.43 38.45 38.47 38.83
# grafico cuantil-cuantil
qqnorm(y = x, xlab = "Cuantiles teóricos", ylab = "Cuantiles observados", main = "Gráfico cuantil-cuantil")
qqline(y = x, col = 2)
# intervalo de confianza
mean(x) + c(-1,1)*qt(p = 0.975, df = n-1)*sd(x)/sqrt(n)
## [1] 38.35250 38.54205
# otra manera usando t.test
t.test(x = x)
##
## One Sample t-test
##
## data: x
## t = 903.89, df = 10, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 38.35250 38.54205
## sample estimates:
## mean of x
## 38.44727
FALSO. La distribución t de Student se puede utilizar para construir un intervalo de confianza para la media de cualquier población, en tanto que el tamaño muestral sea grande. Si el tamaño de muestra es pequeño y la distribución de la población no es Normal, entonces la cantidad \(\frac{\bar{X}-\mu}{S/\sqrt{n}}\) no tiene distribución \(\textsf{t}\) Student.
En 2000 fueron visitados 30 restaurantes de comida rápida entre los que se encontraban Wendy’s, McDonald’s y Burger King (The Cincinnati Enquirer, 9 de julio de 2000). Se registró el tiempo que transcurría entre que el cliente hiciera su pedido y la recepción del mismo. Los tiempos en los 30 restaurantes visitados fueron los siguientes:
0.9 1.0 1.2 2.2 1.9 3.6 2.8 5.2 1.8 2.1 6.8 1.3 3.0 4.5 2.8 2.3 2.7 5.7 4.8 3.5 2.6 3.3 5.0 4.0 7.2 9.1 2.8 3.6 7.3 9.0
El tamaño de la muestra es \(n=30\) y la estimación puntual de la media poblacional correpondiente es \(\bar{x} = 3.8\).
# datos
x <- c(0.9, 1.0, 1.2, 2.2, 1.9, 3.6, 2.8, 5.2, 1.8, 2.1, 6.8, 1.3, 3.0, 4.5, 2.8, 2.3, 2.7, 5.7, 4.8, 3.5, 2.6, 3.3, 5.0, 4.0, 7.2, 9.1, 2.8, 3.6, 7.3, 9.0)
# tamaño de la muestra
n <- length(x)
n
## [1] 30
# estimacion puntual
xb <- mean(x)
xb
## [1] 3.8
El margen de error se puede calcular con la distribución Normal estándar dado que el tamaño de la muestra es “grande” (\(n\geq 30\)). Por lo tanto, el margen de error correspondiente es \(ME = 0.8077\).
# margen de error
me <- qnorm(p = 0.975)*sd(x)/sqrt(n)
me
## [1] 0.8077313
Restando y sumando el margen de error a la estamación puntual reportada anteriormente, se tiene que el intervalo de confianza al 95% para la media poblacional de los tiempos de espera es \((2.99;4.61)\)
# intervalo de confianza
mean(x) + c(-1,1)*qnorm(p = 0.975)*sd(x)/sqrt(n)
## [1] 2.992269 4.607731
Hay evidencia empírica de que la muestra no proviene de una distribución Normal (pues la media y media muestral son disimiles y además los puntos del gráfico cuantil-cuantil no están alineados sobre la línea de 45 grados). La muestra evidencia que los datos provienen de una población con sesgo positivo porque la media es superior a la mediana.
# tendencia central
summary(x)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.900 2.225 3.150 3.800 4.950 9.100
# grafico cuantil-cuantil
qqnorm(y = x, xlab = "Cuantiles teóricos", ylab = "Cuantiles observados", main = "Gráfico cuantil-cuantil")
qqline(y = x, col = 2)
El margen de error al 95% para la media poblacional para muestras grandes es \[ ME = 1.96\cdot\frac{S}{\sqrt{n}} \qquad\text{y por lo tanto}\qquad n = \frac{1.96^2\cdot S^2}{ME^2}\,. \]
Teniendo en cuenta que una muestra piloto muestra que \(s=0.15\), entonces los tamaños de muestra para diferentes margenes de error son:
# tamaños de muestra
tab <- (1.96^2)*(0.15^2)*(1/c(0.07,0.05,0.03)^2)
names(tab) <- paste0("ME=",c(0.07,0.05,0.03))
ceiling(tab)
## ME=0.07 ME=0.05 ME=0.03
## 18 35 97
Se observa que los tamaños de muestra aumentan a medida que los tamaños de muestra aumentan.
Asumiendo que el peso en gramos de la población tenga distribución normal, un intervalo de confianza al 90% para la varianza poblacional del peso es \[ \left(\frac{(n-1)S^2}{\chi^2_{0.95,n-1}};\frac{(n-1)S^2}{\chi^2_{0.05,n-1}}\right) \] lo que calculado da como resultado \((0.222;0.708)\) gramos al cuadrado.
# tamaño de la muesta
n <- 18
# vrianza muestral
s2 <- 0.36
# intervalo de confianza
(n-1)*s2*(1/qchisq(p = c(0.95,0.05), df = n-1))
## [1] 0.2218427 0.7057391
Tomando la raíz cuadrada en los límites del intervalo anterior, se tiene que el intervalo de confainza correspondiente para la desviación estándar poblacional del peso en gramos es \((0.471;0.840)\) gramos.
# tamaño de la muesta
n <- 18
# vrianza muestral
s2 <- 0.36
# intervalo de confianza
sqrt((n-1)*s2*(1/qchisq(p = c(0.95,0.05), df = n-1)))
## [1] 0.4710018 0.8400828
Como se mencionó anteriormente, estos intervalos son válidos siempre y cuando la población de referencia sea Normal.
Un grupo de 12 analistas de seguridad proporcionó estimaciones, para el año 2001, de las ganancias por acción de Qualcomm, Inc. (Zacks.com, 13 de junio de 2000). Los datos son los siguientes:
1.40 1.40 1.45 1.49 1.37 1.27 1.40 1.55 1.40 1.42 1.48 1.63
La varianza muestral es \(s^2=0.0084\).
# datos
x <- c( 1.40, 1.40, 1.45, 1.49, 1.37, 1.27, 1.40, 1.55, 1.40, 1.42, 1.48, 1.63)
# tamaño de muestra
n <- length(x)
n
## [1] 12
# estimacion puntual de la varianza
s2 <- var(x)
s2
## [1] 0.008451515
La desviación estándar es \(s=0.0919\).
# estimacion puntual de la desviacion estandar
s <- sd(x)
s
## [1] 0.09193212
Asumiendo que las estimaciones de ganancia por acción tienen distribución Normal, un intervalo de confianza al 95% para la varianza poblacional es \[ \left(\frac{(n-1)S^2}{\chi^2_{0.975,n-1}};\frac{(n-1)S^2}{\chi^2_{0.025,n-1}}\right) \] y para la desviación estándar es \[ \left(\sqrt{\frac{(n-1)S^2}{\chi^2_{0.975,n-1}}};\sqrt{\frac{(n-1)S^2}{\chi^2_{0.025,n-1}}}\right) \]
que al calcularlos con la muestra observada dan como resultado \(( 0.0047 ;0.0203)\) y \((0.0687;0.1425)\), respectivamente.
En este caso sí es adecuado utilizar estos intervalos de confianza porque no hay evidencia empírica de que la muestra no provenga de una distribución Normal (pues la media y media muestral son similares y además los puntos del gráfico cuantil-cuantil están alineados sobre la línea de 45 grados).
# tendencia central
summary(x)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.270 1.400 1.410 1.438 1.482 1.630
# grafico cuantil-cuantil
qqnorm(y = x, xlab = "Cuantiles teóricos", ylab = "Cuantiles observados", main = "Gráfico cuantil-cuantil")
qqline(y = x, col = 2)