Ejericio 7.13

La Environmental Protection Agency se ocupa del problema de establecer criterios para las cantidades de sustancias químicas tóxicas permitidas en lagos y ríos de agua dulce. Una medida común de toxicidad para cualquier contaminante es la concentración de éste que mataría a la mitad de la especie de prueba en un tiempo determinado (por lo general \(96\) horas para especies de peces). Esta medida se denomina \(CL50\) (concentración letal que mata \(50\%\) de la especie de prueba). En muchos estudios, los valores contenidos en el logaritmo natural de mediciones del \(CL50\) están distribuidos normalmente y, en consecuencia, el análisis está basado en datos del \(\ln (CL50)\). Estudios de los efectos del cobre en cierta especie de peces (por ejemplo la especie \(A\)) muestran que la varianza de mediciones de \(\ln (CL50)\) es alrededor de \(.4\) con mediciones de concentración en miligramos por litro. Si han de completarse \(n = 10\) estudios sobre el \(CL50\) para cobre, encuentre la probabilidad de que la media muestral de \(\ln (CL50)\) difiera de la verdadera media poblacional en no más de \(.5\).

Para encontrar esta probabilidad se necesita que la diferencia absoluta entre la media muestral y la media poblacional sea menor que \(0.5\), esto es \(P(|\overline{Y} – μ| ≤ .5)=P(–0.5 ≤ \overline{Y} – μ ≤ 0.5)=P(–0.5/\sqrt{0.4/10} ≤ Z ≤ 0.5/\sqrt{0.4/10})=P(–2.5 ≤ Z ≤ 2.5)=P(Z≤ 2.5) - P(Z ≤ -2.5)\). Esta probabilidad es de:

pnorm(2.5)-pnorm(-2.5)
## [1] 0.9875807

Ejercicio 7.17

Hallar \(P(\sum_{i=1}^6 Z_i^2 \leq 6)\).

Como \(\sum_{i=1}^6 Z_i^2\) tiene una distribución \(\chi ^2\) con \(6\) grados de libertad está probabilidad es:

pchisq(6,6)
## [1] 0.5768099
library(ggplot2)
chiSqStat <- 6
ggplot(data.frame(x=c(0,25)), aes=(x = x)) +
  stat_function(fun = dchisq, xlim=c(0,25), args=list(df = 6)) + 
  stat_function(fun = dchisq,
                args = list(df = 6),
                xlim = c(0,chiSqStat),
                geom = "area",
                alpha = 0.2) + 
  geom_vline(xintercept = chiSqStat, col = "purple") + 
  labs(x = "Chi-Cuadrada", y="Probabilidad")

Ejercicio 7.18

Si \(\sigma^2 = 1\) y \(n = 10\), hallar \(P(S^2 ≥ 3)\).

Se tiene que \(\frac{(n-1)S^2}{\sigma ^2}\), es una distribución \(\chi ^2\) con \(n-1\) grados de libertad. Entonces \(P(S^2 ≥ 3)=P((n-1)S^2 ≥ (n-1)3)=P\Big(\frac{(n-1)S^2}{\sigma ^2} ≥ \frac{(n-1)3}{\sigma ^2}\Big)=P(9S^2 \geq 27)\). ASí esta probabilidad es:

pchisq(27,10-1,lower.tail = FALSE)
## [1] 0.001398768
chiSqStat <- 27
ggplot(data.frame(x=c(0,35)), aes=(x = x)) +
  stat_function(fun = dchisq, xlim=c(0,35), args=list(df = 9)) + 
  stat_function(fun = dchisq,
                args = list(df = 9),
                xlim = c(chiSqStat,35),
                geom = "area",
                alpha = 0.2) + 
  geom_vline(xintercept = chiSqStat, col = "purple") + 
  labs(x = "Chi-Cuadrada", y="Probabilidad")

Ejercicio 7.19

Los amperímetros producidos por un fabricante se venden con la especifi cación de que la desviación estándar de las lecturas de la aguja no sea mayor que \(.2\) amperes. Uno de estos amperímetros se utilizó para hacer diez lecturas independientes en un circuito de prueba con corriente constante. Si la varianza muestral de estas diez mediciones es \(.065\) y es razonable suponer que las lecturas están distribuidas normalmente, ¿los resultados sugieren que el amperímetro empleado no satisface las especifi caciones del mercado? [Sugerencia: encuentre la probabilidad aproximada de que la varianza muestral será mayor que \(.065\) si la verdadera varianza poblacional es \(.04\).]

Del problema se tiene que la varianza muestral es \(s^2 = 0.065\) y el tamaño de la muestra son las lecturas independientes, esto es, \(n=10\). Además se supone que la verdadera varianza poblacional es \(\sigma ^2 = 0.2^2=0.04\). Así, la probabilidad aproximada de que la varianza muestral sea mayor que \(0.065\) es \(P(S^2 \geq 0.065)=P((n-1)S^2 \geq (n-1)0.065)=P\Big(\frac{(n-1)S^2}{\sigma ^2} \geq \frac{(n-1)0.065}{\sigma ^2}\Big)=P(9S^2/0.04 \geq 9(0.065)/0.04)\). ESta probabilidad es igual a:

pchisq(9*0.064/0.04,10-1,lower.tail = FALSE)
## [1] 0.108791
chiSqStat <- 9*0.064/0.04
ggplot(data.frame(x=c(0,25)), aes=(x = x)) +
  stat_function(fun = dchisq, xlim=c(0,25), args=list(df = 9)) + 
  stat_function(fun = dchisq,
                args = list(df = 9),
                xlim = c(chiSqStat,25),
                geom = "area",
                alpha = 0.2) + 
  geom_vline(xintercept = chiSqStat, col = "purple") + 
  labs(x = "Chi-Cuadrada", y="Probabilidad")

Como esta probabilidad es relativamente pequeña, se sigue que no es muy razonable suponer que \(\sigma ^2 = 0.04\).

Ejercicio 7.21

Consulte el Ejercicio \(7.13\). Suponga que \(n = 20\) observaciones se han de tomar a mediciones \(\ln (CL50)\) y que \(\sigma ^2 = 1.4\). Denote con \(S^2\) la varianza muestral de las \(20\) mediciones.

a)

Encuentre un número \(b\) tal que \(P(S^2 ≤ b) = 0.975\).

Con \(\sigma ^2 = 1.4\) y \(n = 20\) se tiene que \(\frac{(20-1)}{1.4}S^2\) es una distribución \(\chi ^2\) con \(19\) grados de libertad. Así, \(P(S^2 \leq b)=P\Big(\frac{(n-1)S^2}{\sigma ^2} \leq \frac{(n-1)b}{\sigma ^2}\Big)=P\Big(\frac{19}{1.4}S^2 \leq \frac{19}{1.4}b\Big)=0.975\). Por lo que el valor de \(b\) se encuentra como:

1.4*qchisq(.975,19)/19
## [1] 2.420698

b)

Encuentre un número \(a\) tal que \(P(a ≤ S^2 ) = 0.975\).

Análogo al inciso anterior \(P(a \leq S^2)=P\Big(\frac{(n-1)a}{\sigma ^2} \leq \frac{(n-1)S^2}{\sigma ^2} \Big)=P\Big(\frac{19}{1.4}a \leq \frac{19}{1.4}S^2\Big)=0.975\). Esto implica que \(1-P\Big(\frac{19}{1.4}a \leq \frac{19}{1.4}S^2\Big)=P\Big(\frac{19}{1.4}S^2 \leq \frac{19}{1.4}a\Big)=1-0.975=0.025\). Y el valor de \(a\) se obtiene como:

1.4*qchisq(.025,19)/19
## [1] 0.6562696

c)

Si \(a\) y \(b\) son como en los incisos \(a)\) y \(b)\), ¿cuál es \(P(a ≤ S^2 ≤ b)\)?

Se tiene que \(P(a ≤ S^2 ≤ b) = P(S^2 \leq b) - P(S^2 \leq a) = P\Big(\frac{19}{1.4}S^2 \leq \frac{19}{1.4}b\Big) - P\Big(\frac{19}{1.4}S^2 \leq \frac{19}{1.4}a\Big)\), que al retomar los valores para \(a\) y \(b\) obtenidos anterioremente se llega a que la probabilidad buscada es:

a <- 1.4*qchisq(.025,19)/19
b <- 1.4*qchisq(.975,19)/19
pchisq(19*b/1.4,19) - pchisq(19*a/1.4,19)
## [1] 0.95

Ejericio 8.67

Un método sugerido para resolver la escasez de energía eléctrica en una región comprende la construcción de plantas nucleares flotantes generadoras de energía eléctrica a pocas millas de la costa en el océano. La preocupación por la posibilidad de una colisión de barcos con la planta flotante, pero anclada, ha aumentado la necesidad de una estimación de la densidad del tránsito de barcos en la zona. El número de barcos que pasan diariamente a no más de \(10\) millas de la ubicación propuesta de la planta eléctrica, registrada para \(n = 60\) días durante julio y agosto, poseía una media muestral y varianza de \(\overline{y }= 7.2\) y \(s^2 = 8.8\).

a)

Encuentre un intervalo de confianza de \(95\%\) para el número medio de barcos que pasen a no más de \(10\) millas del lugar propuesto para la planta eléctrica durante un período de \(1\) día.

Aplicando la fórmula para el cálculo del intervalo de confianza de la media de barcos con \(s^2\) conocida, se tiene que al \(95\%\) de confianza este es de \(7.2 \pm z_{0.975}\sqrt{\frac{8.8}{60}}\), lo que da valores de:

7.2 + c(-qnorm(.975)*sqrt(8.8/60),qnorm(.975)*sqrt(8.8/60))
## [1] 6.449391 7.950609

b)

Se esperaba que la densidad de tránsito disminuyera durante los meses de invierno. Una muestra de \(n= 90\) registros diarios de avistamientos de barcos para diciembre, enero y febrero dieron una media y varianza de \(\overline{y} = 4.7\) y \(s^2 = 4.9\). Encuentre un intervalo de confianza de \(90\%\) para la diferencia en la densidad promedio de tránsito de barcos entre los meses de verano e invierno.

Aplicando la fórmula para el intervalo de una diferencia de medias se tiene que \((7.2-\overline{y}) \pm z_{.95}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}=(7.2-4.7) \pm z_{.95}\sqrt{\frac{8.8}{60}+\frac{4.9}{90}}\), que al calcularo se obtiene:

(7.2-4.7) + c(-qnorm(.95)*sqrt(8.8/60+4.9/90),qnorm(.95)*sqrt(8.8/60+4.9/90))
## [1] 1.762359 3.237641

c)

¿Cuál es la población asociada con la estimación en el inciso \(b)\)? ¿Qué podría estar mal con el procedimiento de muestreo para los incisos \(a\) y \(b\)?

La población asociada con esta estimación es el número de barcos que pasan diariamente a no más de \(10\) millas de la ubicación propuesta de la planta eléctrica. Los posibles problemas asociados con este muestreo es que no se hagan observaciones que cumplan el supuesto de independencia para poder contar con variables aleatorias independiesntes e idénticamente distribuidas para poder aplicar correctamente las fórmulas. Esto es, que las observaciones no se hayan tomado de manera aleatoria.

Ejercicio 8.71

Un servicio estatal de fauna silvestre desea calcular el número promedio de días que cada cazador con licencia se dedica a esta actividad realmente durante una estación determinada, con un límite en el error de estimación igual a \(2\) días de caza. Si los datos recolectados en estudios anteriores han demostrado que \(\sigma\) es aproximadamente igual a \(10\), ¿cuántos cazadores deben estar incluidos en el estudio?

Aplicando la fórmula para el tamaño de la muestra, \(n=z^2\sigma ^2/B^2=25z^2\). Así, si por ejemplo se quiere un nivel de confianza del \(95\%\), se sabe que el número promedio de días estarán a no más de \(2\sigma\) de \(\mu\) en muestreos repetidos, por lo que se requeriría un valor de \(n=25(4)=100\) cazadores para incluir en el estudio.