Integrantes:
Leonardo Cuadro - 2241951-3743
Elkin Angulo - 2240578-3743
Cristian Pinzón - 2179921-3743

Desarrollo

1. Agua embotellada

En una envasadora de agua purificada se producen botellas que tienen, en promedio, medio litro de agua, con una desviación estándar de 5 ml (mililitros). Si se sabe por experiencia que la distribución de los contenidos de agua de estas botellas tiene distribución normal, determinar qué porcentaje de las botellas que se fabrican tiene entre 490 y 510 ml.

Solución:
Identificamos que la variable aleatoria es la cantidad de agua en las botellas, y que se tiene una distribución normal con un promedio de medio litro (500 ml) y una desviación estandar de 5 ml. Así que se tiene que:

Sea \(C:\) La cantidad de agua en las botellas

\(\mu= 500\) , el promedio

\(\sigma= 5\) , la desviación estándar:

\(C \sim Normal(\mu=500, \sigma=5)\)

Haciendo una simulación, podemos ver un histograma con la forma de la distribución normal

CantidadAgua=rnorm(1000,500,5)
hist(CantidadAgua, main ="Histograma Cantidad de Agua en Botellas", xlab="Cantidad de agua",
     ylab="Cantidad de Botellas")

Ahora bien, nos preguntan

¿Qué porcentaje de las botellas que se fabrican tienen entre 490 y 510 ml.?

Usaremos la definición de la variable Z para calcular las probabilidades:

\(Z=\frac{C-\mu}{\sigma}\)

\(P(490 \leq C \leq 510) = P(C \leq 510)-P(C \leq 490)\)

\(P(490 \leq C \leq 510) = P(Z \leq \frac{510-500}{5})-P(Z \leq \frac{490-500}{5})\)

\(P(490 \leq C \leq 510) = P(Z \leq 2)-P(Z \leq -2)\)

\(P(490 \leq C \leq 510) = 0.9772 - 0.0228\)

\(P(490 \leq C \leq 510) = 0.9544\)

Respuesta:

El porcentaje de las botellas que se fabrican que tienen entre 490 y 510 ml es de 0.9544

También es posible hacerlo con la función pnorm de R:
0.9772499-0.0227501= 0.9544

2. Observaciones

En una población de observaciones que tiene distribución normal y desviación estándar de 10, la probabilidad de que una observación elegida al azar sea mayor de 50 es de 20%. Determine:

a. La media de la población.

Solución:
Vemos que la variable aleatoria es el valor de la observación, y que tenemos una desviación de estándar, asi que nos falta el promedio.

Sea \(X:\) el valor de la observación.

\(\sigma= 10\) , la desviación estándar

\(\mu= ?\) , el promedio

Con la información que nos dan, de que la probabilidad de que una observación elegida al azar sea mayor de 50 es de 20%, despejando en la ecuación de Z podemos hallar el promedio.

\(P(X > 50) = 0.2\)

\(P(X > 50) = 1-P(X \leq 50)\)

\(1-P(X \leq 50)=0.2\)

\(P(X \leq 50)=1-0.2=0.8\)

\(P(Z \leq \frac{50-\mu}{10})=0.8\)

Buscamos en la tabla de la normal la columna y fila que le corresponde a 0.8 o 0.8000, y ese sera el valor de Z que usaremos para hacer una regla de 3. Se encuentra 0.7995 que es lo más aproximado a 0.8 por eso se escoge la columna 0.8 y la fila .04.

\(Z=0.84\)

\(\frac{50-\mu}{10}=0.84\)

\(\mu=-(0.84*10)+50\)

\(\mu=41.6\)

Respuesta:

La media o promedio de la población es 41.6

b. El valor por encima del cual se encuentra 5% del total de las observaciones.

Ahora que ya tenemos \(\mu:41.6\) y \(\sigma:10\) podemos ejecutar una simulación de como se veria la distribución de las observaciones, con el modelo de distribución normal.

Observaciones=rnorm(1000,41.6,10)
hist(Observaciones, main ="Histograma de Valores de Observaciones", xlab="Valor",
     ylab="Observaciones")

\(\text{Para responder la pregunta hacemos los cálculos necesarios}\)

Tenemos que hallar \(x\) dado que \(P(X>x)=0.05\)

Se sabe que \(1-P(X \leq x)=P(X>x)\)

Y se reemplaza, \(1-P(X \leq x)=0.05\)

\(P(X \leq x)=-0.05+1\)

Por lo tanto

\(P(X \leq x)=0.95\)

\(P(X \leq x)= P(Z \leq x)\)

\(P(X \leq x)=P(Z \leq \frac{x-\mu}{\sigma})\)

\(P(X \leq x)=P(Z \leq \frac{x-41.6}{10})=0.95\)

Al igual que el punto anterior, buscamos la fila y columna de la probabilidad igual a 0.95 0 0.9500, lo cual nos indica que el valor de Z es 1.65 aproximadamente.

\(\frac{x-41.6}{10}=1.65\)

\(x=(1.65*10)+41.6\)

\(x=58.1\)

Respuesta:

El valor por encima del cual se encuentra el 5% del total de las observaciones es de 58.1

3. Lectores de Harry Potter

De todos los libros de Harry Potter comprados en un año reciente, alrededor del 60% fueron comprados por lectores de 14 años o más.2 Si se entrevista a 12 aficionados de Harry Potter que compraron libros ese año y si p=0.6, encuentre las siguientes probabilidades

  1. Al menos cinco de ellos tenían 14 años o más.

  2. Exactamente nueve de ellos tenían 14 años o más.

  3. Tres o menos de ellos tenían 14 años o más.

  4. Más de dos de ellos tengan menos de 14 años.

Se puede afirmar por el enunciado que tenemos un modelo binomial

Recordemos que en este modelo tenemos dos parametros, n que es el número de ensayos y p que es la probabilidad de éxito. Así mismo X es una variable aleatoria que representa el número de éxitos en n ensayos.

La función de probabilidad está dada por:

\(p(x) = \binom{n}{x} p^x (1-p)^{n-x}\)

Debido a la complejidad de la función, para algunos cálculos usaremos el comando dado por R que nos simplifica el trabajo, cuya forma es:

r pbinom(x,n,p,lower.tail = TRUE)

Donde lower.tail=TRUE es igual a \(P(X \leq x)\) y lower.tail=FALSE es \(P(X>x)\).

Ahora identificamos los parametros dados en el enunciado.

Sea \(X:\) Número de lectores de Harry Potter con 14 años o más que compraron libros en un año reciente.

\(n=12\)
\(p=0.6\)

\(X\sim Binomial(n=12,p=0.6)\)

Ejecutamos una simulación de como se veria la distribución de la variable, con el modelo de distribución binomial

Harry=rbinom(100,12,0.6)
barplot(table(Harry), main="Histograma Lectores de 14 años o más", xlab="N de lectores de 14 años o más", ylab = "Cantidad de observaciones", ylim = c(0, 100),xlim=c(0,12))

Ahora, respondamos a las probabilidades que nos preguntan.

a. Al menos cinco de ellos tenian 14 años o más.

Esto es \(P(X\geq 5)\)

Lo haremos con el comando de R que lo hace directamente con lower.tail=FALSE

P(X>5)=0.8417877

A esto le sumamos \(P(X=5)=0.1009\), ya que el anterior no toma X=5,para asi lograr \(P(X\geq 5)\)

\(P(X\geq 5) =\) 0.1009 + 0.8417

\(P(X\geq 5) =\) 0.9426

Respuesta:

La probabilidad de que al menos cinco lectores tuvieran 14 años o más es de 0.9426.

b. Exactamente nueve de ellos tenían 14 años o más.

Usaremos la función de probabilidad en este caso sencillo.

\(p(X=x) = \binom{12}{x} 0.6^x (1-0.6)^{12-x}\)

\(p(X=9) = \binom{12}{9} 0.6^9 (1-0.6)^{12-9}\)

Usamos app de Bognar

\(p(X=9) = 0.14189\)

Respuesta:

La probabilidad de que exactamente nueve de ellos tuvieran 14 años o más es de 0.1418.

c. Tres o menos de ellos tenían 14 años o más.

Esto es,

\(P(X\leq 3)=P(X=1)+P(X=2)+P(X=3)\)

Usamos comando de R con lower.tail=TRUE

\(P(X\leq 3)=\) 0.0152673

Respuesta:

La probabilidad de que tres o menos de los lectores tuvieran 14 años o más es de 0.0152673

d. Más de dos de ellos tengan menos de 14 años.

Que tengan menos de 14 años es el evento fracaso y es igual a 1-p, osea 1-0.6 = 0.4.

Trabajaremos con el siguiente modelo entonces.

Sea \(X:\) Número de lectores de Harry Potter con menos de 14 años que compraron libros en un año reciente.

\(n=12\)
\(p=0.4\)

\(X\sim Binomial(n=12,p=0.4)\)

Y calculamos P(X>2)

Que también se puede ver como \(P(X>2)=1-P(X \leq 2)\)

Pero usamos comando de R con lower.tail=FALSE que lo hace directo.

$P(X>2)=$0.9165567

Respuesta:

La probabilidad de que más de 2 de los lectores tengan menos de 14 años es de 0.9165.