rm(list=ls())
[Resuelto en clase]
El diametro medido a la altura del pecho de una población fueguina de lengas sigue una distribución normal con media de 1 m y desviación estándar de 0,40 m. Un rodal (conjunto de árboles) se considera maderable (apto para la fabricación de listones) si el promedio de los diámetros de los ejemplares es superior a 0,95 m.
2.1.- Calcular la probabilidad de que un rodal de 100 lengas elegido al azar sea maderable.
Como la población sigue una distribución normal, entonces las medias muestrales seguirán también una distribución normal. Para que sea maderable necesito que el promedio de la muestra, o sea \(\overline{x}\), sea superior a 0.95.
mu <- 1
sd <- 0.4
n <- 100
sd_m <- sd/sqrt(n)
pnorm(0.95, mu, sd_m, lower.tail = F )
## [1] 0.8943502
La probabilidad de que eso ocurra es: 0.8943502.
2.2.- ¿Qué tamaño mínimo (número de lengas) deberá tener un rodal para ser maderable, con una probabilidad del 85 %? \[z=\frac{\overline{x}-\mu}{\sigma/ \sqrt{n}}\] Despejo n: \(n={(\frac{\sigma \cdot z}{\overline{x}-\mu})}^2\) y \(P(\overline{x}>0.95m)=0.85\)
z <- qnorm(0.85, lower.tail = F)
n <- (sd/((0.95-1)/z))^2
cat("Tamaño mínimo de lengas:", round(n))
## Tamaño mínimo de lengas: 69
Después de su fabricación y envasado, las latas de tomate de una conocida marca tienen una duración que se distribuye en forma aproximadamente normal con media 180 días y desviación estándar 40 días. Un grupo de investigación tiene que salir de campaña y se preguntan cuántaslatas tendrán que llevar para que, con una probabilidad del 95 %, la duración promedio no sea inferior a los 170 días. ¿Podemos ayudarlos a decidir?
Sé que la duración de las latas se distribuyen normalmente: X~N(mu=180, sd=40). Esto indica que las muestras seguiran tambien una distribucion normal. Luego me preguntan cuántas tengo que latas tengo que llevar (o sea, necesito un n) tal que \(P(X_{duracion\ promedio} >170\ dias )=0.95\).
mu <- 180
sd <- 40
z <- qnorm(0.95, lower.tail = F)
n <- ((sd*z)/(170-mu))^2
round(n)
## [1] 43
El contenido de riboflavina (vitamina B12) en la yerba mate sigue una distribución normal con media de 4,4 mg/100g de yerba mate y desvío estándar de 1,31 mg/100g.
4.1 Calcular la probabilidad de que una muestra al azar de 16 mediciones contenga en promedio entre 3,8 y 4,2 mg de riboflavina/100g de yerba mate.
#Guardar valores de media y desvío
media_pob=4.4
sd_pob=1.31
#calcular error muestral usando el valor de desvío para un n=16, guardarlo como error_muestral
error_muestral <- sd_pob/sqrt(16)
#crear objeto p_superior con la probabilidad de obtener una media de 4.2 o menos
p_superior<-pnorm(4.2, mean=media_pob, sd=error_muestral)
#crear objeto p_inferior con la probabilidad de obtener una media de 3.8 o menos
p_inferior<-pnorm(3.8, mean=media_pob, sd=error_muestral)
#restar los dos extremos del intervalo; el resultado no se guarda, se muestra en pantalla
p_superior-p_inferior
## [1] 0.2372322
4.2 Calcular la probabilidad de que una muestra de 20 mediciones contenga en promedio más de 4,7mg de riboflavina /100g de yerba mate.
Para eso podés modificar el siguiente script. No olvides cambiar el tamaño muestral para calcular el error, y para obtener la probabilidad de un valor MAYOR a 4.7, ¿usarías el argumento lower.tail = TRUE o lower.tail = FALSE? (cuando es TRUE, calcula la probabilidad para la cola menor).
[Nota: si omitimos el argumento lower.tail, por default calcula la cola menor]
media_pob=4.4
sd_pob=1.31
#cambiar 16 por el nuevo n
error_muestral_2 <- sd_pob/sqrt(20)
#probabilidad de obtener una media de 4.7 o mas, ¿qué pondrías en el comando lower.tail?
pnorm(4.7, mean=media_pob, sd=error_muestral_2, lower.tail = F )
## [1] 0.1528814
4.3 Calculá el mínimo contenido promedio de riboflavina del 10% de las muestras más nutritivas (n = 20).
Para esto, modificá el siguiente script que sirve para calcular el contenido MÁXIMO promedio del 10% de las muestras MENOS nutritivas. [Pista: hay dos formas de hacerlo, una es cambiar la probabilidad acumulada y la otra es mediante el parámetro lower.tail; recordá que si no se aclara, el R considera lower.tail=TRUE]
qnorm(0.9, mean = media_pob, sd = error_muestral_2)
## [1] 4.775398
Cierta marca de jugos comercializa jugo de ananá con una acidez media (medida como g de ácido cítrico/100 ml de jugo) de 0,41 g /100 ml, con un desvío estándar de 0,21 g/100 ml, pero se desconoce su ley de distribución. Un control rutinario sobre el proceso productivo arroja, sobre un total de 30 determinaciones realizadas, un promedio de 0,5 g de ácido cítrico/100 ml de jugo. Calcule la probabilidad de obtener como mínimo dicho valor. ¿Cree que deberían continuar con la producción de ese lote de jugo o detenerla y recalibrar la acidez del producto?
mu <- 0.41
sd <- 0.21
n <- 30
# Se desconoce su distribucion, pero dado que n es grande (30) se que la distribucion muestral sera
# normal
sd_m <- sd/sqrt(n)
pnorm(0.5, mu, sd_m, lower.tail = F)
## [1] 0.00945292
# Dado que la probabilidad de que ese evcento ocurra es bajo, se supone que deberian recalibrar la produccion.
No se.
Un biólogo selecciona una muestra aleatoria de 50 ejemplares de Celtis ehrenbergiana de un bosque en Magdalena y mide el diámetro a la altura del pecho (DAP), obteniendo un valor promedio de 21 cm. El biólogo afirma que ese será el DAP promedio de todos los talas de dicho bosque, ya que el promedio muestral es un estimador insesgado de la media de la población. ¿Está de acuerdo con dicha afirmación? Justifique su respuesta.
No, si bien 50 ejempleares es un n grande y la distribucion muestral tenderia a una distribucion normal, no se puede afirmar que el valor promedio de la poblacion es 21.El resultado obtenido por el investigador es solamente una aproximación dado que la mayor parte de los arboles quedarán sin ser observados y no hay garantía de que el conjunto de aquellos árboles tengan el mismo promedio que la muestra. Por lo tanto, el valor obtenido es simplmente una aproximación al valor real con un cierto grado de probabilidad (¿?).