Distribución Normal

Teoría

Las Distribuciones de Probabilidad Continua pueden tomar varias formas , pero un gran número de variables aleatorias observadas en la naturaleza poseen una distribución de frecuencia que tiene más o menos de la forma de montículo, o bien, como se diría en estadística, es aproximadamente una distribución normal de probabilidad.

Ejercicio de Rendimiento de la Gasolina

Estudios demuestran que el uso de gasolina para autos compactos vendidos en Estados Unidos está normalmente distribuido, con una media de 25.5 millas por galón (mpg). ¿Qué porcentaje de compactos recorre 30 mpg o más?

mediag <- 25.5
desviacioneg <- 4.5
probabilidadg <- 1 - pnorm(30, mediag, desviacioneg)
porcentajeg <- probabilidadg * 100
porcentajeg
## [1] 15.86553

Si un fabricante desea desarrollar un auto compacto que supere 95% de los compactos actuales en economía de combustible, ¿Cuál debe ser el porcentaje de uso de gasolina para el nuevo auto?

cuantileg <- qnorm(0.95, mediag, desviacioneg)
cuantileg
## [1] 32.90184

Ejericio de Girasoles

Suponga que los diámetros de tallos no soportados en la base, de una especia particural de girasol, tienen una distribución normal con un diámetro promedio de 35mm y una desviación estandar de 3mm.

a.- ¿Cuál es la probabilidad de una planta de girasol tenga un diametro de base de más de 40mm?

z41 <- (40-35)/3
z41
## [1] 1.666667
p41 <- 1-pnorm(40,35,3)
p41
## [1] 0.04779035
x <- 40
promedio <- 35
desviacion_estandar <- 3

Función de Densidad de Probabilidad

x_densidad <- seq(promedio-3*desviacion_estandar,promedio+3*desviacion_estandar, length=1000)
y_densidad <- dnorm(x_densidad, promedio, desviacion_estandar)
plot(x_densidad, y_densidad,type="l", lty=1, xlab="x", ylab="f(x)",main="Función de Densidad de Probabilidad (Normal)", col="red")

Función de Distribución de Probabilidad

x_distribucion <- seq(promedio-3*desviacion_estandar,promedio+3*desviacion_estandar, length=1000)
y_distribucion <- pnorm(x_distribucion, promedio, desviacion_estandar)
plot(x_distribucion, y_distribucion,type="l", lty=1, xlab="x", ylab="f(x)",main="Función de Distribucion de Probabilidad (Normal)", col="blue")

b.- ¿Si 2 plantas de girasol se seleccionaran al azar ¿Cuál es la probabilidad de que ambas plantas tengan un diáetro de base de más de 40mm?

p42 <- p41*p41
p42
## [1] 0.002283918

c.- ¿Dentro de que límites esperaría usted que se encuentren los diámetros de base, con la probabilidad de 0.95?

Para una probabilidad de 2.5 %, de tablas obtenemos que z= -1.96

p43_li <- qnorm(0.025,35,3)
p43_li
## [1] 29.12011

Para obtener una probabilidad de 97.5%, de tablas obtenemos que z= 1.96

p43_ls <- qnorm(0.975,35,3)
p43_ls
## [1] 40.87989

d.- ¿Qué diámetro represrtna el 90avo percentil de la distribución de diámetro?

p44<- qnorm(0.90,35,3)
p44
## [1] 38.84465

Shiny App

## 
## Listening on http://127.0.0.1:7403

Distribución t de Student

Ejercicio Diamantes

peso_diamantes <- c(.46, .61, .52, .48, .57, .54)
prm5 <- mean(peso_diamantes)
desviacion_estandar_muestral <- sqrt(var(peso_diamantes))
n5 <- 6
miu_o <- 0.5
t5 <- (prm5-miu_o)/(desviacion_estandar_muestral/sqrt(n5))

Conclusion, No se rechaza la Ho. Los datos no presentan suficiente evidencia para indicar que el peso medio de los diamantes exceda los 0.5 quilates.

Ejercicio Oxígeno

oxigeno <- c(4.9, 5.1, 4.9, 5.0, 5.0, 4.7)
prom_oxigeno <- mean(oxigeno)
desviacion_estandar_oxigeno <- sqrt(var(oxigeno))
n_oxi <- 6
miu_oxi <- 5
t_oxigeno <- (prom_oxigeno-miu_oxi)/(desviacion_estandar_oxigeno/sqrt(n_oxi))

Conclusión, no se rechaza la Ho

Ejercicio de Funciones

Función de Densidad de Probabilidad (t de Student)

x_densidad <- seq(-4,4, length=1000)
y_densidad <- dt(x_densidad, df=5)
plot(x_densidad, y_densidad, type="l", lty=1, xlab="t", ylab="f(t)", main="Funcion de Densidad de Probabilidad (t de Student)")

Función de Distribución de Probabilidad (t de Student)

x_distribucion <- seq(-4,4, length=1000)
y_distribucion <- pt(x_distribucion, df=5)
plot(x_distribucion, y_distribucion, type="l", lty=1, xlab="t", ylab="f(t)", main="Funcion de Densidad de Probabilidad (t de Student)")

Winsorizing vs Trimming

library(DescTools)

peso_diamantes_error <- c(3,4,3,5,6,4,5,4,3,3,5,6,4,3,5,4,3,3,5,6,5,4,3,4,5,6,5,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,3,33,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,1,2,1,1,1,1,1) 
#peso_diamantes_error <- c(.46, .61, .52, .48, .57, 54) 
boxplot(peso_diamantes_error)

Winsorizing

peso_diamantes_winsorizado <- Winsorize(peso_diamantes_error, 0.05)
boxplot(peso_diamantes_winsorizado)

Trimming

peso_diamantes_recortado <- Trim(peso_diamantes_error, 0.05)
boxplot(peso_diamantes_recortado)

