Instalar y cargar librerias.

#install.packages("summarytools")
#library(summarytools)

Establecer o generar datos.

n=50 # tamaño de la muestra

Datos de la distribución normal.

x= rnorm (n, mean=2, sd= 0.1) # genera la muestra con media de 2 y desviacion de 0.1
y= rnorm (n, mean=3, sd= 0.2)
A= x*y # calculo del vector de areas.

Histograma.

hist(A, main = "Distribución normal del area de la placa",
     las= 1, breaks= 7,
     ylab = "frecuencia",
     xlab= "area en cm2",
     col= "black")

Estadisticas de la distribución.

summarytools::descr(A)
## Descriptive Statistics  
## A  
## N: 50  
## 
##                          A
## ----------------- --------
##              Mean     5.96
##           Std.Dev     0.48
##               Min     5.05
##                Q1     5.62
##            Median     5.95
##                Q3     6.19
##               Max     7.25
##               MAD     0.46
##               IQR     0.56
##                CV     0.08
##          Skewness     0.45
##       SE.Skewness     0.34
##          Kurtosis    -0.14
##           N.Valid    50.00
##         Pct.Valid   100.00

Grafica de la distribución.

qqnorm(A, main = "Distribución del area de la placa",
       ylab = "Cuartiles de la muestra",
       xlab= "Cuartiles de una distribució normal",
       col= "black")
qqline(A, main = "Distribución del area de la placa",
       ylab = "Cuartiles de la muestra",
       xlab= "Cuartiles de una distribució normal",
       col= "blue")

Ho(hipotesis nula): el area tiene distribución normal.

Ha(hipotesis alternativa): el area no sigue una distriubción normal.

Prueba Shapiro

Si el valor-p es menor que alpha (5%) por lo tanto se rechaza Ho, es decir no es normal.

shapiro.test(A)
## 
##  Shapiro-Wilk normality test
## 
## data:  A
## W = 0.97778, p-value = 0.4628

la prueba de chapiro es solo para corpus data pequeños, para grandes volumenes de datos lo ideal es Kolmogorov.

Datos de la distribución exponencial.

z= rexp(n,1)
d= rexp(n,1)
B= z*d

Histograma.

hist(B, main = "Distribución exponencial del area de la placa",
     las= 1, breaks= 7,
     ylab = "frecuencia",
     xlab= "area en cm2",
     col= "red")

Estadisticas de la distribución.

summarytools::descr(B)
## Descriptive Statistics  
## B  
## N: 50  
## 
##                          B
## ----------------- --------
##              Mean     0.74
##           Std.Dev     1.44
##               Min     0.00
##                Q1     0.08
##            Median     0.20
##                Q3     0.84
##               Max     8.71
##               MAD     0.26
##               IQR     0.75
##                CV     1.95
##          Skewness     3.75
##       SE.Skewness     0.34
##          Kurtosis    16.66
##           N.Valid    50.00
##         Pct.Valid   100.00

Grafica de la distribución.

qqnorm(B, main = "Distribución del area de la placa",
       ylab = "Cuartiles de la muestra",
       xlab= "Cuartiles de una distribució normal",
       col= "red")
qqline(B, main = "Distribución del area de la placa",
       ylab = "Cuartiles de la muestra",
       xlab= "Cuartiles de una distribució normal",
       col= "blue")

Prueba Shapiro

Si el valor-p es menor que alpha (5%) por lo tanto se rechaza Ho, es decir no es normal.

shapiro.test(B)
## 
##  Shapiro-Wilk normality test
## 
## data:  B
## W = 0.52719, p-value = 1.86e-11

Conclusiones

De las dos (A) es nomral y (B) no lo es acuerdo al test de chapiro.