Introducción a la distribución normal

Generamos variables.

n=50 

Condiciones

Generamos un vector (x) con distribución normal (rnorm), con media de 2 y desviacion de 0,1, lo anterior con respecto a la variable (n).

x= rnorm (n, mean=2, sd= 0.1) 
#print(x) ## Observamos los datos de x

Miramos los estadisticos resultantes del vector x.

summarytools::descr(x) #estadiscticos resultantes de x
## Descriptive Statistics  
## x  
## N: 50  
## 
##                          x
## ----------------- --------
##              Mean     2.01
##           Std.Dev     0.11
##               Min     1.79
##                Q1     1.93
##            Median     2.01
##                Q3     2.09
##               Max     2.21
##               MAD     0.12
##               IQR     0.16
##                CV     0.06
##          Skewness    -0.13
##       SE.Skewness     0.34
##          Kurtosis    -0.74
##           N.Valid    50.00
##                 N    50.00
##         Pct.Valid   100.00

Graficamos

Para esta grafica tenemos dos sub graficas, qqnorm hace referencia a la distribución empirica de los datos del vector (x) y qqline hace referencia a la distribución teorica, es decir la forma que deberia tener para ser una distribució normal.

qqnorm(x, main = "Distribución  del vector x",
       ylab = "Cuartiles de la muestra",
       xlab= "Cuartiles de una distribució normal",
       col= "black")
qqline(x, main = "Distribución del vector x",
       ylab = "Cuartiles de la muestra",
       xlab= "Cuartiles de una distribució normal",
       col= "blue")

Prueba para conocer la normalidad

##PRUEBA
shapiro.test(x)
## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.97183, p-value = 0.2743

Bajo lo anterior, para afirmar que hay ditribución el p-value debe ser mayor al 5%, por lo anterior, confirmamos que el vector (x) tiene una distribución normal.

Grafica de distribución acampanada

media = mean(x)
desv = sd(x)

hist(x, probability = TRUE, 
     main = "Distribución del vector x", 
     xlab = "Área", col = "blue", border = "black")
curve(dnorm(x, mean = media, sd = desv), 
      add = TRUE, col = "red", lwd = 2)