La distribución gaussiana, también conocida como distribución normal, es una de las distribuciones de probabilidad continua que se caracteriza por su forma de campana y se utiliza para modelar una amplia variedad de fenómenos naturales y sociales.
Ejemplo:
Análisis de alturas de personas
Se tienen dos conjuntos de datos aleatorios con las alturas (en centímetros) de dos grupo en específico, hombres y mujeres.
Para esto, generamos 100 valores aleatorios siguiendo una distribución normal con una media de 170 cm (altura promedio) y una desviación estándar 10 cm, para hombres, y otros 100 valores aleatorios con una media de 160 cm (altura promedio) y una desviación estándar 10 cm, para las mujeres; esto para observar sus diferencias entre sí.
# Simular datos de altura
set.seed(13)
alturash <- rnorm(100, mean = 170, sd = 10)
# Crear un histograma
hist(alturash, freq = FALSE, main = "Distribución de Alturas en hombres",
xlab = "Altura (cm)", ylab = "Densidad", col = "lightblue")
# Crear una secuencia de valores para la curva de densidad
x <- seq(min(alturash), max(alturash), length.out = 100)
# Calcular la densidad normal para cada valor de x
y <- dnorm(x, mean = mean(alturash), sd = sd(alturash))
# Agregar la curva de densidad al histograma
lines(x, y, col = "red", lwd = 2)
alturasm <- rnorm(100, mean = 160, sd = 10)
# Crear un histograma
hist(alturasm, freq = FALSE, main = "Distribución de Alturas en Mujeres",
xlab = "Altura (cm)", ylab = "Densidad", col = "lightblue")
# Crear una secuencia de valores para la curva de densidad
z <- seq(min(alturasm), max(alturasm), length.out = 100)
# Calcular la densidad normal para cada valor de x
w <- dnorm(z, mean = mean(alturasm), sd = sd(alturasm))
# Agregar la curva de densidad al histograma
lines(z, w, col = "red", lwd = 2)
Incluir el histograma permite determinar fácilmente si la altura de las personas en estos conjuntos de datos siguen una distribución normal, pues esto sucede si, y solo si, la curva normal de cada histograma, se ajusta bien a sí mismos.
En el gráfico de la distribución de alturas en hombres, se decuce que la mayoría de los hombres tienen una altura cercana a la media, es decir, a la altura promedio, en este caso 170 cm, y que los valores extremos (hombres muy altos o muy bajos) son menos frecuentes, aquellos que miden 150 cm y 190 cm.
Por otro lado, en la distribución de alturas en mujeres, se observa que la mayoría de las mujeres tienen una altura cercana a la media, es decir, a la altura promedio, en este caso 160 cm, y que los valores extremos (mujeres muy altas o muy bajas) son menos frecuentes, aquellas que miden 140 cm y 180 cm.
Ambas ditribuciones de altura en hombres y mujeres, presentan una diferencia significativa entre si, a pesar de que la cantidad de valores aleatorios a delimitar es la misma, al igual que la desviación estándar.
##En este caso, delimitamos la aletoriedad de los datos con la función set.seed(número x), la cual permite repetir cierta cantidad x de valores.