Taller Epub

Introducción

En este documento vamos a hablar sobre cinco distribuciones estadísticas que son muy importantes en el mundo de la ingeniería y la estadística. Estas son la distribución lognormal, la normal (o gaussiana), la chi-cuadrado, la de Poisson y la exponencial. Cada una tiene su propia forma de representar datos y se usa en diferentes situaciones. Presentaremos ejemplos y gráficos que nos ayudarán a entender mejor cada distribución y su aplicación. Esto nos permitirá ver cómo estos conceptos se relacionan con el trabajo que hacemos en la ingeniería industrial.

Distribución Lognormal

La distribución lognormal es una manera de entender datos que siempre son positivos y que pueden tener un sesgo. Se usa mucho en economía, por ejemplo, para analizar los ingresos de las personas, porque estos no pueden ser negativos y suelen tener una forma irregular. También es útil en la industria para estudiar cuánto tiempo duran ciertos productos antes de fallar. En la gráfica, se puede ver cómo se distribuyen estos datos, con la mayoría concentrada en un rango y algunos valores muy altos que se alejan del resto.

datosLognormal <- rlnorm(700, meanlog = 0, sdlog = 1)

plot(density(datosLognormal),main = "Distribución Lognormal",xlab = "eje X",ylab = "eje Y",col = "blue",  type = "l")

Distribución Gaussiana

La distribución normal, o gaussiana, es una de las más comunes en la naturaleza. Sirve para describir cosas que tienden a agruparse alrededor de un promedio. Por ejemplo, en una clase, las notas de los estudiantes suelen seguir esta distribución: algunos sacan notas muy bajas y otros muy altas, pero la mayoría se queda cerca de la media. La gráfica muestra cómo se distribuyen esos valores, donde la parte alta representa a la mayoría de los casos y las partes bajas son menos frecuentes.

datosNormal <- rnorm(700, mean = 0,sd = 1)

plot(density(datosNormal),main = "Distribución Normal (Gaussiana)",xlab = "eje X", ylab = "eje Y",col = "green", type = "l")

Distribución Chi-cuadrado

La distribución Chi-cuadrado se utiliza mucho en estadística, especialmente para comprobar si los datos que tenemos se ajustan bien a lo que esperábamos. Se usa en pruebas de hipótesis y para medir la variabilidad en experimentos. En la gráfica, puedes observar cómo se distribuyen estos datos, que normalmente se agrupan hacia la izquierda, mostrando que la mayoría de los valores son bajos y pocos son altos.

datosChi <- rchisq(700, df = 3)

plot(density(datosChi),main = "Distribución Chi-cuadrado",xlab = "eje X", ylab = "eje Y", col = "orange", type = "l")

Distribución Poisson

La distribución Poisson se usa para contar eventos que ocurren en un tiempo específico o en un área. Por ejemplo, puede servir para saber cuántas llamadas recibe un centro de atención al cliente en una hora. La gráfica muestra cuántas veces se espera que ocurra cada cantidad de eventos, y aunque puede haber muchas ocurrencias bajas, a veces también hay picos donde ocurren más eventos de lo normal.

datosPoisson <- rpois(700, lambda = 5)

plot(density(datosPoisson), main = "Distribución Poisson", xlab = "eje X", ylab = "eje Y",col = "purple",type = "l")

Distribución Exponencial

La distribución exponencial se utiliza para medir el tiempo que pasa entre eventos que ocurren al azar. Por ejemplo, puede servir para calcular cuánto tiempo pasa entre llamadas a un servicio de emergencia. La gráfica muestra cómo se distribuyen esos tiempos, mostrando que la mayoría son cortos, pero hay algunos casos donde se puede esperar un tiempo mucho mayor.

datos_exponencial <- rexp(700, rate = 1)

plot(density(datos_exponencial),main = "Distribución Exponencial", xlab = "eje X",ylab = "eje Y",col = "red",type = "l")