## [1] "Esta función, también llamada distribución de Galton, es una distribución de variable aleatoria que busca generar valores positivos y posee un algoritmo de distribución normal (datos agrupados alrededor de un promedio). Esta función es usada para valores con crecimiento exponencial o acumulativo hacia valores grandes. Necesita de la media (centro de la distribución), la desviación estándar (datos alrededor de la media) y la varianza (qué tan alejados están los valores de la media)."
## [1] "Por ejemplo, se pueden encontrar la cantidad de microorganismos por metro cúbico si hablamos en términos de contaminación, así que, por medio de la distribución log-normal, asumimos que las concentraciones de contaminantes tienen una media de 4.2 y desviación estándar de 1.3."
| No_metro_cubico | Cantidad_Microorganismos |
|---|---|
| 1 | 500.26258 |
| 2 | 48.29825 |
| 3 | 42.07136 |
| 4 | 273.43321 |
| 5 | 151.01473 |
| 6 | 145.29867 |
| 7 | 23.11000 |
| 8 | 12.48777 |
| 9 | 20.84606 |
| 10 | 2227.31966 |
## [1] "Como se puede ver en la grafica, los valores pueden llegar a ser inmensos alejandose de su media"
Comandos usados:
n=10
media<-4.2
desvest<-1.3
x<-list(No_metro_cubico=c(1:10),Cantidad_Microorganismos=c(rlnorm(n, meanlog= media, sdlog= desvest)))
datos<-data.frame(x)
knitr::kable(datos, caption=“Distribucion de microorganismos por metro cubico”)
plot(datos,type=“b”)
## [1] "La distribucion normal o distribucion Gaussiana es una distribucion la cual se centra en modelar variables aleatorias continuas las cuales giran en torno a una media, tiene forma de campana simetrica y necesida de la media, desviacion estandar y la varianza"
## [1] "Por ejemplo se puede usar para el promedio de pesos de personas, en este caso 10 personas en un lugar de trabajo donde su media es 70 y la desviacion estandar es 10"
| No_Persona | Peso |
|---|---|
| 1 | 49.72654 |
| 2 | 69.69259 |
| 3 | 61.55848 |
| 4 | 68.00374 |
| 5 | 60.88159 |
| 6 | 79.13962 |
| 7 | 59.94736 |
| 8 | 64.11816 |
| 9 | 74.20833 |
| 10 | 60.27432 |
## [1] "Como se puede ver en la grafica, los valores no se alejan tanto de su media, pero aun asi varian en cantidad"
Comandos usados:
n=10
media=70
destest=10
x<-list(No_Persona=c(1:10),Peso=c(rnorm(n, mean=media, sd=destest)))
datos<-data.frame(x)
knitr::kable(datos, caption=“Distribucion de pesos en lugar de trabajo”)
plot(datos,col=“salmon”)
## [1] "Esta distribucion es usada para determinar si existe una gran diferencia en el resultado de una prueba con lo que realmente se esperaba en categorias o grupos por medio de sumas de cuadrados de variables aleatorias estandar, esta posee grados de libertad que son valores los cuales son libres de variar sin afectar el resultado final"
## [1] "Por ejemplo en la revision de 15 muestras en una fabrica de clavos con 3 grados de libertad de varianza, podemos simular las varianzas que hay en cada muestra"
| No_muestra | varianza |
|---|---|
| 1 | 1.3407165 |
| 2 | 3.9791903 |
| 3 | 0.0169411 |
| 4 | 0.9797175 |
| 5 | 1.6814735 |
| 6 | 6.2496158 |
| 7 | 0.5271524 |
| 8 | 2.2395838 |
| 9 | 0.6221153 |
| 10 | 0.5867400 |
| 11 | 2.4968036 |
| 12 | 1.7875441 |
| 13 | 3.2080001 |
| 14 | 3.8959389 |
| 15 | 0.4411857 |
## [1] "Los valores mayores a 3 indican una probabilidad de que el resultado se aleje demasiado a lo esperado, lo que puede terminar en una inconsistencia"
Comandos usados:
gradlib<-3
x<-list(No_muestra=c(1:15),varianza=c(rchisq(15,df=gradlib)))
datos<-data.frame(x)
knitr::kable(datos, caption=“Distribución chi-cuadrado de varianzas en muestras de clavos”)
plot(datos)
## [1] "Esta es una distribucion de probabilidad discreta (o sale exito o fracaso), la cual se encarga de verificar la cantidad de veces en la que un suceso o evento puede ocurrir durante un intervalo de tiempo determinado, esto es util para calcular la tasa de ocurrencia de un suceso. Los eventos son independientes."
## [1] "Un ejemplo de esto seria la cantidad de accidentes automovilisticos en un mes, tomando en cuenta que por dia suceden un promedio de alrededor 6 accidentes (lambda) y que es un mes de 30 dias"
| No_dias | Accidentes |
|---|---|
| 1 | 6 |
| 2 | 6 |
| 3 | 3 |
| 4 | 4 |
| 5 | 6 |
| 6 | 9 |
| 7 | 8 |
| 8 | 7 |
| 9 | 3 |
| 10 | 7 |
| 11 | 7 |
| 12 | 3 |
| 13 | 8 |
| 14 | 4 |
| 15 | 8 |
| 16 | 5 |
| 17 | 3 |
| 18 | 3 |
| 19 | 4 |
| 20 | 4 |
| 21 | 6 |
| 22 | 7 |
| 23 | 6 |
| 24 | 7 |
| 25 | 6 |
| 26 | 4 |
| 27 | 1 |
| 28 | 5 |
| 29 | 8 |
| 30 | 1 |
## [1] "Se puede observar como los valores de los accidentes no son decimales como en las anteriores distribuciones, representando exactamente cantidad enteras utiles para este tipo de casos"
Comandos usados:
n=30
prom=6
x<-list(No_dias=c(1:30),Accidentes=c(rpois(n,lambda=prom)))
datos<-data.frame(x)
knitr::kable(datos, caption=“Distribucion de accidentes automovilisticos durante un mes”)
plot(datos)
## [1] "Esta se refiere a la cantidad de tiempo hasta que sucede un evento en especifico el cual puede estar conectado a la distribucion Poisson (la cantidad de veces que puede pasar). Es util para determinar ese intervalo de tiempo en el que se demora en suceder el evento investigado."
## [1] "Por ejemplo se puede usar para contar el tiempo en el que un programa se demora en saltar error o fallar, usando una tasa promedio de errores 1/15 osea un error cada 15 dias en un experimento que utiliza 20 programas"
| No_programas | Dias_hasta_el_error |
|---|---|
| 1 | 19.317694 |
| 2 | 21.570961 |
| 3 | 11.066277 |
| 4 | 5.949325 |
| 5 | 4.884031 |
| 6 | 6.109696 |
| 7 | 10.206581 |
| 8 | 9.242930 |
| 9 | 32.309752 |
| 10 | 4.391727 |
| 11 | 22.479428 |
| 12 | 2.471143 |
| 13 | 7.106481 |
| 14 | 8.727131 |
| 15 | 11.964736 |
| 16 | 17.138116 |
| 17 | 7.693408 |
| 18 | 16.608077 |
| 19 | 1.901363 |
| 20 | 7.873355 |
## [1] "Como se puede ver en el grafico, alguns programas tuvieron errores antes del primer dia pero otros terminan durando mas de un mes sin errores"
Comandos usados:
n=20
tasaerror=1/15
x<-list(No_programas=c(1:20),Dias_hasta_el_error=c(rexp(n=20,rate=tasaerror)))
datos<-data.frame(x)
knitr::kable(datos, caption=“Distribucion de dias hasta que el programa muestre un error”)
plot(datos)