Sintesis sobre tipos de distribuciones en Rpub

Distribucion Logaritmica Normal

## [1] "Esta función, también llamada distribución de Galton, es una distribución de variable aleatoria que busca generar valores positivos y posee un algoritmo de distribución normal (datos agrupados alrededor de un promedio). Esta función es usada para valores con crecimiento exponencial o acumulativo hacia valores grandes. Necesita de la media (centro de la distribución), la desviación estándar (datos alrededor de la media) y la varianza (qué tan alejados están los valores de la media)."
## [1] "Por ejemplo, se pueden encontrar la cantidad de microorganismos por metro cúbico si hablamos en términos de contaminación, así que, por medio de la distribución log-normal, asumimos que las concentraciones de contaminantes tienen una media de 4.2 y desviación estándar de 1.3."
Distribucion de microorganismos por metro cubico
No_metro_cubico Cantidad_Microorganismos
1 500.26258
2 48.29825
3 42.07136
4 273.43321
5 151.01473
6 145.29867
7 23.11000
8 12.48777
9 20.84606
10 2227.31966

## [1] "Como se puede ver en la grafica, los valores pueden llegar a ser inmensos alejandose de su media"

Comandos usados:

n=10

media<-4.2

desvest<-1.3

x<-list(No_metro_cubico=c(1:10),Cantidad_Microorganismos=c(rlnorm(n, meanlog= media, sdlog= desvest)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de microorganismos por metro cubico”)

plot(datos,type=“b”)

Distribucion Gaussiana

## [1] "La distribucion normal o distribucion Gaussiana es una distribucion la cual se centra en modelar variables aleatorias continuas las cuales giran en torno a una media, tiene forma de campana simetrica y necesida de la media, desviacion estandar y la varianza"
## [1] "Por ejemplo se puede usar para el promedio de pesos de personas, en este caso 10 personas en un lugar de trabajo donde su media es 70 y la desviacion estandar es 10"
Distribucion de pesos en lugar de trabajo
No_Persona Peso
1 49.72654
2 69.69259
3 61.55848
4 68.00374
5 60.88159
6 79.13962
7 59.94736
8 64.11816
9 74.20833
10 60.27432

## [1] "Como se puede ver en la grafica, los valores no se alejan tanto de su media, pero aun asi varian en cantidad"

Comandos usados:

n=10

media=70

destest=10

x<-list(No_Persona=c(1:10),Peso=c(rnorm(n, mean=media, sd=destest)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de pesos en lugar de trabajo”)

plot(datos,col=“salmon”)

Distribucion Chi cuadrado

## [1] "Esta distribucion es usada para determinar si existe una gran diferencia en el resultado de una prueba con lo que realmente se esperaba en categorias o grupos por medio de sumas de cuadrados de variables aleatorias estandar, esta posee grados de libertad que son valores los cuales son libres de variar sin afectar el resultado final"
## [1] "Por ejemplo en la revision de 15 muestras en una fabrica de clavos con 3 grados de libertad de varianza, podemos simular las varianzas que hay en cada muestra"
Distribución chi-cuadrado de varianzas en muestras de clavos
No_muestra varianza
1 1.3407165
2 3.9791903
3 0.0169411
4 0.9797175
5 1.6814735
6 6.2496158
7 0.5271524
8 2.2395838
9 0.6221153
10 0.5867400
11 2.4968036
12 1.7875441
13 3.2080001
14 3.8959389
15 0.4411857

## [1] "Los valores mayores a 3 indican una probabilidad de que el resultado se aleje demasiado a lo esperado, lo que puede terminar en una inconsistencia"

Comandos usados:

gradlib<-3

x<-list(No_muestra=c(1:15),varianza=c(rchisq(15,df=gradlib)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribución chi-cuadrado de varianzas en muestras de clavos”)

plot(datos)

Distribucion Poisson

## [1] "Esta es una distribucion de probabilidad discreta (o sale exito o fracaso), la cual se encarga de verificar la cantidad de veces en la que un suceso o evento puede ocurrir durante un intervalo de tiempo determinado, esto es util para calcular la tasa de ocurrencia de un suceso. Los eventos son independientes."
## [1] "Un ejemplo de esto seria la cantidad de accidentes automovilisticos en un mes, tomando en cuenta que por dia suceden un promedio de alrededor 6 accidentes (lambda) y que es un mes de 30 dias"
Distribucion de accidentes automovilisticos durante un mes
No_dias Accidentes
1 6
2 6
3 3
4 4
5 6
6 9
7 8
8 7
9 3
10 7
11 7
12 3
13 8
14 4
15 8
16 5
17 3
18 3
19 4
20 4
21 6
22 7
23 6
24 7
25 6
26 4
27 1
28 5
29 8
30 1

## [1] "Se puede observar como los valores de los accidentes no son decimales como en las anteriores distribuciones, representando exactamente cantidad enteras utiles para este tipo de casos"

Comandos usados:

n=30

prom=6

x<-list(No_dias=c(1:30),Accidentes=c(rpois(n,lambda=prom)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de accidentes automovilisticos durante un mes”)

plot(datos)

Distribucion Exponencial

## [1] "Esta se refiere a la cantidad de tiempo hasta que sucede un evento en especifico el cual puede estar conectado a la distribucion Poisson (la cantidad de veces que puede pasar). Es util para determinar ese intervalo de tiempo en el que se demora en suceder el evento investigado."
## [1] "Por ejemplo se puede usar para contar el tiempo en el que un programa se demora en saltar error o fallar, usando una tasa promedio de errores 1/15 osea un error cada 15 dias en un experimento que utiliza 20 programas"
Distribucion de dias hasta que el programa muestre un error
No_programas Dias_hasta_el_error
1 19.317694
2 21.570961
3 11.066277
4 5.949325
5 4.884031
6 6.109696
7 10.206581
8 9.242930
9 32.309752
10 4.391727
11 22.479428
12 2.471143
13 7.106481
14 8.727131
15 11.964736
16 17.138116
17 7.693408
18 16.608077
19 1.901363
20 7.873355

## [1] "Como se puede ver en el grafico, alguns programas tuvieron errores antes del primer dia pero otros terminan durando mas de un mes sin errores"

Comandos usados:

n=20

tasaerror=1/15

x<-list(No_programas=c(1:20),Dias_hasta_el_error=c(rexp(n=20,rate=tasaerror)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de dias hasta que el programa muestre un error”)

plot(datos)