Gestion de datos Distribuciones Rpub

Distribucion Logaritmica Normal

## [1] "Esta función, también llamada distribución de Galton, es una distribución de variable aleatoria que busca generar valores positivos y posee un algoritmo de distribución normal (datos agrupados alrededor de un promedio). Esta función es usada para valores con crecimiento exponencial o acumulativo hacia valores grandes. Necesita de la media (centro de la distribución), la desviación estándar (datos alrededor de la media) y la varianza (qué tan alejados están los valores de la media)."

## [1] "Por ejemplo, se pueden encontrar la cantidad de microorganismos por metro cúbico si hablamos en términos de contaminación, así que, por medio de la distribución log-normal, asumimos que las concentraciones de contaminantes tienen una media de 4.2 y desviación estándar de 1.3."

Distribucion de microorganismos por metro cubico
No_metro_cubico	Cantidad_Microorganismos
1	500.26258
2	48.29825
3	42.07136
4	273.43321
5	151.01473
6	145.29867
7	23.11000
8	12.48777
9	20.84606
10	2227.31966

## [1] "Como se puede ver en la grafica, los valores pueden llegar a ser inmensos alejandose de su media"

Comandos usados:

n=10

media<-4.2

desvest<-1.3

x<-list(No_metro_cubico=c(1:10),Cantidad_Microorganismos=c(rlnorm(n, meanlog= media, sdlog= desvest)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de microorganismos por metro cubico”)

plot(datos,type=“b”)

Distribucion Gaussiana

## [1] "La distribucion normal o distribucion Gaussiana es una distribucion la cual se centra en modelar variables aleatorias continuas las cuales giran en torno a una media, tiene forma de campana simetrica y necesida de la media, desviacion estandar y la varianza"

## [1] "Por ejemplo se puede usar para el promedio de pesos de personas, en este caso 10 personas en un lugar de trabajo donde su media es 70 y la desviacion estandar es 10"

Distribucion de pesos en lugar de trabajo
No_Persona	Peso
1	49.72654
2	69.69259
3	61.55848
4	68.00374
5	60.88159
6	79.13962
7	59.94736
8	64.11816
9	74.20833
10	60.27432

## [1] "Como se puede ver en la grafica, los valores no se alejan tanto de su media, pero aun asi varian en cantidad"

Comandos usados:

n=10

media=70

destest=10

x<-list(No_Persona=c(1:10),Peso=c(rnorm(n, mean=media, sd=destest)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de pesos en lugar de trabajo”)

plot(datos,col=“salmon”)

Distribucion Chi cuadrado

## [1] "Esta distribucion es usada para determinar si existe una gran diferencia en el resultado de una prueba con lo que realmente se esperaba en categorias o grupos por medio de sumas de cuadrados de variables aleatorias estandar, esta posee grados de libertad que son valores los cuales son libres de variar sin afectar el resultado final"

## [1] "Por ejemplo en la revision de 15 muestras en una fabrica de clavos con 3 grados de libertad de varianza, podemos simular las varianzas que hay en cada muestra"

Distribución chi-cuadrado de varianzas en muestras de clavos
No_muestra	varianza
1	1.3407165
2	3.9791903
3	0.0169411
4	0.9797175
5	1.6814735
6	6.2496158
7	0.5271524
8	2.2395838
9	0.6221153
10	0.5867400
11	2.4968036
12	1.7875441
13	3.2080001
14	3.8959389
15	0.4411857

## [1] "Los valores mayores a 3 indican una probabilidad de que el resultado se aleje demasiado a lo esperado, lo que puede terminar en una inconsistencia"

Comandos usados:

gradlib<-3

x<-list(No_muestra=c(1:15),varianza=c(rchisq(15,df=gradlib)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribución chi-cuadrado de varianzas en muestras de clavos”)

plot(datos)

Distribucion Poisson

## [1] "Esta es una distribucion de probabilidad discreta (o sale exito o fracaso), la cual se encarga de verificar la cantidad de veces en la que un suceso o evento puede ocurrir durante un intervalo de tiempo determinado, esto es util para calcular la tasa de ocurrencia de un suceso. Los eventos son independientes."

## [1] "Un ejemplo de esto seria la cantidad de accidentes automovilisticos en un mes, tomando en cuenta que por dia suceden un promedio de alrededor 6 accidentes (lambda) y que es un mes de 30 dias"

Distribucion de accidentes automovilisticos durante un mes
No_dias	Accidentes
1	6
2	6
3	3
4	4
5	6
6	9
7	8
8	7
9	3
10	7
11	7
12	3
13	8
14	4
15	8
16	5
17	3
18	3
19	4
20	4
21	6
22	7
23	6
24	7
25	6
26	4
27	1
28	5
29	8
30	1

## [1] "Se puede observar como los valores de los accidentes no son decimales como en las anteriores distribuciones, representando exactamente cantidad enteras utiles para este tipo de casos"

Comandos usados:

n=30

prom=6

x<-list(No_dias=c(1:30),Accidentes=c(rpois(n,lambda=prom)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de accidentes automovilisticos durante un mes”)

plot(datos)

Distribucion Exponencial

## [1] "Esta se refiere a la cantidad de tiempo hasta que sucede un evento en especifico el cual puede estar conectado a la distribucion Poisson (la cantidad de veces que puede pasar). Es util para determinar ese intervalo de tiempo en el que se demora en suceder el evento investigado."

## [1] "Por ejemplo se puede usar para contar el tiempo en el que un programa se demora en saltar error o fallar, usando una tasa promedio de errores 1/15 osea un error cada 15 dias en un experimento que utiliza 20 programas"

Distribucion de dias hasta que el programa muestre un error
No_programas	Dias_hasta_el_error
1	19.317694
2	21.570961
3	11.066277
4	5.949325
5	4.884031
6	6.109696
7	10.206581
8	9.242930
9	32.309752
10	4.391727
11	22.479428
12	2.471143
13	7.106481
14	8.727131
15	11.964736
16	17.138116
17	7.693408
18	16.608077
19	1.901363
20	7.873355

## [1] "Como se puede ver en el grafico, alguns programas tuvieron errores antes del primer dia pero otros terminan durando mas de un mes sin errores"

Comandos usados:

n=20

tasaerror=1/15

x<-list(No_programas=c(1:20),Dias_hasta_el_error=c(rexp(n=20,rate=tasaerror)))

datos<-data.frame(x)

knitr::kable(datos, caption=“Distribucion de dias hasta que el programa muestre un error”)

plot(datos)

Gestion de datos Distribuciones Rpub

Kees Camilo Lenis Victoria

2024-10-29

Sintesis sobre tipos de distribuciones en Rpub

Distribucion Logaritmica Normal

Distribucion Gaussiana

Distribucion Chi cuadrado

Distribucion Poisson

Distribucion Exponencial

No_dias	Accidentes
1	6
2	6
3	3
4	4
5	6
6	9
7	8
8	7
9	3
10	7
11	7
12	3
13	8
14	4
15	8
16	5
17	3
18	3
19	4
20	4
21	6
22	7
23	6
24	7
25	6
26	4
27	1
28	5
29	8
30	1

No_dias	Accidentes
1	6
2	6
3	3
4	4
5	6
6	9
7	8
8	7
9	3
10	7
11	7
12	3
13	8
14	4
15	8
16	5
17	3
18	3
19	4
20	4
21	6
22	7
23	6
24	7
25	6
26	4
27	1
28	5
29	8
30	1

No_dias	Accidentes
1	6
2	6
3	3
4	4
5	6
6	9
7	8
8	7
9	3
10	7
11	7
12	3
13	8
14	4
15	8
16	5
17	3
18	3
19	4
20	4
21	6
22	7
23	6
24	7
25	6
26	4
27	1
28	5
29	8
30	1