Distribuciones de probabilidad
Distribuciones de frecuencia
Conociendo los datos
Los datos son tomados de la base de datos de movilidad de google para el estado de sonora desde el día 15 de Febrero hasta el día 13 de Octubre, en este primer apartado se procedera a importarlos, declaran una variable llamada “EnCasa” que es porcentaje de desfase con respecto a la linea base de la gente en sus casas / residencias. Y otra llamada “Parques” que es porcentaje de desfase con respecto a la línea base de la gente en que acude a parques.
library(pacman)
p_load("readr","DT","prettydoc","fdth","modeest")
setwd("~/PYE1112ADITSON")
sonora3 <- read_csv("SonoraReport.csv")## Parsed with column specification:
## cols(
## country_region_code = col_character(),
## country_region = col_character(),
## sub_region_1 = col_character(),
## sub_region_2 = col_logical(),
## iso_3166_2_code = col_character(),
## census_fips_code = col_logical(),
## date = col_character(),
## retail_and_recreation_percent_change_from_baseline = col_double(),
## grocery_and_pharmacy_percent_change_from_baseline = col_double(),
## parks_percent_change_from_baseline = col_double(),
## transit_stations_percent_change_from_baseline = col_double(),
## workplaces_percent_change_from_baseline = col_double(),
## residential_percent_change_from_baseline = col_double()
## )
EnCasa <- sonora3$residential_percent_change_from_baseline
Parques <- sonora3$parks_percent_change_from_baseline## [1] "country_region_code"
## [2] "country_region"
## [3] "sub_region_1"
## [4] "sub_region_2"
## [5] "iso_3166_2_code"
## [6] "census_fips_code"
## [7] "date"
## [8] "retail_and_recreation_percent_change_from_baseline"
## [9] "grocery_and_pharmacy_percent_change_from_baseline"
## [10] "parks_percent_change_from_baseline"
## [11] "transit_stations_percent_change_from_baseline"
## [12] "workplaces_percent_change_from_baseline"
## [13] "residential_percent_change_from_baseline"
En casa
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -2.00 10.00 14.00 13.14 18.00 28.00
## [1] 13
## [1] 44.58299
## [1] 6.677049
- Análisis de tabla distribución de frecuencia
## Class limits f rf rf(%) cf cf(%)
## [-2.02,1.3467) 27 0.11 11.16 27 11.16
## [1.3467,4.7133) 3 0.01 1.24 30 12.40
## [4.7133,8.08) 17 0.07 7.02 47 19.42
## [8.08,11.447) 20 0.08 8.26 67 27.69
## [11.447,14.813) 68 0.28 28.10 135 55.79
## [14.813,18.18) 61 0.25 25.21 196 80.99
## [18.18,21.547) 31 0.13 12.81 227 93.80
## [21.547,24.913) 12 0.05 4.96 239 98.76
## [24.913,28.28) 3 0.01 1.24 242 100.00
- Histogramas y polígonos de frecuencia
En parques
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -64.00 -40.75 -34.00 -31.49 -26.00 12.00
## [1] -38
## [1] 268.4832
## [1] 16.38546
- Análisis de tabla distribución de frecuencia
## Class limits f rf rf(%) cf cf(%)
## [-64.64,-56.111) 8 0.03 3.31 8 3.31
## [-56.111,-47.582) 25 0.10 10.33 33 13.64
## [-47.582,-39.053) 38 0.16 15.70 71 29.34
## [-39.053,-30.524) 76 0.31 31.40 147 60.74
## [-30.524,-21.996) 52 0.21 21.49 199 82.23
## [-21.996,-13.467) 12 0.05 4.96 211 87.19
## [-13.467,-4.9378) 3 0.01 1.24 214 88.43
## [-4.9378,3.5911) 11 0.05 4.55 225 92.98
## [3.5911,12.12) 17 0.07 7.02 242 100.00
- Histogramas y polígonos de frecuencia
¿Cómo utilizamos este enfoque de distribuciones a probabilidad?
Primeramente analizamos esto desde un punto de vista de probabilidad clásica
- En casa
## EnCasa
## -2 -1 0 1 2 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
## 4 18 3 2 2 1 3 6 5 3 6 9 5 21 24 23 10 11 17 23 11 12 8 6 3 3
## 26 27 28
## 1 1 1
## [1] 13
Si esto fuera probabilidad clásica y quisieramos saber cual es la probabilidad de que se presente el número 13 (moda), se tendría que dividir este evento favorable(1) entre el total de eventos (31), P(A) = 1/31.
- En parques
## Parques
## -64 -63 -60 -59 -57 -56 -55 -54 -53 -52 -51 -50 -49 -48 -47 -46 -45 -44 -43 -42
## 1 2 1 2 2 2 1 2 5 2 4 3 4 2 4 3 5 3 1 6
## -41 -40 -39 -38 -37 -36 -35 -34 -33 -32 -31 -30 -29 -28 -27 -26 -25 -24 -23 -22
## 6 10 8 15 13 9 4 8 4 8 7 4 6 6 8 12 7 4 4 1
## -21 -20 -18 -17 -14 -13 -9 -5 -4 -3 -2 -1 0 2 3 4 5 6 8 10
## 8 1 1 1 1 1 1 1 1 1 1 1 1 2 4 2 4 6 2 1
## 11 12
## 1 1
## [1] -38
Si esto fuera probabilidad clásica y quisieramos saber cual es la probabilidad de que se presente el número -38 (moda), se tendría que dividir este evento favorable (1) entre el total de eventos (77), P(B) = 1/77.
- Funciones de distribuciones de probabilidad
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
- ¿De qué manera sirve esto para entender la probabilidad de que se presente un valor de movilidad de personas en casa?
Distribución normal
*En casa
Tenemos una media de: 13.14 y desviación estándar de: 6.677049
¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 $ P(X15) $
## [1] 0.6097111
- En parques
Tenemos una media de: -31.49 y una desviación estándar de: 16.38546
¿Cuál es la probabilidad de que \(X\) sea menor o igual a 3 $ P(X3) $
## [1] 0.9823506
Conclusión
En este ejercicio realizó un ánalisis detallada de la movilidad de personas en el estado de Sonora que acuden a parques y las que se quedan en sus casas por la cuarentena por el Covid-19. Para esto, gracias a la probabilidad, se plantearon las fórmulas necesarias para optener los valores de probabilidad de las personas que se quedaron en casa y las que asistieron a parques.