library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/PyE1213")
sonora <- read_csv("sonora3.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   country_region_code = col_character(),
##   country_region = col_character(),
##   sub_region_1 = col_character(),
##   sub_region_2 = col_logical(),
##   metro_area = col_logical(),
##   iso_3166_2_code = col_character(),
##   census_fips_code = col_logical(),
##   fecha = col_character(),
##   recreacion = col_double(),
##   tiendas = col_double(),
##   parques = col_double(),
##   transito = col_double(),
##   trabajo = col_double(),
##   residencial = col_double()
## )
datatable(sonora)
Transito <- sonora$transito

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(Transito)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -69.00  -49.00  -39.00  -36.21  -30.00   18.00
boxplot(Transito)

mfv(Transito)
## [1] -29

Medidas de dispersión

sd(Transito)
## [1] 19.19892
var(Transito)
## [1] 368.5986
plot(Transito)

Tabla de distribuciones de frecuencia

dist <- fdt(Transito, breaks = "Sturges")
dist
##       Class limits  f   rf rf(%)  cf  cf(%)
##   [-69.69,-59.927) 18 0.07  7.44  18   7.44
##  [-59.927,-50.163) 35 0.14 14.46  53  21.90
##    [-50.163,-40.4) 57 0.24 23.55 110  45.45
##    [-40.4,-30.637) 69 0.29 28.51 179  73.97
##  [-30.637,-20.873) 29 0.12 11.98 208  85.95
##   [-20.873,-11.11)  1 0.00  0.41 209  86.36
##   [-11.11,-1.3467)  6 0.02  2.48 215  88.84
##   [-1.3467,8.4167) 17 0.07  7.02 232  95.87
##     [8.4167,18.18) 10 0.04  4.13 242 100.00

Histogramas y políginos de distribución de frecuencia

plot(dist,type="fh")

plot(dist,type="rfh")

plot(dist,type="cfh")

plot(dist,type="fp")

plot(dist,type="rfp")

plot(dist,type="cfp")

Distribuciones de probabilidad

Frecuencia con la cual se repiten los valores del conjunto de datos

sort(Transito)
##   [1] -69 -68 -68 -66 -66 -65 -63 -63 -63 -62 -62 -62 -62 -62 -62 -61 -61 -60
##  [19] -58 -58 -58 -58 -58 -57 -57 -57 -57 -57 -57 -56 -56 -56 -55 -55 -55 -54
##  [37] -54 -54 -54 -54 -53 -53 -53 -53 -53 -52 -52 -51 -51 -51 -51 -51 -51 -50
##  [55] -50 -50 -50 -50 -50 -49 -49 -49 -49 -48 -48 -48 -48 -48 -48 -47 -47 -47
##  [73] -47 -47 -47 -46 -46 -46 -46 -46 -46 -46 -45 -45 -45 -45 -45 -44 -44 -44
##  [91] -44 -44 -44 -44 -43 -43 -43 -42 -42 -42 -42 -42 -42 -41 -41 -41 -41 -41
## [109] -41 -41 -40 -40 -40 -40 -40 -39 -39 -39 -39 -39 -39 -39 -39 -38 -38 -38
## [127] -38 -37 -37 -37 -37 -37 -37 -37 -37 -36 -36 -36 -36 -36 -36 -36 -35 -35
## [145] -35 -35 -35 -34 -34 -34 -34 -34 -34 -34 -34 -34 -33 -33 -33 -33 -33 -33
## [163] -32 -32 -32 -32 -32 -32 -32 -32 -31 -31 -31 -31 -31 -31 -31 -31 -31 -30
## [181] -30 -30 -30 -29 -29 -29 -29 -29 -29 -29 -29 -29 -29 -28 -28 -28 -28 -28
## [199] -28 -28 -27 -27 -25 -25 -25 -24 -24 -23 -18 -10  -8  -8  -7  -3  -2  -1
## [217]   0   0   1   1   2   2   3   3   3   4   4   5   5   6   7   8   9   9
## [235]  10  10  10  11  12  13  14  18
table(Transito)
## Transito
## -69 -68 -66 -65 -63 -62 -61 -60 -58 -57 -56 -55 -54 -53 -52 -51 -50 -49 -48 -47 
##   1   2   2   1   3   6   2   1   5   6   3   3   5   5   2   6   6   4   6   6 
## -46 -45 -44 -43 -42 -41 -40 -39 -38 -37 -36 -35 -34 -33 -32 -31 -30 -29 -28 -27 
##   7   5   7   3   6   7   5   8   4   8   7   5   9   6   8   9   4  10   7   2 
## -25 -24 -23 -18 -10  -8  -7  -3  -2  -1   0   1   2   3   4   5   6   7   8   9 
##   3   2   1   1   1   2   1   1   1   1   2   2   2   3   2   2   1   1   1   2 
##  10  11  12  13  14  18 
##   3   1   1   1   1   1

¿Cómo sería si por ejemplo quisieramos saber la probabilidad de que en un día tengamos un valor de desfase 13 (moda) si fuera esto con probabilidad clásica?

P(A) = 1/31

Distribución normal

R tiene módulos para analizar la probabilidad distibuida

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

¿Cómo podemos calcular la probabilidad de que tengamos un valor de -29 o menos utilizando la distribución normal?

Tenemos una media de: -36.21 y desviación estándar de: 19.19892

¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos?

pnorm(15, mean = -36.21, sd= 19.19892)
## [1] 0.9961773

Conclusión

Con los datos observados, se aprecia que el porcentaje del transito ha ido disminuyendo por la pandemia, esto se observa con las medidas tomadas, las cuales fueron quedarse lo mayormente posible en casa, sin embargo, cuando estos porcentajes se elevan, es cuando ocurre alguna festividad o fines de semana, que es cuando la gente más sale.