library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/PyE1213")
sonora <- read_csv("sonora3.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## country_region_code = col_character(),
## country_region = col_character(),
## sub_region_1 = col_character(),
## sub_region_2 = col_logical(),
## metro_area = col_logical(),
## iso_3166_2_code = col_character(),
## census_fips_code = col_logical(),
## fecha = col_character(),
## recreacion = col_double(),
## tiendas = col_double(),
## parques = col_double(),
## transito = col_double(),
## trabajo = col_double(),
## residencial = col_double()
## )
datatable(sonora)
Transito <- sonora$transito
summary(Transito)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -69.00 -49.00 -39.00 -36.21 -30.00 18.00
boxplot(Transito)
mfv(Transito)
## [1] -29
sd(Transito)
## [1] 19.19892
var(Transito)
## [1] 368.5986
plot(Transito)
dist <- fdt(Transito, breaks = "Sturges")
dist
## Class limits f rf rf(%) cf cf(%)
## [-69.69,-59.927) 18 0.07 7.44 18 7.44
## [-59.927,-50.163) 35 0.14 14.46 53 21.90
## [-50.163,-40.4) 57 0.24 23.55 110 45.45
## [-40.4,-30.637) 69 0.29 28.51 179 73.97
## [-30.637,-20.873) 29 0.12 11.98 208 85.95
## [-20.873,-11.11) 1 0.00 0.41 209 86.36
## [-11.11,-1.3467) 6 0.02 2.48 215 88.84
## [-1.3467,8.4167) 17 0.07 7.02 232 95.87
## [8.4167,18.18) 10 0.04 4.13 242 100.00
plot(dist,type="fh")
plot(dist,type="rfh")
plot(dist,type="cfh")
plot(dist,type="fp")
plot(dist,type="rfp")
plot(dist,type="cfp")
Frecuencia con la cual se repiten los valores del conjunto de datos
sort(Transito)
## [1] -69 -68 -68 -66 -66 -65 -63 -63 -63 -62 -62 -62 -62 -62 -62 -61 -61 -60
## [19] -58 -58 -58 -58 -58 -57 -57 -57 -57 -57 -57 -56 -56 -56 -55 -55 -55 -54
## [37] -54 -54 -54 -54 -53 -53 -53 -53 -53 -52 -52 -51 -51 -51 -51 -51 -51 -50
## [55] -50 -50 -50 -50 -50 -49 -49 -49 -49 -48 -48 -48 -48 -48 -48 -47 -47 -47
## [73] -47 -47 -47 -46 -46 -46 -46 -46 -46 -46 -45 -45 -45 -45 -45 -44 -44 -44
## [91] -44 -44 -44 -44 -43 -43 -43 -42 -42 -42 -42 -42 -42 -41 -41 -41 -41 -41
## [109] -41 -41 -40 -40 -40 -40 -40 -39 -39 -39 -39 -39 -39 -39 -39 -38 -38 -38
## [127] -38 -37 -37 -37 -37 -37 -37 -37 -37 -36 -36 -36 -36 -36 -36 -36 -35 -35
## [145] -35 -35 -35 -34 -34 -34 -34 -34 -34 -34 -34 -34 -33 -33 -33 -33 -33 -33
## [163] -32 -32 -32 -32 -32 -32 -32 -32 -31 -31 -31 -31 -31 -31 -31 -31 -31 -30
## [181] -30 -30 -30 -29 -29 -29 -29 -29 -29 -29 -29 -29 -29 -28 -28 -28 -28 -28
## [199] -28 -28 -27 -27 -25 -25 -25 -24 -24 -23 -18 -10 -8 -8 -7 -3 -2 -1
## [217] 0 0 1 1 2 2 3 3 3 4 4 5 5 6 7 8 9 9
## [235] 10 10 10 11 12 13 14 18
table(Transito)
## Transito
## -69 -68 -66 -65 -63 -62 -61 -60 -58 -57 -56 -55 -54 -53 -52 -51 -50 -49 -48 -47
## 1 2 2 1 3 6 2 1 5 6 3 3 5 5 2 6 6 4 6 6
## -46 -45 -44 -43 -42 -41 -40 -39 -38 -37 -36 -35 -34 -33 -32 -31 -30 -29 -28 -27
## 7 5 7 3 6 7 5 8 4 8 7 5 9 6 8 9 4 10 7 2
## -25 -24 -23 -18 -10 -8 -7 -3 -2 -1 0 1 2 3 4 5 6 7 8 9
## 3 2 1 1 1 2 1 1 1 1 2 2 2 3 2 2 1 1 1 2
## 10 11 12 13 14 18
## 3 1 1 1 1 1
¿Cómo sería si por ejemplo quisieramos saber la probabilidad de que en un día tengamos un valor de desfase 13 (moda) si fuera esto con probabilidad clásica?
P(A) = 1/31
R tiene módulos para analizar la probabilidad distibuida
\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
¿Cómo podemos calcular la probabilidad de que tengamos un valor de -29 o menos utilizando la distribución normal?
Tenemos una media de: -36.21 y desviación estándar de: 19.19892
¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos?
pnorm(15, mean = -36.21, sd= 19.19892)
## [1] 0.9961773
Con los datos observados, se aprecia que el porcentaje del transito ha ido disminuyendo por la pandemia, esto se observa con las medidas tomadas, las cuales fueron quedarse lo mayormente posible en casa, sin embargo, cuando estos porcentajes se elevan, es cuando ocurre alguna festividad o fines de semana, que es cuando la gente más sale.