U1A14

Juan Valenzuela

21/10/2020

  • Importar y extraer datos, paquetes
library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/PyE12")
sonora <- read_csv("sonora3.csv")
## Parsed with column specification:
## cols(
##   country_region_code = col_character(),
##   country_region = col_character(),
##   sub_region_1 = col_character(),
##   sub_region_2 = col_logical(),
##   metro_area = col_logical(),
##   iso_3166_2_code = col_character(),
##   census_fips_code = col_logical(),
##   date = col_character(),
##   retail_and_recreation_percent_change_from_baseline = col_double(),
##   grocery_and_pharmacy_percent_change_from_baseline = col_double(),
##   parks_percent_change_from_baseline = col_double(),
##   transit_stations_percent_change_from_baseline = col_double(),
##   workplaces_percent_change_from_baseline = col_double(),
##   residential_percent_change_from_baseline = col_double()
## )
datatable(sonora)
EnCasa <- sonora$retail_and_recreation_percent_change_from_baseline

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(EnCasa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -71.00  -51.00  -41.00  -38.07  -31.00    7.00
boxplot(EnCasa)

mfv(EnCasa)
## [1] -31

Medidas de dispersión

sd(EnCasa)
## [1] 18.83316
var(EnCasa)
## [1] 354.688
plot(EnCasa)

Tabla de distribuciones de frecuencia

dist <- fdt(EnCasa, breaks = "Sturges")
dist
##     Class limits  f   rf rf(%)  cf  cf(%)
##  [-71.71,-62.96) 12 0.05  4.96  12   4.96
##   [-62.96,-54.2) 24 0.10  9.92  36  14.88
##   [-54.2,-45.45) 66 0.27 27.27 102  42.15
##   [-45.45,-36.7) 34 0.14 14.05 136  56.20
##   [-36.7,-27.94) 71 0.29 29.34 207  85.54
##  [-27.94,-19.19)  3 0.01  1.24 210  86.78
##  [-19.19,-10.44)  0 0.00  0.00 210  86.78
##  [-10.44,-1.683)  5 0.02  2.07 215  88.84
##    [-1.683,7.07) 27 0.11 11.16 242 100.00

Histogramas y políginos de distribución de frecuencia

plot(dist,type="fh")

plot(dist,type="rfh")

plot(dist,type="cfh")

plot(dist,type="fp")

plot(dist,type="rfp")

plot(dist,type="cfp")

Distribuciones de probabilidad

Frecuencia con la cual se repiten los valores del conjunto de datos

sort(EnCasa)
##   [1] -71 -71 -70 -70 -68 -66 -65 -65 -64 -64 -63 -63 -62 -62 -61 -61 -60 -60
##  [19] -60 -60 -60 -60 -60 -60 -59 -59 -59 -58 -57 -57 -57 -57 -56 -56 -55 -55
##  [37] -54 -54 -54 -54 -54 -53 -53 -53 -53 -53 -53 -53 -53 -52 -52 -52 -52 -52
##  [55] -52 -52 -52 -52 -52 -51 -51 -51 -51 -51 -51 -51 -51 -50 -50 -50 -50 -50
##  [73] -50 -50 -50 -50 -50 -50 -50 -49 -49 -49 -49 -49 -49 -49 -49 -49 -48 -48
##  [91] -48 -48 -48 -48 -48 -47 -47 -47 -47 -47 -46 -46 -45 -45 -45 -45 -44 -44
## [109] -43 -43 -43 -43 -43 -43 -43 -43 -42 -41 -41 -41 -41 -41 -40 -40 -40 -39
## [127] -39 -38 -38 -38 -37 -37 -37 -37 -37 -37 -36 -36 -35 -35 -35 -35 -35 -35
## [145] -35 -35 -34 -34 -34 -34 -34 -34 -34 -34 -34 -34 -33 -33 -33 -33 -33 -33
## [163] -33 -33 -33 -33 -33 -32 -32 -32 -32 -31 -31 -31 -31 -31 -31 -31 -31 -31
## [181] -31 -31 -31 -31 -31 -30 -30 -30 -30 -30 -30 -30 -29 -29 -29 -29 -29 -29
## [199] -29 -29 -29 -28 -28 -28 -28 -28 -28 -27 -23 -21 -10  -9  -8  -7  -3  -1
## [217]  -1  -1   0   0   1   1   1   1   1   2   2   3   3   3   3   4   4   4
## [235]   4   6   6   7   7   7   7   7
table(EnCasa)
## EnCasa
## -71 -70 -68 -66 -65 -64 -63 -62 -61 -60 -59 -58 -57 -56 -55 -54 -53 -52 -51 -50 
##   2   2   1   1   2   2   2   2   2   8   3   1   4   2   2   5   8  10   8  12 
## -49 -48 -47 -46 -45 -44 -43 -42 -41 -40 -39 -38 -37 -36 -35 -34 -33 -32 -31 -30 
##   9   7   5   2   4   2   8   1   5   3   2   3   6   2   8  10  11   4  14   7 
## -29 -28 -27 -23 -21 -10  -9  -8  -7  -3  -1   0   1   2   3   4   6   7 
##   9   6   1   1   1   1   1   1   1   1   3   2   5   2   4   4   2   5

¿Cómo sería si por ejemplo quisieramos saber la probabilidad de que en un día tengamos un valor de desfase 13 (moda) si fuera esto con probabilidad clásica?

P(A) = 1/31

Distribución normal

R tiene módulos para analizar la probabilidad distibuida

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

¿Cómo podemos calcular la probabilidad de que tengamos un valor de 15 o menos utilizando la distribución normal?

Tenemos una media de: 13.14 y desviación estándar de: 6.67

¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos

pnorm(15, mean = -38.07, sd=18.83316)
## [1] 0.9975831

Conclusion

Podemos apreciar en este estudio que la reducción de la movilidad obligó a que la población a quedarse en su casa y solamente salir cuando se es necesario, para poder asi tener controlada la pandemia y generar contagios en magnitud. Y con las gráficas anteriores podemos ver esto reflejado en que la gente dejo de ir a lugares de recreación como parques.