U1A14

Andres

22/10/2020


library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/3er Semestre/ProbYEst")
sonora <- read_csv("sonora3.csv")
## Parsed with column specification:
## cols(
##   country_region_code = col_character(),
##   country_region = col_character(),
##   sub_region_1 = col_character(),
##   sub_region_2 = col_logical(),
##   metro_area = col_logical(),
##   iso_3166_2_code = col_character(),
##   census_fips_code = col_logical(),
##   date = col_character(),
##   retail_and_recreation_percent_change_from_baseline = col_double(),
##   grocery_and_pharmacy_percent_change_from_baseline = col_double(),
##   parks_percent_change_from_baseline = col_double(),
##   transit_stations_percent_change_from_baseline = col_double(),
##   workplaces_percent_change_from_baseline = col_double(),
##   residential_percent_change_from_baseline = col_double()
## )
datatable(sonora)
Farmacias <- sonora$grocery_and_pharmacy_percent_change_from_baseline

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(Farmacias)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -36.00  -18.00  -14.00  -13.31  -10.00   16.00
boxplot(Farmacias)

mfv(Farmacias)
## [1] -13

Medidas de dispersión

sd(Farmacias)
## [1] 9.166087
var(Farmacias)
## [1] 84.01715
plot(Farmacias)

Tabla de distribuciones de frecuencia

dist <- fdt(Farmacias, breaks = "Sturges")
dist
##       Class limits  f   rf rf(%)  cf  cf(%)
##   [-36.36,-30.524)  8 0.03  3.31   8   3.31
##  [-30.524,-24.689) 13 0.05  5.37  21   8.68
##  [-24.689,-18.853) 32 0.13 13.22  53  21.90
##  [-18.853,-13.018) 72 0.30 29.75 125  51.65
##  [-13.018,-7.1822) 71 0.29 29.34 196  80.99
##  [-7.1822,-1.3467) 17 0.07  7.02 213  88.02
##   [-1.3467,4.4889) 19 0.08  7.85 232  95.87
##    [4.4889,10.324)  6 0.02  2.48 238  98.35
##     [10.324,16.16)  4 0.02  1.65 242 100.00

Histogramas y políginos de distribución de frecuencia

plot(dist,type="fh")

plot(dist,type="rfh")

plot(dist,type="cfh")

plot(dist,type="fp")

plot(dist,type="rfp")

plot(dist,type="cfp")

Distribuciones de probabilidad

Frecuencia con la cual se repiten los valores del conjunto de datos

sort(Farmacias)
##   [1] -36 -36 -35 -34 -33 -31 -31 -31 -30 -30 -30 -29 -29 -28 -28 -28 -28 -27
##  [19] -26 -25 -25 -24 -24 -24 -24 -24 -24 -23 -23 -23 -22 -22 -22 -22 -21 -21
##  [37] -21 -21 -21 -21 -21 -21 -20 -20 -20 -20 -20 -20 -20 -19 -19 -19 -19 -18
##  [55] -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -17 -17 -17 -17
##  [73] -17 -17 -17 -17 -17 -17 -16 -16 -16 -16 -16 -16 -16 -16 -16 -16 -16 -16
##  [91] -16 -16 -16 -16 -16 -16 -15 -15 -15 -15 -15 -15 -15 -15 -15 -15 -15 -15
## [109] -15 -15 -15 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -13
## [127] -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13
## [145] -13 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -11
## [163] -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -10 -10 -10 -10 -10
## [181] -10 -10 -10  -9  -9  -9  -9  -9  -9  -8  -8  -8  -8  -8  -8  -8  -7  -7
## [199]  -7  -7  -6  -6  -5  -5  -5  -5  -5  -4  -4  -4  -3  -2  -2  -1  -1  -1
## [217]  -1  -1  -1   0   0   0   0   2   2   2   3   3   4   4   4   4   6   6
## [235]   6   8   8  10  12  13  15  16
table(Farmacias)
## Farmacias
## -36 -35 -34 -33 -31 -30 -29 -28 -27 -26 -25 -24 -23 -22 -21 -20 -19 -18 -17 -16 
##   2   1   1   1   3   3   2   4   1   1   2   6   3   4   8   7   4  15  10  18 
## -15 -14 -13 -12 -11 -10  -9  -8  -7  -6  -5  -4  -3  -2  -1   0   2   3   4   6 
##  15  14  20  16  14   8   6   7   4   2   5   3   1   2   6   4   3   2   4   3 
##   8  10  12  13  15  16 
##   2   1   1   1   1   1

¿Cómo sería si por ejemplo quisieramos saber la probabilidad de que en un día tengamos un valor de desfase -13.31 (moda) si fuera esto con probabilidad clásica?

Distribución normal

R tiene módulos para analizar la probabilidad distibuida

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

¿Cómo podemos calcular la probabilidad de que tengamos un valor de 15 o menos utilizando la distribución normal?

Tenemos una media de: -13.31 y desviación estándar de: 9.166087

¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos

pnorm(15, mean = -13.14, sd=9.166087)
## [1] 0.9989298

Conclusión

Podemos apreciar que las farmacias se visitaron con menor frecuencia, probablemente solamente cuando fuera una urgencia y no por algo comun, por el miedo a ser infectados o por otros factores o simplemente al estar en casas seguros, no se enfermaron con mayro frecuencia que al estar comiendo fuera de casa o visitando lugares con mas virus en el aire.