U1A14

Andrea Felix

21/10/2020

*Importar y extraer datos

library(pacman)
p_load("read", "DT", "prettydoc", "fdth", "modeest")
## Installing package into 'C:/Users/Andrea/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'read' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'read'
## Warning in p_load("read", "DT", "prettydoc", "fdth", "modeest"): Failed to install/load:
## read
sonora <-read.csv("sonora3.csv")
datatable(sonora)
Residencial <- sonora$residential_percent_change_from_baseline

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(Residencial)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   -2.00   10.00   14.00   13.14   18.00   28.00
boxplot(Residencial)

mfv(Residencial)
## [1] 13

Medidas de dispersion

sd(Residencial)
## [1] 6.677049
var(Residencial)
## [1] 44.58299
plot(Residencial)

Tabla de distribucion de frecuencia

dist <- fdt(Residencial, breaks = "Sturges")
dist
##     Class limits  f   rf rf(%)  cf  cf(%)
##   [-2.02,1.3467) 27 0.11 11.16  27  11.16
##  [1.3467,4.7133)  3 0.01  1.24  30  12.40
##    [4.7133,8.08) 17 0.07  7.02  47  19.42
##    [8.08,11.447) 20 0.08  8.26  67  27.69
##  [11.447,14.813) 68 0.28 28.10 135  55.79
##   [14.813,18.18) 61 0.25 25.21 196  80.99
##   [18.18,21.547) 31 0.13 12.81 227  93.80
##  [21.547,24.913) 12 0.05  4.96 239  98.76
##   [24.913,28.28)  3 0.01  1.24 242 100.00

Histogramas y poligonos de distribucion de frecuencia

plot(dist, type="fh")

plot(dist, type="rfh")

plot(dist, type="cfh")

plot(dist, type="fp")

plot(dist, type="rfp")

plot(dist, type="cfp")

Distribucion de probabilidad

Frecuencia con la cual se repiten los valores del conjunto de datos

sort(Residencial)
##   [1] -2 -2 -2 -2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1  0  0  0
##  [26]  1  1  2  2  4  5  5  5  6  6  6  6  6  6  7  7  7  7  7  8  8  8  9  9  9
##  [51]  9  9  9 10 10 10 10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 12 12
##  [76] 12 12 12 12 12 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 13
## [101] 13 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 14 14 14
## [126] 14 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16
## [151] 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 18 18
## [176] 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19
## [201] 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21
## [226] 21 21 22 22 22 22 22 22 23 23 23 24 24 24 26 27 28
table(Residencial)
## Residencial
## -2 -1  0  1  2  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
##  4 18  3  2  2  1  3  6  5  3  6  9  5 21 24 23 10 11 17 23 11 12  8  6  3  3 
## 26 27 28 
##  1  1  1

¿Como seria si por ejemplo quisieramos saber la probabilidad de que en una dia tengamos un valor de desfase 13 (moda) si fuera esto con probabilidad clasica?

P(A) = 1/31

Distribución normal

R tiene módulos para analizar la probabilidad distibuida

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

¿Cómo podemos calcular la probabilidad de que tengamos un valor de 15 o menos utilizando la distribución normal?

Tenemos una media de: 13.14 y desviación estándar de: 6.67

¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos

pnorm(15, mean = 13.14, sd=6.67)
## [1] 0.6098241

Asignacion

datatable(sonora)
farma <- sonora$grocery_and_pharmacy_percent_change_from_baseline

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(farma)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -36.00  -18.00  -14.00  -13.31  -10.00   16.00
boxplot(farma)

mfv(farma)
## [1] -13

Medidas de dispersion

sd(farma)
## [1] 9.166087
var(farma)
## [1] 84.01715
plot(farma)

Tabla de distribucion de frecuencia

dist <- fdt(farma, breaks = "Sturges")
dist
##       Class limits  f   rf rf(%)  cf  cf(%)
##   [-36.36,-30.524)  8 0.03  3.31   8   3.31
##  [-30.524,-24.689) 13 0.05  5.37  21   8.68
##  [-24.689,-18.853) 32 0.13 13.22  53  21.90
##  [-18.853,-13.018) 72 0.30 29.75 125  51.65
##  [-13.018,-7.1822) 71 0.29 29.34 196  80.99
##  [-7.1822,-1.3467) 17 0.07  7.02 213  88.02
##   [-1.3467,4.4889) 19 0.08  7.85 232  95.87
##    [4.4889,10.324)  6 0.02  2.48 238  98.35
##     [10.324,16.16)  4 0.02  1.65 242 100.00

Histogramas y poligonos de distribucion de frecuencia

plot(dist, type="fh")

plot(dist, type="rfh")

plot(dist, type="cfh")

plot(dist, type="fp")

plot(dist, type="rfp")

plot(dist, type="cfp")

Distribucion de probabilidad

Frecuencia con la cual se repiten los valores del conjunto de datos

sort(farma)
##   [1] -36 -36 -35 -34 -33 -31 -31 -31 -30 -30 -30 -29 -29 -28 -28 -28 -28 -27
##  [19] -26 -25 -25 -24 -24 -24 -24 -24 -24 -23 -23 -23 -22 -22 -22 -22 -21 -21
##  [37] -21 -21 -21 -21 -21 -21 -20 -20 -20 -20 -20 -20 -20 -19 -19 -19 -19 -18
##  [55] -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -18 -17 -17 -17 -17
##  [73] -17 -17 -17 -17 -17 -17 -16 -16 -16 -16 -16 -16 -16 -16 -16 -16 -16 -16
##  [91] -16 -16 -16 -16 -16 -16 -15 -15 -15 -15 -15 -15 -15 -15 -15 -15 -15 -15
## [109] -15 -15 -15 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -14 -13
## [127] -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13 -13
## [145] -13 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -12 -11
## [163] -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -10 -10 -10 -10 -10
## [181] -10 -10 -10  -9  -9  -9  -9  -9  -9  -8  -8  -8  -8  -8  -8  -8  -7  -7
## [199]  -7  -7  -6  -6  -5  -5  -5  -5  -5  -4  -4  -4  -3  -2  -2  -1  -1  -1
## [217]  -1  -1  -1   0   0   0   0   2   2   2   3   3   4   4   4   4   6   6
## [235]   6   8   8  10  12  13  15  16
table(farma)
## farma
## -36 -35 -34 -33 -31 -30 -29 -28 -27 -26 -25 -24 -23 -22 -21 -20 -19 -18 -17 -16 
##   2   1   1   1   3   3   2   4   1   1   2   6   3   4   8   7   4  15  10  18 
## -15 -14 -13 -12 -11 -10  -9  -8  -7  -6  -5  -4  -3  -2  -1   0   2   3   4   6 
##  15  14  20  16  14   8   6   7   4   2   5   3   1   2   6   4   3   2   4   3 
##   8  10  12  13  15  16 
##   2   1   1   1   1   1

Distribución normal

R tiene módulos para analizar la probabilidad distibuida

\[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas (cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfico en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

¿Cómo podemos calcular la probabilidad de que tengamos un valor de -24 o menos utilizando la distribución normal?

Tenemos una media de: -13.31405 y desviación estándar de: 9.166087

¿Cuál es la probabilidad de que \(X\) sea menor o igual a -24 o menos

pnorm(-24, mean = -13.31405, sd = 9.166087)
## [1] 0.1218449

Conclusion

Se puede observar que cuando la pandemia dio inicio hubo una gran cantidad de movilidad en farmacias y supermercados, esto tuvo lugar durante un tiempo pero despues disminuyo y subio de nuevo de manera normal, quedandose asi en una cantidad no tan variante. Al final de la grafica se puede observar un ligero aumento de movilidad, esto puede ser provocado por la segunda ola de la pandemia.