library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/PyEitson")
sonora = read.csv("sonora3.csv")
datatable(sonora)
EnCasa = sonora$residential_percent_change_from_baseline

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(EnCasa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   -2.00   10.00   14.00   13.14   18.00   28.00
boxplot(EnCasa)

mfv(EnCasa)
## [1] 13

Medidas de dispersión

sd(EnCasa)
## [1] 6.677049
var(EnCasa)
## [1] 44.58299
plot(EnCasa)

## Tabla de distribuciones de frecuencia

dist = fdt(EnCasa, breaks = "Sturges")
dist
##     Class limits  f   rf rf(%)  cf  cf(%)
##   [-2.02,1.3467) 27 0.11 11.16  27  11.16
##  [1.3467,4.7133)  3 0.01  1.24  30  12.40
##    [4.7133,8.08) 17 0.07  7.02  47  19.42
##    [8.08,11.447) 20 0.08  8.26  67  27.69
##  [11.447,14.813) 68 0.28 28.10 135  55.79
##   [14.813,18.18) 61 0.25 25.21 196  80.99
##   [18.18,21.547) 31 0.13 12.81 227  93.80
##  [21.547,24.913) 12 0.05  4.96 239  98.76
##   [24.913,28.28)  3 0.01  1.24 242 100.00

### Histogramas y polígonos de distribución de frecuencia

plot(dist, type= "fh")

plot(dist, type= "rfh")

plot(dist, type= "cfh")

#Poligono
plot(dist, type= "fp")

plot(dist, type= "rfp")

plot(dist, type= "cfp")

Distribuciones de probabilidad

Frecuencia con la cual se repiten los valores del conjunto de datos

sort(EnCasa)
##   [1] -2 -2 -2 -2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1  0  0  0
##  [26]  1  1  2  2  4  5  5  5  6  6  6  6  6  6  7  7  7  7  7  8  8  8  9  9  9
##  [51]  9  9  9 10 10 10 10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 12 12
##  [76] 12 12 12 12 12 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 13
## [101] 13 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 14 14 14
## [126] 14 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16
## [151] 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 18 18
## [176] 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19
## [201] 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21
## [226] 21 21 22 22 22 22 22 22 23 23 23 24 24 24 26 27 28
table(EnCasa)
## EnCasa
## -2 -1  0  1  2  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
##  4 18  3  2  2  1  3  6  5  3  6  9  5 21 24 23 10 11 17 23 11 12  8  6  3  3 
## 26 27 28 
##  1  1  1

¿como seria si por ejemplo quisieramos saber la probabilidad de que en un dia tengamos un valor de desfase 13(moda) si fuera esto con probabilidad clásica?

P(A) = 1/31

Distribucion normal

R tiene modulos para analizar la probabilidad distribuída \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas(cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (Percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfio en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]

¿Como podemos calcular la probabilidad de que tengamos un valor de 13 o menos utilizando la distribucion normal? Tenemos una media de [13.14] y desviación estándar de [6.67]

¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos?

pnorm(15, mean=13.14, sd=6.67)
## [1] 0.6098241

#Tarea

EnParque =sonora$parks_percent_change_from_baseline

Distribuciones

Distribuciones de frecuencia

Medidas de tendencia

summary(EnParque)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -64.00  -40.75  -34.00  -31.49  -26.00   12.00
boxplot(EnParque)

mfv(EnParque)
## [1] -38

Medidas de dispersión

sd(EnParque)
## [1] 16.38546
var(EnParque)
## [1] 268.4832
plot(EnParque)

## Tabla de distribuciones de frecuencia

dist = fdt(EnParque, breaks = "Sturges")
dist
##       Class limits  f   rf rf(%)  cf  cf(%)
##   [-64.64,-56.111)  8 0.03  3.31   8   3.31
##  [-56.111,-47.582) 25 0.10 10.33  33  13.64
##  [-47.582,-39.053) 38 0.16 15.70  71  29.34
##  [-39.053,-30.524) 76 0.31 31.40 147  60.74
##  [-30.524,-21.996) 52 0.21 21.49 199  82.23
##  [-21.996,-13.467) 12 0.05  4.96 211  87.19
##  [-13.467,-4.9378)  3 0.01  1.24 214  88.43
##   [-4.9378,3.5911) 11 0.05  4.55 225  92.98
##     [3.5911,12.12) 17 0.07  7.02 242 100.00

### Histogramas y polígonos de distribución de frecuencia

plot(dist, type= "fh")

plot(dist, type= "rfh")

plot(dist, type= "cfh")

#Poligono
plot(dist, type= "fp")

plot(dist, type= "rfp")

plot(dist, type= "cfp")

## Distribuciones de probabilidad Frecuencia con la cual se repiten los valores del conjunto de datos

sort(EnParque)
##   [1] -64 -63 -63 -60 -59 -59 -57 -57 -56 -56 -55 -54 -54 -53 -53 -53 -53 -53
##  [19] -52 -52 -51 -51 -51 -51 -50 -50 -50 -49 -49 -49 -49 -48 -48 -47 -47 -47
##  [37] -47 -46 -46 -46 -45 -45 -45 -45 -45 -44 -44 -44 -43 -42 -42 -42 -42 -42
##  [55] -42 -41 -41 -41 -41 -41 -41 -40 -40 -40 -40 -40 -40 -40 -40 -40 -40 -39
##  [73] -39 -39 -39 -39 -39 -39 -39 -38 -38 -38 -38 -38 -38 -38 -38 -38 -38 -38
##  [91] -38 -38 -38 -38 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -36
## [109] -36 -36 -36 -36 -36 -36 -36 -36 -35 -35 -35 -35 -34 -34 -34 -34 -34 -34
## [127] -34 -34 -33 -33 -33 -33 -32 -32 -32 -32 -32 -32 -32 -32 -31 -31 -31 -31
## [145] -31 -31 -31 -30 -30 -30 -30 -29 -29 -29 -29 -29 -29 -28 -28 -28 -28 -28
## [163] -28 -27 -27 -27 -27 -27 -27 -27 -27 -26 -26 -26 -26 -26 -26 -26 -26 -26
## [181] -26 -26 -26 -25 -25 -25 -25 -25 -25 -25 -24 -24 -24 -24 -23 -23 -23 -23
## [199] -22 -21 -21 -21 -21 -21 -21 -21 -21 -20 -18 -17 -14 -13  -9  -5  -4  -3
## [217]  -2  -1   0   2   2   3   3   3   3   4   4   5   5   5   5   6   6   6
## [235]   6   6   6   8   8  10  11  12
table(EnParque)
## EnParque
## -64 -63 -60 -59 -57 -56 -55 -54 -53 -52 -51 -50 -49 -48 -47 -46 -45 -44 -43 -42 
##   1   2   1   2   2   2   1   2   5   2   4   3   4   2   4   3   5   3   1   6 
## -41 -40 -39 -38 -37 -36 -35 -34 -33 -32 -31 -30 -29 -28 -27 -26 -25 -24 -23 -22 
##   6  10   8  15  13   9   4   8   4   8   7   4   6   6   8  12   7   4   4   1 
## -21 -20 -18 -17 -14 -13  -9  -5  -4  -3  -2  -1   0   2   3   4   5   6   8  10 
##   8   1   1   1   1   1   1   1   1   1   1   1   1   2   4   2   4   6   2   1 
##  11  12 
##   1   1

¿Como podemos calcular la probabilidad de que tengamos un valor de 13 o menos utilizando la distribucion normal? Tenemos una media de [-31.49] y desviación estándar de [16.38]

¿Cuál es la probabilidad de que \(X\) sea menor o igual a 1 o menos?

pnorm(1, mean=-31.49, sd=16.38)
## [1] 0.9763451