library(pacman)
p_load("readr", "DT", "prettydoc", "fdth", "modeest")
setwd("~/PyEitson")
sonora = read.csv("sonora3.csv")
datatable(sonora)
EnCasa = sonora$residential_percent_change_from_baseline
summary(EnCasa)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -2.00 10.00 14.00 13.14 18.00 28.00
boxplot(EnCasa)
mfv(EnCasa)
## [1] 13
sd(EnCasa)
## [1] 6.677049
var(EnCasa)
## [1] 44.58299
plot(EnCasa)
## Tabla de distribuciones de frecuencia
dist = fdt(EnCasa, breaks = "Sturges")
dist
## Class limits f rf rf(%) cf cf(%)
## [-2.02,1.3467) 27 0.11 11.16 27 11.16
## [1.3467,4.7133) 3 0.01 1.24 30 12.40
## [4.7133,8.08) 17 0.07 7.02 47 19.42
## [8.08,11.447) 20 0.08 8.26 67 27.69
## [11.447,14.813) 68 0.28 28.10 135 55.79
## [14.813,18.18) 61 0.25 25.21 196 80.99
## [18.18,21.547) 31 0.13 12.81 227 93.80
## [21.547,24.913) 12 0.05 4.96 239 98.76
## [24.913,28.28) 3 0.01 1.24 242 100.00
### Histogramas y polígonos de distribución de frecuencia
plot(dist, type= "fh")
plot(dist, type= "rfh")
plot(dist, type= "cfh")
#Poligono
plot(dist, type= "fp")
plot(dist, type= "rfp")
plot(dist, type= "cfp")
Frecuencia con la cual se repiten los valores del conjunto de datos
sort(EnCasa)
## [1] -2 -2 -2 -2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 0 0
## [26] 1 1 2 2 4 5 5 5 6 6 6 6 6 6 7 7 7 7 7 8 8 8 9 9 9
## [51] 9 9 9 10 10 10 10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 12 12
## [76] 12 12 12 12 12 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 13
## [101] 13 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 14 14 14
## [126] 14 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16
## [151] 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 17 18 18
## [176] 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19
## [201] 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21
## [226] 21 21 22 22 22 22 22 22 23 23 23 24 24 24 26 27 28
table(EnCasa)
## EnCasa
## -2 -1 0 1 2 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
## 4 18 3 2 2 1 3 6 5 3 6 9 5 21 24 23 10 11 17 23 11 12 8 6 3 3
## 26 27 28
## 1 1 1
¿como seria si por ejemplo quisieramos saber la probabilidad de que en un dia tengamos un valor de desfase 13(moda) si fuera esto con probabilidad clásica?
P(A) = 1/31
R tiene modulos para analizar la probabilidad distribuída \[ \begin{array}{l|l|l|c} \text{Función} & \text{Significado} & \text{Uso}& \text{Observación}\\ \hline p & \text{probability} & \text{Calcula probabilidades acumuladas(cdf)} & \text{---}\\ q & \text{quantile} & \text{Calcula cuantiles (Percentiles)} & \text{---}\\ d & \text{density} & \text{Calcula probabilidades puntuales} & \text{Sólo uso gráfio en el caso continuo}\\ r & \text{random} & \text{Genera datos aleatorios según una distribución específica} & \text{---}\\ \hline \end{array} \]
¿Como podemos calcular la probabilidad de que tengamos un valor de 13 o menos utilizando la distribucion normal? Tenemos una media de [13.14] y desviación estándar de [6.67]
¿Cuál es la probabilidad de que \(X\) sea menor o igual a 15 o menos?
pnorm(15, mean=13.14, sd=6.67)
## [1] 0.6098241
#Tarea
EnParque =sonora$parks_percent_change_from_baseline
summary(EnParque)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -64.00 -40.75 -34.00 -31.49 -26.00 12.00
boxplot(EnParque)
mfv(EnParque)
## [1] -38
sd(EnParque)
## [1] 16.38546
var(EnParque)
## [1] 268.4832
plot(EnParque)
## Tabla de distribuciones de frecuencia
dist = fdt(EnParque, breaks = "Sturges")
dist
## Class limits f rf rf(%) cf cf(%)
## [-64.64,-56.111) 8 0.03 3.31 8 3.31
## [-56.111,-47.582) 25 0.10 10.33 33 13.64
## [-47.582,-39.053) 38 0.16 15.70 71 29.34
## [-39.053,-30.524) 76 0.31 31.40 147 60.74
## [-30.524,-21.996) 52 0.21 21.49 199 82.23
## [-21.996,-13.467) 12 0.05 4.96 211 87.19
## [-13.467,-4.9378) 3 0.01 1.24 214 88.43
## [-4.9378,3.5911) 11 0.05 4.55 225 92.98
## [3.5911,12.12) 17 0.07 7.02 242 100.00
### Histogramas y polígonos de distribución de frecuencia
plot(dist, type= "fh")
plot(dist, type= "rfh")
plot(dist, type= "cfh")
#Poligono
plot(dist, type= "fp")
plot(dist, type= "rfp")
plot(dist, type= "cfp")
## Distribuciones de probabilidad Frecuencia con la cual se repiten los valores del conjunto de datos
sort(EnParque)
## [1] -64 -63 -63 -60 -59 -59 -57 -57 -56 -56 -55 -54 -54 -53 -53 -53 -53 -53
## [19] -52 -52 -51 -51 -51 -51 -50 -50 -50 -49 -49 -49 -49 -48 -48 -47 -47 -47
## [37] -47 -46 -46 -46 -45 -45 -45 -45 -45 -44 -44 -44 -43 -42 -42 -42 -42 -42
## [55] -42 -41 -41 -41 -41 -41 -41 -40 -40 -40 -40 -40 -40 -40 -40 -40 -40 -39
## [73] -39 -39 -39 -39 -39 -39 -39 -38 -38 -38 -38 -38 -38 -38 -38 -38 -38 -38
## [91] -38 -38 -38 -38 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -37 -36
## [109] -36 -36 -36 -36 -36 -36 -36 -36 -35 -35 -35 -35 -34 -34 -34 -34 -34 -34
## [127] -34 -34 -33 -33 -33 -33 -32 -32 -32 -32 -32 -32 -32 -32 -31 -31 -31 -31
## [145] -31 -31 -31 -30 -30 -30 -30 -29 -29 -29 -29 -29 -29 -28 -28 -28 -28 -28
## [163] -28 -27 -27 -27 -27 -27 -27 -27 -27 -26 -26 -26 -26 -26 -26 -26 -26 -26
## [181] -26 -26 -26 -25 -25 -25 -25 -25 -25 -25 -24 -24 -24 -24 -23 -23 -23 -23
## [199] -22 -21 -21 -21 -21 -21 -21 -21 -21 -20 -18 -17 -14 -13 -9 -5 -4 -3
## [217] -2 -1 0 2 2 3 3 3 3 4 4 5 5 5 5 6 6 6
## [235] 6 6 6 8 8 10 11 12
table(EnParque)
## EnParque
## -64 -63 -60 -59 -57 -56 -55 -54 -53 -52 -51 -50 -49 -48 -47 -46 -45 -44 -43 -42
## 1 2 1 2 2 2 1 2 5 2 4 3 4 2 4 3 5 3 1 6
## -41 -40 -39 -38 -37 -36 -35 -34 -33 -32 -31 -30 -29 -28 -27 -26 -25 -24 -23 -22
## 6 10 8 15 13 9 4 8 4 8 7 4 6 6 8 12 7 4 4 1
## -21 -20 -18 -17 -14 -13 -9 -5 -4 -3 -2 -1 0 2 3 4 5 6 8 10
## 8 1 1 1 1 1 1 1 1 1 1 1 1 2 4 2 4 6 2 1
## 11 12
## 1 1
¿Como podemos calcular la probabilidad de que tengamos un valor de 13 o menos utilizando la distribucion normal? Tenemos una media de [-31.49] y desviación estándar de [16.38]
¿Cuál es la probabilidad de que \(X\) sea menor o igual a 1 o menos?
pnorm(1, mean=-31.49, sd=16.38)
## [1] 0.9763451