Analisis descrptivo de datos confirmados COVID en mexico
La librerias
library(readr)
library(dplyr)
library(knitr)
library(modeest)
Los datos (Se cargan datos de la Funcion Read.csv
datos <- read.csv("C:/Users/ABDON LANDEROS/Desktop/MODULO 3/Datos/casos_confirmados.csv")
kable(head(datos, 10))
| 0 |
méxico |
FEMENINO |
75 |
2020-04-09 |
1 |
| 3 |
tamaulipas |
MASCULINO |
22 |
2020-04-06 |
1 |
| 15 |
distrito federal |
MASCULINO |
40 |
2020-03-28 |
1 |
| 16 |
distrito federal |
FEMENINO |
29 |
2020-04-01 |
1 |
| 17 |
yucatán |
MASCULINO |
71 |
2020-04-15 |
1 |
| 22 |
michoacán |
FEMENINO |
29 |
2020-04-23 |
1 |
| 27 |
guerrero |
FEMENINO |
61 |
2020-04-07 |
1 |
| 28 |
distrito federal |
MASCULINO |
33 |
2020-04-08 |
1 |
| 31 |
méxico |
FEMENINO |
77 |
2020-04-08 |
1 |
| 32 |
méxico |
FEMENINO |
84 |
2020-04-02 |
1 |
kable(tail(datos, 10))
| 19215 |
87334 |
michoacán |
MASCULINO |
22 |
2020-04-14 |
1 |
| 19216 |
87344 |
distrito federal |
FEMENINO |
52 |
2020-04-26 |
1 |
| 19217 |
87349 |
tabasco |
MASCULINO |
36 |
2020-04-28 |
1 |
| 19218 |
87353 |
distrito federal |
FEMENINO |
30 |
2020-04-21 |
1 |
| 19219 |
87354 |
tabasco |
FEMENINO |
47 |
2020-04-21 |
1 |
| 19220 |
87356 |
méxico |
FEMENINO |
28 |
2020-04-13 |
1 |
| 19221 |
87358 |
distrito federal |
FEMENINO |
39 |
2020-04-28 |
1 |
| 19222 |
87360 |
méxico |
MASCULINO |
48 |
2020-04-22 |
1 |
| 19223 |
87361 |
tabasco |
MASCULINO |
48 |
2020-04-25 |
1 |
| 19224 |
87365 |
méxico |
FEMENINO |
62 |
2020-04-07 |
1 |
Resumen de los Datos
summary(datos)
## X State Sex Age
## Min. : 0 distrito federal:5209 FEMENINO : 8039 Min. : 0.00
## 1st Qu.:22523 méxico :3130 MASCULINO:11185 1st Qu.: 35.00
## Median :44009 baja california :1557 Median : 46.00
## Mean :44045 tabasco : 984 Mean : 46.59
## 3rd Qu.:65793 sinaloa : 865 3rd Qu.: 57.00
## Max. :87365 quintana roo : 788 Max. :113.00
## (Other) :6691
## Date Confirmed
## 2020-04-20: 1144 Min. :1
## 2020-04-21: 1100 1st Qu.:1
## 2020-04-24: 1049 Median :1
## 2020-04-22: 1016 Mean :1
## 2020-04-23: 1006 3rd Qu.:1
## 2020-04-17: 937 Max. :1
## (Other) :12972
La moda
table(datos$Age)
##
## 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
## 26 24 18 11 15 11 13 14 9 14 15 20 17 26 17 22 21 33 42 57
## 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
## 56 99 115 161 196 215 299 324 336 384 369 398 372 416 417 442 425 434 453 437
## 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59
## 429 456 436 455 462 459 483 466 450 475 429 428 465 412 393 376 402 362 333 322
## 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79
## 322 283 287 249 192 261 220 215 197 178 155 136 124 130 113 114 93 91 94 74
## 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
## 56 44 52 41 56 25 27 33 18 18 17 12 7 5 3 6 1 2 1 2
## 100 102 113
## 2 1 1
frecuencias<-sort(table(datos$Age),decreasing=TRUE)
frecuencias
##
## 46 49 47 52 44 45 41 43 38 48 35 39 42 37 40 50 51 36 34 33
## 483 475 466 465 462 459 456 455 453 450 442 437 436 434 429 429 428 425 417 416
## 53 56 31 54 29 55 32 30 57 28 58 27 59 60 26 62 61 65 63 66
## 412 402 398 393 384 376 372 369 362 336 333 324 322 322 299 287 283 261 249 220
## 25 67 68 24 64 69 23 70 71 73 72 22 75 74 21 78 76 77 79 19
## 215 215 197 196 192 178 161 155 136 130 124 115 114 113 99 94 93 91 74 57
## 20 80 84 82 81 18 83 17 87 86 0 13 85 1 15 16 11 2 88 89
## 56 56 56 52 44 42 41 33 33 27 26 26 25 24 22 21 20 18 18 18
## 12 14 90 4 10 7 9 6 91 3 5 8 92 95 93 94 97 99 100 96
## 17 17 17 15 15 14 14 13 12 11 11 9 7 6 5 3 2 2 2 1
## 98 102 113
## 1 1 1
moda<-frecuencias[1]
moda
## 46
## 483
moda2<-mlv(datos$Age)
moda2
## [1] 46
### Valores maximos y minimos
```r
min(datos$Age)
## [1] 0
max(datos$Age)
## [1] 113
Cuatiles al 25%,50% y 75%
cuartile50<-quantile(datos$Age,0.50)
cuartile50
## 50%
## 46
cuartile25<-quantile(datos$Age,0.25)
cuartile25
## 25%
## 35
cuartile75<-quantile(datos$Age,0.75)
cuartile75
## 75%
## 57
Rango de la variable Age de los Datos
range(datos$Age)
## [1] 0 113
Boxplot de Age
boxplot(datos$Age)
