Practica 1
Análisis Descriptivo de datos confirmados COVID-19 en Mexico al 1o. de Mayo 2020
Las Librerias
library(readr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(knitr)
library(modeest)
Los datos (aqui se cargan los datos con la función read.csv)
datos <- read.csv("C:/Users/Angeles Moreno/Documents/Documents/CURSO TITULACION IoT/TERCER MODULO MAESTRO PIZARRO/DATOS/casos_confirmados.csv")
Resumen de los Datos
summary(datos)
## X State Sex Age
## Min. : 0 distrito federal:5209 FEMENINO : 8039 Min. : 0.00
## 1st Qu.:22523 méxico :3130 MASCULINO:11185 1st Qu.: 35.00
## Median :44009 baja california :1557 Median : 46.00
## Mean :44045 tabasco : 984 Mean : 46.59
## 3rd Qu.:65793 sinaloa : 865 3rd Qu.: 57.00
## Max. :87365 quintana roo : 788 Max. :113.00
## (Other) :6691
## Date Confirmed
## 2020-04-20: 1144 Min. :1
## 2020-04-21: 1100 1st Qu.:1
## 2020-04-24: 1049 Median :1
## 2020-04-22: 1016 Mean :1
## 2020-04-23: 1006 3rd Qu.:1
## 2020-04-17: 937 Max. :1
## (Other) :12972
La Moda
frecuencia <- sort(table(datos$Age), decreasing = TRUE)
frecuencia
##
## 46 49 47 52 44 45 41 43 38 48 35 39 42 37 40 50 51 36 34 33
## 483 475 466 465 462 459 456 455 453 450 442 437 436 434 429 429 428 425 417 416
## 53 56 31 54 29 55 32 30 57 28 58 27 59 60 26 62 61 65 63 66
## 412 402 398 393 384 376 372 369 362 336 333 324 322 322 299 287 283 261 249 220
## 25 67 68 24 64 69 23 70 71 73 72 22 75 74 21 78 76 77 79 19
## 215 215 197 196 192 178 161 155 136 130 124 115 114 113 99 94 93 91 74 57
## 20 80 84 82 81 18 83 17 87 86 0 13 85 1 15 16 11 2 88 89
## 56 56 56 52 44 42 41 33 33 27 26 26 25 24 22 21 20 18 18 18
## 12 14 90 4 10 7 9 6 91 3 5 8 92 95 93 94 97 99 100 96
## 17 17 17 15 15 14 14 13 12 11 11 9 7 6 5 3 2 2 2 1
## 98 102 113
## 1 1 1
moda <- frecuencia[1]
moda2 <- mlv(datos$Age)
moda2
## [1] 46
Valores máximos y mínimos
min(datos$Age)
## [1] 0
max(datos$Age)
## [1] 113
Cuartiles al 25%, 50% y 75%
cuartile25 <- quantile(datos$Age, 0.25)
cuartile25
## 25%
## 35
cuartile50 <- quantile(datos$Age, 0.50)
cuartile50
## 50%
## 46
cuartile75 <- quantile(datos$Age, 0.75)
cuartile75
## 75%
## 57
Rango de las Variables Age de los Datos
var(datos$Age)
## [1] 243.3138
sd(datos$Age)
## [1] 15.59852
range(datos$Age)
## [1] 0 113
boxplot de age
boxplot(datos$Age)
