Practica 1

Análisis Descriptivo de datos confirmados COVID-19 en Mexico al 1o. de Mayo 2020

Las Librerias

library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(knitr)
library(modeest)

Los datos (aqui se cargan los datos con la función read.csv)

datos <- read.csv("C:/Users/Angeles Moreno/Documents/Documents/CURSO TITULACION IoT/TERCER MODULO MAESTRO PIZARRO/DATOS/casos_confirmados.csv")

Resumen de los Datos

summary(datos)
##        X                      State             Sex             Age        
##  Min.   :    0   distrito federal:5209   FEMENINO : 8039   Min.   :  0.00  
##  1st Qu.:22523   méxico         :3130   MASCULINO:11185   1st Qu.: 35.00  
##  Median :44009   baja california :1557                     Median : 46.00  
##  Mean   :44045   tabasco         : 984                     Mean   : 46.59  
##  3rd Qu.:65793   sinaloa         : 865                     3rd Qu.: 57.00  
##  Max.   :87365   quintana roo    : 788                     Max.   :113.00  
##                  (Other)         :6691                                     
##          Date         Confirmed
##  2020-04-20: 1144   Min.   :1  
##  2020-04-21: 1100   1st Qu.:1  
##  2020-04-24: 1049   Median :1  
##  2020-04-22: 1016   Mean   :1  
##  2020-04-23: 1006   3rd Qu.:1  
##  2020-04-17:  937   Max.   :1  
##  (Other)   :12972

La media de Age (Edad)

mean(datos$Age)
## [1] 46.58526

La mediana de Age (Edad)

median(datos$Age)
## [1] 46

La Moda

frecuencia <- sort(table(datos$Age), decreasing = TRUE)

frecuencia
## 
##  46  49  47  52  44  45  41  43  38  48  35  39  42  37  40  50  51  36  34  33 
## 483 475 466 465 462 459 456 455 453 450 442 437 436 434 429 429 428 425 417 416 
##  53  56  31  54  29  55  32  30  57  28  58  27  59  60  26  62  61  65  63  66 
## 412 402 398 393 384 376 372 369 362 336 333 324 322 322 299 287 283 261 249 220 
##  25  67  68  24  64  69  23  70  71  73  72  22  75  74  21  78  76  77  79  19 
## 215 215 197 196 192 178 161 155 136 130 124 115 114 113  99  94  93  91  74  57 
##  20  80  84  82  81  18  83  17  87  86   0  13  85   1  15  16  11   2  88  89 
##  56  56  56  52  44  42  41  33  33  27  26  26  25  24  22  21  20  18  18  18 
##  12  14  90   4  10   7   9   6  91   3   5   8  92  95  93  94  97  99 100  96 
##  17  17  17  15  15  14  14  13  12  11  11   9   7   6   5   3   2   2   2   1 
##  98 102 113 
##   1   1   1
moda <- frecuencia[1]
moda2 <- mlv(datos$Age)
moda2
## [1] 46

Valores máximos y mínimos

min(datos$Age)
## [1] 0
max(datos$Age)
## [1] 113

Cuartiles al 25%, 50% y 75%

cuartile25 <- quantile(datos$Age, 0.25)
cuartile25
## 25% 
##  35
cuartile50 <- quantile(datos$Age, 0.50)
cuartile50
## 50% 
##  46
cuartile75 <- quantile(datos$Age, 0.75)
cuartile75
## 75% 
##  57

Rango de las Variables Age de los Datos

var(datos$Age)
## [1] 243.3138
sd(datos$Age)
## [1] 15.59852
range(datos$Age)
## [1]   0 113

boxplot de age

boxplot(datos$Age)