OBJETIVO:

Analizar una base de datos de los registros de resultados de personas con caso sospecho de SARS-COVID-19.

DESCRIPCION:

En el portar de datos del gobierno federal se encuentra la base de datos de registro de personas que asisten a distintos sectores de salud para el diagnostico sobre su estado de salud en relacion con el virus SARS-COVID-19.

Cargar librerias.

library(readr)      # Cargar datos csv
library(fdth)       # Tablas de frecuencias
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(dplyr)      # Filtros, Select, mutate, arrange, grou_by, summarize, %>%
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(lubridate)  # Para manejo de fechas
## 
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(ggplot2)

Cargar datos:

getwd()
## [1] "C:/Users/pc/Documents"

Cargar Base de Datos SARS-COVID-19

datos.covid <- read.csv("200922COVID19MEXICO.csv", encoding = "UTF=8")

Explorar datos

summary(datos.covid)
##  FECHA_ACTUALIZACION ID_REGISTRO            ORIGEN          SECTOR      
##  Length:1604845      Length:1604845     Min.   :1.000   Min.   : 1.000  
##  Class :character    Class :character   1st Qu.:1.000   1st Qu.: 4.000  
##  Mode  :character    Mode  :character   Median :2.000   Median :12.000  
##                                         Mean   :1.671   Mean   : 9.362  
##                                         3rd Qu.:2.000   3rd Qu.:12.000  
##                                         Max.   :2.000   Max.   :99.000  
##    ENTIDAD_UM         SEXO        ENTIDAD_NAC    ENTIDAD_RES   
##  Min.   : 1.00   Min.   :1.000   Min.   : 1.0   Min.   : 1.00  
##  1st Qu.: 9.00   1st Qu.:1.000   1st Qu.: 9.0   1st Qu.: 9.00  
##  Median :14.00   Median :1.000   Median :15.0   Median :15.00  
##  Mean   :15.49   Mean   :1.491   Mean   :16.3   Mean   :15.73  
##  3rd Qu.:22.00   3rd Qu.:2.000   3rd Qu.:23.0   3rd Qu.:22.00  
##  Max.   :32.00   Max.   :2.000   Max.   :99.0   Max.   :32.00  
##  MUNICIPIO_RES    TIPO_PACIENTE   FECHA_INGRESO      FECHA_SINTOMAS    
##  Min.   :  1.00   Min.   :1.000   Length:1604845     Length:1604845    
##  1st Qu.:  8.00   1st Qu.:1.000   Class :character   Class :character  
##  Median : 20.00   Median :1.000   Mode  :character   Mode  :character  
##  Mean   : 36.97   Mean   :1.171                                        
##  3rd Qu.: 46.00   3rd Qu.:1.000                                        
##  Max.   :999.00   Max.   :2.000                                        
##   FECHA_DEF            INTUBADO        NEUMONIA           EDAD       
##  Length:1604845     Min.   : 1.00   Min.   : 1.000   Min.   :  0.00  
##  Class :character   1st Qu.:97.00   1st Qu.: 2.000   1st Qu.: 30.00  
##  Mode  :character   Median :97.00   Median : 2.000   Median : 41.00  
##                     Mean   :80.75   Mean   : 1.877   Mean   : 42.08  
##                     3rd Qu.:97.00   3rd Qu.: 2.000   3rd Qu.: 53.00  
##                     Max.   :99.00   Max.   :99.000   Max.   :120.00  
##   NACIONALIDAD      EMBARAZO     HABLA_LENGUA_INDIG    DIABETES     
##  Min.   :1.000   Min.   : 1.00   Min.   : 1.000     Min.   : 1.000  
##  1st Qu.:1.000   1st Qu.: 2.00   1st Qu.: 2.000     1st Qu.: 2.000  
##  Median :1.000   Median : 2.00   Median : 2.000     Median : 2.000  
##  Mean   :1.005   Mean   :48.93   Mean   : 5.461     Mean   : 2.168  
##  3rd Qu.:1.000   3rd Qu.:97.00   3rd Qu.: 2.000     3rd Qu.: 2.000  
##  Max.   :2.000   Max.   :98.00   Max.   :99.000     Max.   :98.000  
##       EPOC             ASMA           INMUSUPR       HIPERTENSION   
##  Min.   : 1.000   Min.   : 1.000   Min.   : 1.000   Min.   : 1.000  
##  1st Qu.: 2.000   1st Qu.: 2.000   1st Qu.: 2.000   1st Qu.: 2.000  
##  Median : 2.000   Median : 2.000   Median : 2.000   Median : 2.000  
##  Mean   : 2.244   Mean   : 2.228   Mean   : 2.262   Mean   : 2.109  
##  3rd Qu.: 2.000   3rd Qu.: 2.000   3rd Qu.: 2.000   3rd Qu.: 2.000  
##  Max.   :98.000   Max.   :98.000   Max.   :98.000   Max.   :98.000  
##     OTRA_COM      CARDIOVASCULAR      OBESIDAD      RENAL_CRONICA   
##  Min.   : 1.000   Min.   : 1.000   Min.   : 1.000   Min.   : 1.000  
##  1st Qu.: 2.000   1st Qu.: 2.000   1st Qu.: 2.000   1st Qu.: 2.000  
##  Median : 2.000   Median : 2.000   Median : 2.000   Median : 2.000  
##  Mean   : 2.386   Mean   : 2.242   Mean   : 2.102   Mean   : 2.239  
##  3rd Qu.: 2.000   3rd Qu.: 2.000   3rd Qu.: 2.000   3rd Qu.: 2.000  
##  Max.   :98.000   Max.   :98.000   Max.   :98.000   Max.   :98.000  
##    TABAQUISMO       OTRO_CASO       RESULTADO       MIGRANTE    
##  Min.   : 1.000   Min.   : 1.00   Min.   :1.00   Min.   : 1.00  
##  1st Qu.: 2.000   1st Qu.: 1.00   1st Qu.:1.00   1st Qu.:99.00  
##  Median : 2.000   Median : 2.00   Median :2.00   Median :99.00  
##  Mean   : 2.192   Mean   :14.41   Mean   :1.61   Mean   :98.63  
##  3rd Qu.: 2.000   3rd Qu.: 2.00   3rd Qu.:2.00   3rd Qu.:99.00  
##  Max.   :98.000   Max.   :99.00   Max.   :3.00   Max.   :99.00  
##  PAIS_NACIONALIDAD  PAIS_ORIGEN             UCI       
##  Length:1604845     Length:1604845     Min.   : 1.00  
##  Class :character   Class :character   1st Qu.:97.00  
##  Mode  :character   Mode  :character   Median :97.00  
##                                        Mean   :80.76  
##                                        3rd Qu.:97.00  
##                                        Max.   :99.00

##Limpiar Datos

datos.covid$ORIGEN <- factor(datos.covid$ORIGEN)
datos.covid$SECTOR <- factor(datos.covid$SECTOR)
datos.covid$ENTIDAD_UM <- factor(datos.covid$ENTIDAD_UM)
datos.covid$SEXO <- factor(datos.covid$SEXO)
datos.covid$ENTIDAD_NAC <- factor(datos.covid$ENTIDAD_NAC)
datos.covid$ENTIDAD_RES <- factor(datos.covid$ENTIDAD_RES)
datos.covid$MUNICIPIO_RES <- factor(datos.covid$MUNICIPIO_RES)
datos.covid$TIPO_PACIENTE <- factor(datos.covid$TIPO_PACIENTE)
datos.covid$NACIONALIDAD <- factor(datos.covid$NACIONALIDAD)
datos.covid$HABLA_LENGUA_INDIG <- factor(datos.covid$HABLA_LENGUA_INDIG)
datos.covid$MIGRANTE <- factor(datos.covid$MIGRANTE)
datos.covid$PAIS_ORIGEN <- factor(datos.covid$PAIS_ORIGEN)

datos.covid$FECHA_ACTUALIZACION <- ymd(datos.covid$FECHA_ACTUALIZACION)
datos.covid$FECHA_INGRESO <- ymd(datos.covid$FECHA_INGRESO)
datos.covid$FECHA_SINTOMAS <- ymd(datos.covid$FECHA_SINTOMAS)
datos.covid$FECHA_DEF <- ymd(datos.covid$FECHA_DEF)
## Warning: 1509824 failed to parse.
datos.covid$INTUBADO <- factor(datos.covid$INTUBADO)
datos.covid$NEUMONIA <- factor(datos.covid$NEUMONIA)
datos.covid$EMBARAZO <- factor(datos.covid$EMBARAZO)
datos.covid$DIABETES <- factor(datos.covid$DIABETES)
datos.covid$EPOC <- factor(datos.covid$EPOC)
datos.covid$ASMA <- factor(datos.covid$ASMA)
datos.covid$INMUSUPR <- factor(datos.covid$INMUSUPR)
datos.covid$HIPERTENSION <- factor(datos.covid$HIPERTENSION)
datos.covid$OTRA_COM <- factor(datos.covid$OTRA_COM)
datos.covid$CARDIOVASCULAR <- factor(datos.covid$CARDIOVASCULAR)
datos.covid$OBESIDAD <- factor(datos.covid$OBESIDAD)
datos.covid$RENAL_CRONICA <- factor(datos.covid$RENAL_CRONICA)
datos.covid$TABAQUISMO <- factor(datos.covid$TABAQUISMO)
datos.covid$OTRO_CASO <- factor(datos.covid$OTRO_CASO)

datos.covid$RESULTADO <- factor(datos.covid$RESULTADO)
datos.covid$UCI <- factor(datos.covid$UCI)

Lectura de datos despues de la limpieza

summary(datos.covid)
##  FECHA_ACTUALIZACION  ID_REGISTRO        ORIGEN          SECTOR       
##  Min.   :2020-09-22   Length:1604845     1: 528546   12     :1004415  
##  1st Qu.:2020-09-22   Class :character   2:1076299   4      : 408641  
##  Median :2020-09-22   Mode  :character               6      :  60910  
##  Mean   :2020-09-22                                  9      :  58673  
##  3rd Qu.:2020-09-22                                  3      :  28304  
##  Max.   :2020-09-22                                  8      :  13548  
##                                                      (Other):  30354  
##    ENTIDAD_UM     SEXO        ENTIDAD_NAC      ENTIDAD_RES    
##  9      :394346   1:817659   9      :352304   9      :335180  
##  15     :139088   2:787186   15     :177609   15     :194475  
##  11     : 93266              11     : 89067   11     : 93196  
##  19     : 84540              30     : 69638   19     : 83857  
##  21     : 68599              19     : 69149   21     : 66233  
##  28     : 64629              21     : 65909   28     : 64560  
##  (Other):760377              (Other):781169   (Other):767344  
##  MUNICIPIO_RES     TIPO_PACIENTE FECHA_INGRESO        FECHA_SINTOMAS      
##  7      :  70490   1:1330486     Min.   :2020-01-01   Min.   :2020-01-01  
##  5      :  70027   2: 274359     1st Qu.:2020-06-12   1st Qu.:2020-06-08  
##  4      :  59972                 Median :2020-07-16   Median :2020-07-13  
##  39     :  57716                 Mean   :2020-07-12   Mean   :2020-07-09  
##  2      :  56254                 3rd Qu.:2020-08-18   3rd Qu.:2020-08-14  
##  17     :  48737                 Max.   :2020-09-22   Max.   :2020-09-22  
##  (Other):1241649                                                          
##    FECHA_DEF          INTUBADO     NEUMONIA          EDAD        NACIONALIDAD
##  Min.   :2020-01-13   1 :  40853   1 : 199665   Min.   :  0.00   1:1597507   
##  1st Qu.:2020-06-04   2 : 233306   2 :1405159   1st Qu.: 30.00   2:   7338   
##  Median :2020-07-06   97:1330486   99:     21   Median : 41.00               
##  Mean   :2020-07-04   99:    200                Mean   : 42.08               
##  3rd Qu.:2020-08-06                             3rd Qu.: 53.00               
##  Max.   :2020-09-22                             Max.   :120.00               
##  NA's   :1509824                                                             
##  EMBARAZO    HABLA_LENGUA_INDIG DIABETES     EPOC         ASMA        
##  1 : 13361   1 :  13303         1 : 194326   1 :  20923   1 :  45681  
##  2 :798655   2 :1534146         2 :1405679   2 :1579623   2 :1554870  
##  97:787186   99:  57396         98:   4840   98:   4299   98:   4294  
##  98:  5643                                                            
##                                                                       
##                                                                       
##                                                                       
##  INMUSUPR     HIPERTENSION OTRA_COM     CARDIOVASCULAR OBESIDAD    
##  1 :  19774   1 : 256407   1 :  38728   1 :  30742     1 : 246464  
##  2 :1580478   2 :1343941   2 :1559264   2 :1569731     2 :1354105  
##  98:   4593   98:   4497   98:   6853   98:   4372     98:   4276  
##                                                                    
##                                                                    
##                                                                    
##                                                                    
##  RENAL_CRONICA TABAQUISMO   OTRO_CASO   RESULTADO  MIGRANTE    
##  1 :  28002    1 : 131430   1 :777378   1:705263   1 :   1631  
##  2 :1572559    2 :1468844   2 :614052   2:820675   2 :   4403  
##  98:   4284    98:   4571   99:213415   3: 78907   99:1598811  
##                                                                
##                                                                
##                                                                
##                                                                
##  PAIS_NACIONALIDAD                     PAIS_ORIGEN      UCI         
##  Length:1604845     99                       :1603214   1 :  23367  
##  Class :character   Estados Unidos de América:    258   2 : 250782  
##  Mode  :character   República de Honduras    :    173   97:1330486  
##                     Venezuela                :    167   99:    210  
##                     Colombia                 :    161               
##                     Cuba                     :    145               
##                     (Other)                  :    727

ANALISIS DE DATOS.

a) Construir el histograma de casos confirmados por edad

Busqueda de casos confirmados en tabla “RESULTADO” en donde el numero “1” es como resultado ‘positivo’

positivos.covid <- filter(datos.covid, RESULTADO == '1')

Por medio de la libreria ggplot se hace el histograma segun positvos comparado con la edad

ggplot(positivos.covid, aes (EDAD)) + geom_histogram(position = "stack", bins = 30)

## Frecuencia de edades.

options(scipen = 999)

frecuencia.edades <- fdt(positivos.covid$EDAD)
frecuencia.edades <- data.frame(frecuencia.edades$table)
frecuencia.edades
##         Class.limits     f             rf         rf...     cf       cf...
## 1        [0,5.67524)  4768 0.006760598528  0.6760598528   4768   0.6760599
## 2  [5.67524,11.3505)  4994 0.007081046361  0.7081046361   9762   1.3841645
## 3  [11.3505,17.0257) 10431 0.014790227192  1.4790227192  20193   2.8631872
## 4   [17.0257,22.701) 25747 0.036506948472  3.6506948472  45940   6.5138821
## 5   [22.701,28.3762) 74112 0.105084202631 10.5084202631 120052  17.0223023
## 6  [28.3762,34.0514) 93561 0.132661149103 13.2661149103 213613  30.2884172
## 7  [34.0514,39.7267) 78377 0.111131592044 11.1131592044 291990  41.4015764
## 8  [39.7267,45.4019) 90620 0.128491073543 12.8491073543 382610  54.2506838
## 9  [45.4019,51.0771) 89141 0.126393983521 12.6393983521 471751  66.8900821
## 10 [51.0771,56.7524) 63233 0.089658751416  8.9658751416 534984  75.8559573
## 11 [56.7524,62.4276) 60800 0.086208974524  8.6208974524 595784  84.4768547
## 12 [62.4276,68.1029) 44465 0.063047402175  6.3047402175 640249  90.7815950
## 13 [68.1029,73.7781) 26010 0.036879859003  3.6879859003 666259  94.4695809
## 14 [73.7781,79.4533) 20791 0.029479782719  2.9479782719 687050  97.4175591
## 15 [79.4533,85.1286) 11895 0.016866048552  1.6866048552 698945  99.1041640
## 16 [85.1286,90.8038)  4458 0.006321046191  0.6321046191 703403  99.7362686
## 17  [90.8038,96.479)  1523 0.002159478095  0.2159478095 704926  99.9522164
## 18  [96.479,102.154)   297 0.000421119497  0.0421119497 705223  99.9943284
## 19  [102.154,107.83)    30 0.000042537323  0.0042537323 705253  99.9985821
## 20  [107.83,113.505)     4 0.000005671643  0.0005671643 705257  99.9991493
## 21  [113.505,119.18)     6 0.000008507465  0.0008507465 705263 100.0000000

Grafico de barra de Frecuencia de edades.

ggplot(frecuencia.edades, aes(1:21, rf, fill=Class.limits)) + geom_bar(stat = "identity")

## c) Determinar frecuencias por Genero.

frecuencia.genero <- fdt_cat(positivos.covid$SEXO)
frecuencia.genero <- data.frame(frecuencia.genero)
frecuencia.genero
##   Category      f        rf    rf...     cf     cf...
## 1        2 367081 0.5204881 52.04881 367081  52.04881
## 2        1 338182 0.4795119 47.95119 705263 100.00000

Grafica de Barras de resultados de frecuencias deL Genero en el cual el numero ‘1’ Representa a mujeres y el ‘2’ Representa a los hombres

 ggplot(frecuencia.genero, aes(Category, rf, fill=Category)) + geom_bar(stat = "identity")

## Derminar las frecuencias de cada estado de la Republica mexicana.

Clave de entidades: 1=Aguascalientes, 2=Baja California, 3=Baja California Sur, 4=Campeche, 5=Coahuila. 6=Colima, 7=-chiapas, 8=Chihuahua, 9=Cuidad de Mexico“DF”, 10=Durango, 11=Guanajuato, 12=Guerrero, 13=Hidlago, 14=Jalisco, 15=Mexico, 16=Michoacan, 17=Morelos, 18=Nayarit, 19=Nuevo Leon, 20=Oaxaca, 21=Puebla, 22=Queretaro, 23=Quintana Roo, 24=San Luis Potosi,25=Sinaloa, 26=Sonora, 27=Tabasco, 28=Tamaulipas, 29=Tlaxcala, 30=Veracruz, 31=Yucatan, 32=Zacatecas.

frecuencia.estados <- fdt_cat(positivos.covid$ENTIDAD_RES)
frecuencia.estados <- data.frame(frecuencia.estados)
frecuencia.estados
##    Category      f          rf      rf...     cf     cf...
## 1         9 118614 0.168184068 16.8184068 118614  16.81841
## 2        15  77823 0.110346069 11.0346069 196437  27.85301
## 3        11  39096 0.055434639  5.5434639 235533  33.39648
## 4        19  36823 0.052211728  5.2211728 272356  38.61765
## 5        30  32175 0.045621279  4.5621279 304531  43.17978
## 6        27  31057 0.044036055  4.4036055 335588  47.58338
## 7        21  30175 0.042785457  4.2785457 365763  51.86193
## 8        28  27968 0.039656128  3.9656128 393731  55.82754
## 9         5  25125 0.035625008  3.5625008 418856  59.39004
## 10       14  24953 0.035381127  3.5381127 443809  62.92816
## 11       26  24006 0.034038366  3.4038366 467815  66.33199
## 12       24  21985 0.031172768  3.1172768 489800  69.44927
## 13       16  19090 0.027067917  2.7067917 508890  72.15606
## 14        2  18619 0.026400081  2.6400081 527509  74.79607
## 15       25  18041 0.025580528  2.5580528 545550  77.35412
## 16       12  17659 0.025038886  2.5038886 563209  79.85801
## 17       31  17479 0.024783662  2.4783662 580688  82.33638
## 18       20  15802 0.022405826  2.2405826 596490  84.57696
## 19       13  12136 0.017207765  1.7207765 608626  86.29774
## 20       23  11410 0.016178362  1.6178362 620036  87.91557
## 21        8   9705 0.013760824  1.3760824 629741  89.29165
## 22        3   9657 0.013692764  1.3692764 639398  90.66093
## 23       22   8337 0.011821122  1.1821122 647735  91.84304
## 24       10   8257 0.011707689  1.1707689 655992  93.01381
## 25       29   7295 0.010343659  1.0343659 663287  94.04818
## 26       32   6837 0.009694256  0.9694256 670124  95.01760
## 27        1   6800 0.009641793  0.9641793 676924  95.98178
## 28        7   6467 0.009169629  0.9169629 683391  96.89875
## 29        4   5890 0.008351494  0.8351494 689281  97.73390
## 30       18   5747 0.008148733  0.8148733 695028  98.54877
## 31       17   5742 0.008141644  0.8141644 700770  99.36293
## 32        6   4493 0.006370673  0.6370673 705263 100.00000

Grafica de Frecuencia por Estado-

ggplot(frecuencia.estados, aes(Category, rf, fill="Category")) + geom_bar(stat = "identity")

Tabla de Frecuencia de casos Positivos y No Positivos de SARS-COVID-19.

 tabla.frecuencia.resultados <- datos.covid %>% group_by(RESULTADO) %>% summarise(frecuencia = n()) 
## `summarise()` ungrouping output (override with `.groups` argument)
tabla.frecuencia.resultados
## # A tibble: 3 x 2
##   RESULTADO frecuencia
##   <fct>          <int>
## 1 1             705263
## 2 2             820675
## 3 3              78907

Tabla de Frecuencias de positivos completa

 tabla.frecuencia.resultados.2 <- data.frame(fdt_cat(datos.covid$RESULTADO))
names(tabla.frecuencia.resultados.2) <- c("Resultado", "Freq", "Frec.Rel", "Frec.porc","Freq.Acum.Pror")
tabla.frecuencia.resultados.2
##   Resultado   Freq   Frec.Rel Frec.porc Freq.Acum.Pror        NA
## 1         2 820675 0.51137337 51.137337         820675  51.13734
## 2         1 705263 0.43945864 43.945864        1525938  95.08320
## 3         3  78907 0.04916799  4.916799        1604845 100.00000

Grafico de Resultados en donde el numero ‘1’ se interpreta como Positivo, ‘2’ se interpreta como No Positivo y el ‘3’ Resultado Pendiente.

ggplot(data = tabla.frecuencia.resultados.2, aes(Resultado, Frec.porc, fill=Resultado)) + geom_bar(stat = "identity")

## Tabla de frecuencia de pacientes en estado “Ambulatorio y Hospitalizados”

tabla.frecuencia.tipop <- data.frame(fdt_cat(datos.covid$TIPO_PACIENTE))
names(tabla.frecuencia.tipop) <- c("Tipo", "Freq", "Freq.rel", "Freq.porc","Freq.acum", "Freq.acum.porc")
tabla.frecuencia.tipop
##   Tipo    Freq  Freq.rel Freq.porc Freq.acum Freq.acum.porc
## 1    1 1330486 0.8290433  82.90433   1330486       82.90433
## 2    2  274359 0.1709567  17.09567   1604845      100.00000

Grafica de Frecuencia de los Tipos de Pacientes

ggplot(data = tabla.frecuencia.tipop, aes(x = Tipo, y = Freq.porc, fill=Tipo)) + geom_bar(stat = "identity") + geom_text(aes(label=Freq))

##Tabla de Frecuencia de Decesos por SARS-COVID-19

datos.covid <- datos.covid %>%
  mutate(DECESO = ifelse(is.na(FECHA_DEF), 'NO', 'SI'))

tabla.frecuencia.deceso <- data.frame(fdt_cat(datos.covid$DECESO))

names(tabla.frecuencia.deceso) <- c("Deceso", "Freq", "Freq.rel", "Freq.porc","Freq.acum", "Freq.acum.porc")
tabla.frecuencia.deceso
##   Deceso    Freq   Freq.rel Freq.porc Freq.acum Freq.acum.porc
## 1     NO 1509824 0.94079117 94.079117   1509824       94.07912
## 2     SI   95021 0.05920883  5.920883   1604845      100.00000

Grafica de los decesos por SARS COVID-19 en Mexico.

ggplot(data = tabla.frecuencia.deceso, aes(x = Deceso, 
                                                  y = Freq.porc, fill=Deceso)) +
    geom_bar(stat = "identity") +
         geom_text(aes(label=Freq))

Tabla de frecuencias de UCI

tabla.frecuencia.uci <- data.frame(fdt_cat(datos.covid$UCI))

names(tabla.frecuencia.uci) <-c("UCI", "Freq", "Freq.rel", "Freq.porc","Freq.acum", "Freq.acum.porc")
tabla.frecuencia.uci
##   UCI    Freq     Freq.rel   Freq.porc Freq.acum Freq.acum.porc
## 1  97 1330486 0.8290433032 82.90433032   1330486       82.90433
## 2   2  250782 0.1562655584 15.62655584   1581268       98.53089
## 3   1   23367 0.0145602846  1.45602846   1604635       99.98691
## 4  99     210 0.0001308538  0.01308538   1604845      100.00000

##Grafica de Personas que hay estado en la Unidad de Cuidados Intensivos.

ggplot(tabla.frecuencia.uci, aes(x = UCI, y = Freq.porc, fill=UCI)) + geom_bar(stat = "identity") + geom_text(aes(label=Freq))

Frecuencia de registros de casos por SARS COVID-19 por mes en Mexico.

meses <- month(positivos.covid$FECHA_INGRESO)
tabla.frecuencia.meses <- data_frame(fdt_cat(as.character(meses)))
## Warning: `data_frame()` is deprecated as of tibble 1.1.0.
## Please use `tibble()` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_warnings()` to see where this warning was generated.
names(tabla.frecuencia.meses) <- c("Mes", "Freq", "Freq.rel", "Freq.porc","Freq.acum", "Freq.acum.porc")
tabla.frecuencia.meses
## # A tibble: 9 x 6
##   Mes     Freq   Freq.rel Freq.porc Freq.acum Freq.acum.porc
##   <chr>  <int>      <dbl>     <dbl>     <int>          <dbl>
## 1 7     200085 0.284      28.4         200085           28.4
## 2 8     157119 0.223      22.3         357204           50.6
## 3 6     153224 0.217      21.7         510428           72.4
## 4 5      86719 0.123      12.3         597147           84.7
## 5 9      78941 0.112      11.2         676088           95.9
## 6 4      26626 0.0378      3.78        702714           99.6
## 7 3       2539 0.00360     0.360       705253          100. 
## 8 2          8 0.0000113   0.00113     705261          100. 
## 9 1          2 0.00000284  0.000284    705263          100

Grafica de casos positivos por mes.

ggplot(data = tabla.frecuencia.meses, aes(x = Mes, y = Freq)) + geom_bar(stat = "identity")

Interpretacion.

Las primeras interpetaciones de la base de datos del gobierno nacional de pacientes de sars covid-19.

Como principal dato a valorar en la tabla es los resultados de los pacientes. Suele ser importante tener valores de los casos positivos de covid. En el cual por medio de un grafico por edad podemos darnos cuenta de las siguientes cuestiones:

+ La mayoria de las personas que son Positvas en su mayoria estan entre el 35 a 55 años de edad en su mayoria las personas infectadas se encuentran en ese rango de edad. +Lo que se puede ver es que entre niños y adolescentes los contagios son menores. +Hay pocos contagios de personas mayores pero aun asi no se descartan.

Utilizando por medio de la libreria Ggplot se crearon rangos de edades para valorar la frecuencia de personas por medio de estadistica en donde se puede apreciar lo siguiente:

+Las edades con mayor rango de contagios esta entre los 22 y 28 años. +A continuacion le sigue las edades de 39 a 51 años de mayor a menor.

Se analizo por medio de Frencuencias el Genero en el cual se pudo interpretar lo siguiente:

+ Hay mas hombres con resultado positivo son “338337”. + Las mujeres con resultado positivo han sido “309170”.

En la siguiente grafica se aprecia los estados en donde se ha visto mas casos positivos en donde:

+El estado de mexico ocupa el 1er lugar en casos positivos y no positivos de covid, se puede comprender ya que es la capital del pais y existe un numero elevado de habitantes en la ciudad. +Se puede checar que en el estado de durango hay un rango bajo pero en comparacion a estados como “Morelos y Aguascalientes” sigue siendo elevado.

En la siguiente Tabla se hizo la interpretacion de los resultados totales que son los siguientes:

+En el pais hay 647507 Casos Positivos Registrados desde el mes de Marzo-2020 hasta el dia 22-Sep-2020. +Hay en total 734649 Casos No Positivos Registrados en el pais. +Ademas hay 83537 en “Caso Sospechoso” o que aun no reciben el resultado.

En el siguiente grafico se analizo el Tipo de Paciente Positivo en donde se expresa lo siguiente:

+Hay 1208690 personas registradas que no hay tenido que recibir un tratamiento especial o no lo han recibido despues de haber tenido su resultado. +Del cual 257003 personas han tenido complicaciones los cuales se han tenido que “Hospitalizar”.

En la siguiente tabla y grafico se identifica lo tragico de la enfermedad los decesos en donde arroja los siguientes datos:

El total de personas fallecidas en el pais por SARS COVID-19 es un total de 95021, esto da como porcentaje un 0.05% de las personas infectadas. Del cual hay 1509824 personas que estan en buen estado de salud.

En la siguiente frecuencia se analiza los pacientes que han estado en Unidad de Cuidados Intensivos donde se demuestra lo siguiente:

+En total hay 23367 Pacientes que si estuvieron en cuidados intensivos. +Hay 250782 que no hay estado en cuidados intensivos. +Hay 1330486 personas que no aplicaron para necesitar asistecia de cuidados intensivos.

En el siguiente grafico se analizan los casos positivos por mes en el pais a lo largo de la pandemia.

+El mes con mayor casos positivos en Mexico fue el mes de Julio. +El mes de junio y agosto tienen un rango similar de casos positivos. +Los primeros 3 meses son los que se encuentran menos casos positivos.

En lo que va de el mes de septiembre ha bajado los casos de casos positivos a comparacion de meses anteriores pero las estadisticas se mantienen en un indice alto de contagios en el pais.