true

Estudio casos COVID-19 // Base de datos 05 de Noviembre 2024

El objetivo de este proyecto es analizar la base de datos, de la población que se presentó en hospitales por casos positivos de COVID-19. La base de datos es únicamente de datos de enero a octubre 2024.

Datos Abiertos de México

Distribución de la población por Edad & Sexo

Primero revisaremos como está compuesta la población, en donde en la siguiente gráfica se puede obsevar que la mayor población que se presentó en hospitales por COVID, es la población con 1 año de edad. Seguidos por los de edades de 2 y 24 años.

En la siguiente gráfica se puede observar que la mayoría de la población son mujeres, representando el 57% de la población. Donde 1 son mujeres y 2 hombres.

Estudio Defunciones de la Población

Nos damos cuenta que la mayor concentración de defunciones se presenta entre el rango de 75 y 87 años. De las defunciones de enero a octubre 2024.

Podemos observar que el mayor pico de defunciones se encuentra en la población de edad de 73 años.

Recordando que 1 es mujer y 2 hombre, podemos notar que el mayor número de defunciones corresponde al sexo masculino.

Variables correlacionadas al COVID-19

Ahora, de la población que falleció, revisaremos cuanta población padecía de las diferentes enfermedades:

Diabetes, asma, hipertensión, cardiovascular,obesidad y tabaquismo.

Modelo de Regresión

Por último, veamos que variable es la dependiente de los casos de COVID, considerando la edad que tenga alguno de los padecimientos

## 
## Call:
## lm(formula = EDAD ~ DIABETES + ASMA + CARDIOVASCULAR + HIPERTENSION + 
##     OBESIDAD + TABAQUISMO, data = COVID19DEF)
## 
## Coefficients:
##    (Intercept)        DIABETES            ASMA  CARDIOVASCULAR    HIPERTENSION  
##       60.62993        -1.61935         8.71497         0.07106       -11.69422  
##       OBESIDAD      TABAQUISMO  
##        4.40732         0.08033
## 
## Call:
## lm(formula = EDAD ~ DIABETES + ASMA + CARDIOVASCULAR + HIPERTENSION + 
##     OBESIDAD + TABAQUISMO, data = COVID19DEF)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -60.550  -9.864   4.136  14.756  44.165 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     60.62993    1.12180  54.047  < 2e-16 ***
## DIABETES        -1.61935    1.71298  -0.945  0.34477    
## ASMA             8.71497    2.52254   3.455  0.00058 ***
## CARDIOVASCULAR   0.07106    0.22080   0.322  0.74766    
## HIPERTENSION   -11.69422    1.65294  -7.075  3.3e-12 ***
## OBESIDAD         4.40732    2.28401   1.930  0.05401 .  
## TABAQUISMO       0.08033    0.15676   0.512  0.60850    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21.26 on 790 degrees of freedom
## Multiple R-squared:  0.08168,    Adjusted R-squared:  0.0747 
## F-statistic: 11.71 on 6 and 790 DF,  p-value: 1.341e-12

Considerando que la H0 es que ninguna variable es dependiente de la EDAD, entonces la H0 se rechaza, ya que el p-value es de 1.341e^12. También se visualiza que el intercept es de (60.62), por lo que las variables más dependiente de la edad son el Asma e Hipertensión.