Correlación de las vacunas contra el covid-19 y el exceso de mortalidad.

En este documento vamos a hacer una prueba de correlación del exceso de mortalidad de varios países con la vacunación contra la covid-19 ( dosis x 100 habitantes). Las fuentes de los datos son:

Ourworldindata
OECD

Primero importamos un archivo .csv donde hemos colocado datos de vacunación contra la covid-19 y exceso de mortalidad de 30 países a fecha 15 de mayo de 2022.

data<-read.csv("C:/Users/Administrator/vacunacion vs muertes.csv", header=TRUE, sep=";")

Luego, echamos un vistazo a los datos con el comando str y con una representación gráfica que incluye una línea de regresión lineal.

par(mfrow=c(1,1))
str(data)
## 'data.frame':    30 obs. of  3 variables:
##  $ ï..Country       : Factor w/ 30 levels "Australia","Austria",..: 1 2 3 4 5 6 7 8 9 10 ...
##  $ exceso_mortalidad: num  23 12 4.5 20 29.7 ...
##  $ dosis_x_100h     : num  223 213 221 231 316 ...
plot(data$exceso_mortalidad~data$dosis_x_100h, xlab="dosis x 100 h", ylab="exceso de mortalidad")
abline(lm(data$exceso_mortalidad~data$dosis_x_100h),col="red")

En el gráfico se observa que no hay una fuerte correlación entre las variables, aunque la línea de regresión es ascendente. A continuación obtenemos el coeficiente de correlación.

cor(x=data$exceso_mortalidad, y=data$dosis_x_100h)
## [1] 0.3674486

El comando “cor” muestra por defecto el coeficiente de correlación de Pearson.

el coeficiente en valor absoluto indica correlación inexistente si se encuentra entre 0 y 0,10, correlación débil Entre 0,10 y 0,29, correlación moderada entre 0,30 y 0,50 y correlación fuerte si el valor es mayor de 0,50.

En este caso el coeficiente de Pearson nos indica correlación moderada.

Para ver si realmente existe una correlación, realizamos un test. Si no indicamos otra cosa, el test se hace con un nivel de confianza de 0.95, que indica que el 95% de las veces una muestra con un valor determinado indicará o no la existencia de correlación. Un nivel de confianza de 0.95 significa que con un valor p menor de 0,05 se rechaza la hipótesis nula ( es decir, se acepta la hipótesis alternativa).

cor.test(x=data$exceso_mortalidad, y=data$dosis_x_100h)
## 
##  Pearson's product-moment correlation
## 
## data:  data$exceso_mortalidad and data$dosis_x_100h
## t = 2.0906, df = 28, p-value = 0.04576
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.008274792 0.642644296
## sample estimates:
##       cor 
## 0.3674486

En este caso, el test indica que sí existe correlación. Al ser positiva (el coeficiente de correlación obtenido antes) significa que generalmente a más vacunación contra covid-19, encontraremos más exceso de mortalidad. No obstante esto, conviene recordar que correlación no implica causalidad.

Cómo para que el coeficiente de correlación de Pearson sea fiable los datos han de presentar una distribución normal, realizamos un test de normalidad.

shapiro.test(data$exceso_mortalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$exceso_mortalidad
## W = 0.98651, p-value = 0.96

Al realizar el test, que utiliza un nivel de confianza de 0,95 (es el valor por defecto) , vemos que el valor p es mayor a 0,05 por lo que se acepta la hipótesis nula, es decir, los datos de exceso de mortalidad presentan una distribución normal.

Repetimos el test con los datos de vacunación.

shapiro.test(data$dosis_x_100h)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$dosis_x_100h
## W = 0.91962, p-value = 0.02622

En este caso observamos que los datos no presentan una distribución normal, por lo que el coeficiente de correlación de Pearson no es fiable, motivo por el que aplicaremos el coeficiente de correlación de Spearman, que se utiliza cuando no existe normalidad en los datos o cuando existen variables categóricas, ya que mide el grado de correspondencia que existe entre los rangos que se asignan a los valores de las variables analizadas.

cor.test(x=data$exceso_mortalidad, y=data$dosis_x_100h, method="spearman")
## Warning in cor.test.default(x = data$exceso_mortalidad, y = data$dosis_x_100h, :
## Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  data$exceso_mortalidad and data$dosis_x_100h
## S = 2660.6, p-value = 0.02517
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.4080997

Como el valor p es menor de 0,05, rechazamos la hipótesis nula de que no existe correlación y aceptamos la alternativa: existe correlación, en este caso débil, ya que esto es lo que indica un rho de Spearman menor de 0,5.

Como conclusión a este pequeño estudio afirmamos que existe una correlación débil positiva entre el exceso de mortalidad y las dosis de vacunas contra el covid en una población.