U4A1

Manuel Rubio

6/7/2020


Análisis de correlacion

Importar paquetes y definir folder de trabajo

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "ggplot2", "tidyr", "plotly", "DT","readxl")
setwd("~/PyE")

Importar datos

CasosCovid <- read_excel("CasosCovid.xlsx")
names(CasosCovid)
## [1] "Confirmados" "Defunciones"

Descripción de datos

Se tienen datos de 112 dias de Covid-19 en México

datatable(CasosCovid)

Correlación con matriz de diagrama de dispersión

pairs(CasosCovid)

Cuantificar el grado de relación lineal (coef. de correlación)

cor(CasosCovid)
##             Confirmados Defunciones
## Confirmados   1.0000000   0.8790011
## Defunciones   0.8790011   1.0000000

Estimación y representación de la recta de mínimos cuadrados

Calculamos la regresión

regresion <- lm(Defunciones ~ Confirmados, data=CasosCovid)
summary(regresion)
## 
## Call:
## lm(formula = Defunciones ~ Confirmados, data = CasosCovid)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -164.21  -69.16  -18.41   39.38  254.39 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 73.428755  13.679230   5.368 4.47e-07 ***
## Confirmados  0.087570   0.004529  19.334  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 91.86 on 110 degrees of freedom
## Multiple R-squared:  0.7726, Adjusted R-squared:  0.7706 
## F-statistic: 373.8 on 1 and 110 DF,  p-value: < 2.2e-16

Los parámetros de la ecuación de la recta de mínimos cuadrados que relaciona la cantidad de Defunciones en función de confirmado s´Estimate´ de la tabla ´Coefficients´ de la salida anterior. Por lo tanto, en este ejemplo la ecuación de la recta de mínimos cuadrados es:

\[ y = 73.4287 + 0.0875 x \]

Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):

plot(CasosCovid$Confirmados, CasosCovid$Defunciones, xlab="Confirmados", ylab="Defunciones" )
abline(regresion)

El coeficiente de determinación (es decir, el coeficiente de correlación al cuadrado) mide la bondad del ajuste de la recta a los datos. A partir de la salida anterior, vemos que su valor en este caso es Multiple R-squared: 0.7726.

Cálculo de predicciones

Supongamos que queremos utilizar la recta de mínimos cuadrados para predecir la cantidad de definciones para 100-200 confirmados. Basta crear un fichero de datos que contenga las nuevas variables regresoras y usar el comando predict:

nuevas.defunciones <- data.frame(Confirmados= seq(100,200))
predict(regresion,nuevas.defunciones)
##        1        2        3        4        5        6        7        8 
## 82.18571 82.27328 82.36085 82.44842 82.53599 82.62356 82.71113 82.79870 
##        9       10       11       12       13       14       15       16 
## 82.88627 82.97384 83.06141 83.14898 83.23655 83.32412 83.41169 83.49926 
##       17       18       19       20       21       22       23       24 
## 83.58683 83.67440 83.76197 83.84953 83.93710 84.02467 84.11224 84.19981 
##       25       26       27       28       29       30       31       32 
## 84.28738 84.37495 84.46252 84.55009 84.63766 84.72523 84.81280 84.90037 
##       33       34       35       36       37       38       39       40 
## 84.98794 85.07551 85.16308 85.25065 85.33822 85.42579 85.51336 85.60093 
##       41       42       43       44       45       46       47       48 
## 85.68850 85.77607 85.86364 85.95120 86.03877 86.12634 86.21391 86.30148 
##       49       50       51       52       53       54       55       56 
## 86.38905 86.47662 86.56419 86.65176 86.73933 86.82690 86.91447 87.00204 
##       57       58       59       60       61       62       63       64 
## 87.08961 87.17718 87.26475 87.35232 87.43989 87.52746 87.61503 87.70260 
##       65       66       67       68       69       70       71       72 
## 87.79017 87.87774 87.96531 88.05287 88.14044 88.22801 88.31558 88.40315 
##       73       74       75       76       77       78       79       80 
## 88.49072 88.57829 88.66586 88.75343 88.84100 88.92857 89.01614 89.10371 
##       81       82       83       84       85       86       87       88 
## 89.19128 89.27885 89.36642 89.45399 89.54156 89.62913 89.71670 89.80427 
##       89       90       91       92       93       94       95       96 
## 89.89184 89.97941 90.06698 90.15454 90.24211 90.32968 90.41725 90.50482 
##       97       98       99      100      101 
## 90.59239 90.67996 90.76753 90.85510 90.94267