library(readr) #para leer datos
library(DT) # tablas interactivas
library(prettydoc) #documentos con mejor formato
setwd("~/Estadistica")
A2 <- read_csv("A2.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## pandemia = col_double(),
## Internet = col_double()
## )
Tabla interactiva con datos
datatable(A2)#visualizar datos en tabla
##Gráficas Exploraremos la relación que existe entre las variables por medio de una matriz de diagrama de dispersión
pairs(A2)
#¿Existe una relación?
#Matriz de coeficientes de correlación
cor(A2)
## pandemia Internet
## pandemia 1.0000000 0.3968955
## Internet 0.3968955 1.0000000
#Con un índice de correlación *Pearson* de 0.39 determinamos no existe una correlación muy baja con respecto al uso del internet en pademia, esto quiere decir que el estar en pandemia no necesariamente se usa internet
regresion = lm (Internet ~ pandemia, data=A2)
summary(regresion)
##
## Call:
## lm(formula = Internet ~ pandemia, data = A2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -23.686 -4.543 -2.272 5.913 29.011
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 59.11932 2.03520 29.048 < 2e-16 ***
## pandemia 0.30436 0.09954 3.058 0.00358 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.87 on 50 degrees of freedom
## Multiple R-squared: 0.1575, Adjusted R-squared: 0.1407
## F-statistic: 9.349 on 1 and 50 DF, p-value: 0.003578
Ecuación de la recta de minimos cuadrados \(y\)
\[ y=59.11932+ 0.30436x \]
Con esta ecuación podemos modelar y predecir valores de futuros probables
plot(A2$pandemia, A2$Internet, xlab = "Busquedas de pandemia", ylab = "Busquedas en intenet")
abline(regresion)
nuevos.pandemia <- data.frame(pandemia=seq(0,50))#Esto genera un vector de secuancia de valores de 1 en 1, hasta el 50 desde el 0
predict(regresion, nuevos.pandemia)
## 1 2 3 4 5 6 7 8
## 59.11932 59.42368 59.72805 60.03241 60.33677 60.64113 60.94550 61.24986
## 9 10 11 12 13 14 15 16
## 61.55422 61.85859 62.16295 62.46731 62.77167 63.07604 63.38040 63.68476
## 17 18 19 20 21 22 23 24
## 63.98913 64.29349 64.59785 64.90221 65.20658 65.51094 65.81530 66.11967
## 25 26 27 28 29 30 31 32
## 66.42403 66.72839 67.03275 67.33712 67.64148 67.94584 68.25021 68.55457
## 33 34 35 36 37 38 39 40
## 68.85893 69.16330 69.46766 69.77202 70.07638 70.38075 70.68511 70.98947
## 41 42 43 44 45 46 47 48
## 71.29384 71.59820 71.90256 72.20692 72.51129 72.81565 73.12001 73.42438
## 49 50 51
## 73.72874 74.03310 74.33746
confint(regresion)
## 2.5 % 97.5 %
## (Intercept) 55.0315028 63.20714
## pandemia 0.1044258 0.50430
El hecho de que exista una correlacion perarson alta, No significa que exista una causalidad
confint(regresion, level=0.90)
## 5 % 95 %
## (Intercept) 55.708520 62.5301199
## pandemia 0.137539 0.4711867