library(readr)
video_juegos <- read_csv("video juegos.csv",
col_types = cols(videojuegos = col_number(),
consolas = col_number()))
View(video_juegos)
col_types = cols(videojuegos = col_number(),
consolas = col_number())
View(video_juegos)
setwd("~/PYE1213")
names(video_juegos)
## [1] "videojuegos" "consolas"
head(video_juegos)
## # A tibble: 6 x 2
## videojuegos consolas
## <dbl> <dbl>
## 1 64 17
## 2 60 15
## 3 61 15
## 4 51 13
## 5 48 10
## 6 39 11
boxplot(video_juegos$consolas , video_juegos$video_juegos, col="blue" )
## Warning: Unknown or uninitialised column: `video_juegos`.
pairs(video_juegos)
## Aqui podemos ver como tiene una buena relacion entre la busqueda de videojuegos y consolas
A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de coeficientes de correlacion
cor(video_juegos)
## videojuegos consolas
## videojuegos 1.0000000 0.9217905
## consolas 0.9217905 1.0000000
# aqui podemos ver que tienen una relacion del 92% videojuegos y consolas
Aqui podemos ver que tienen una relacion del 92% videojuegos y consolas Esto explicado con un coeficiente de correlacion de: 0.9217905
regresion <- lm(consolas ~ videojuegos, data=video_juegos)
summary(regresion)
##
## Call:
## lm(formula = consolas ~ videojuegos, data = video_juegos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.3010 -0.9228 -0.1228 0.7573 4.3826
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.748139 0.243695 19.48 <2e-16 ***
## videojuegos 0.178184 0.005817 30.63 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.415 on 166 degrees of freedom
## Multiple R-squared: 0.8497, Adjusted R-squared: 0.8488
## F-statistic: 938.4 on 1 and 166 DF, p-value: < 2.2e-16
*Con base alo estimado en el analisis de regresion lineal, obtenemos la ecuacion de la recta de minimos cuadrados
\[y = 4.74 + 0.17 x \]
plot (video_juegos$videojuegos, video_juegos$consolas, xlab="Videojuegos",ylab="Consolas")
abline(regresion)
nuevas.videojuegos <- data.frame(videojuegos=seq(20,80))
predict(regresion,nuevas.videojuegos)
## 1 2 3 4 5 6 7 8
## 8.311821 8.490006 8.668190 8.846374 9.024558 9.202742 9.380926 9.559110
## 9 10 11 12 13 14 15 16
## 9.737294 9.915478 10.093663 10.271847 10.450031 10.628215 10.806399 10.984583
## 17 18 19 20 21 22 23 24
## 11.162767 11.340951 11.519135 11.697320 11.875504 12.053688 12.231872 12.410056
## 25 26 27 28 29 30 31 32
## 12.588240 12.766424 12.944608 13.122792 13.300977 13.479161 13.657345 13.835529
## 33 34 35 36 37 38 39 40
## 14.013713 14.191897 14.370081 14.548265 14.726449 14.904634 15.082818 15.261002
## 41 42 43 44 45 46 47 48
## 15.439186 15.617370 15.795554 15.973738 16.151922 16.330106 16.508291 16.686475
## 49 50 51 52 53 54 55 56
## 16.864659 17.042843 17.221027 17.399211 17.577395 17.755579 17.933763 18.111948
## 57 58 59 60 61
## 18.290132 18.468316 18.646500 18.824684 19.002868
*Suponemos ahora que los datos proceden de un modelo de regresión simple, de la forma:
\[y_i = \beta_0 + \beta_1 x_i + \epsilon_i, \ \ \ \ i=1,\ldots,n, \] Donde:
Los errores aleatorios \(\epsilon_i\) son independientes con distribución normal 0 y varianza \(\sigma^2\)
Los errores típicos de los stimadores de los parámetros $ _0 y _1 $ se encuentran en la columna std error serían de manera correspondiente: 0.243695 y 0.005817
confint(regresion)
## 2.5 % 97.5 %
## (Intercept) 4.2669988 5.2292795
## videojuegos 0.1667002 0.1896681
confint(regresion, level=0.90)
## 5 % 95 %
## (Intercept) 4.345048 5.1512307
## videojuegos 0.168563 0.1878052