explore?date=now%207-d&q=videojuegos,consolas

Muestreo

library(readr)
video_juegos <- read_csv("video juegos.csv", 
     col_types = cols(videojuegos = col_number(), 
         consolas = col_number()))
 View(video_juegos)
    col_types = cols(videojuegos = col_number(), 
   consolas = col_number())
View(video_juegos)
 setwd("~/PYE1213")

Cargar datos

names(video_juegos)

## [1] "videojuegos" "consolas"

Visualisar Datos

head(video_juegos)

## # A tibble: 6 x 2
##   videojuegos consolas
##         <dbl>    <dbl>
## 1          64       17
## 2          60       15
## 3          61       15
## 4          51       13
## 5          48       10
## 6          39       11

Grafica de caja y bigotes

boxplot(video_juegos$consolas , video_juegos$video_juegos, col="blue" )

## Warning: Unknown or uninitialised column: `video_juegos`.

Analisis de correlacion

Matriz de diagramas de dispersion

pairs(video_juegos)

## Aqui podemos ver como tiene una buena relacion entre la busqueda de videojuegos y consolas

A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de coeficientes de correlacion

cor(video_juegos)

##             videojuegos  consolas
## videojuegos   1.0000000 0.9217905
## consolas      0.9217905 1.0000000

# aqui podemos ver que tienen una relacion del 92% videojuegos y consolas

Aqui podemos ver que tienen una relacion del 92% videojuegos y consolas Esto explicado con un coeficiente de correlacion de: 0.9217905

Recta de minimos cuadrados

regresion <- lm(consolas ~ videojuegos, data=video_juegos)
summary(regresion)

## 
## Call:
## lm(formula = consolas ~ videojuegos, data = video_juegos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.3010 -0.9228 -0.1228  0.7573  4.3826 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4.748139   0.243695   19.48   <2e-16 ***
## videojuegos 0.178184   0.005817   30.63   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.415 on 166 degrees of freedom
## Multiple R-squared:  0.8497, Adjusted R-squared:  0.8488 
## F-statistic: 938.4 on 1 and 166 DF,  p-value: < 2.2e-16

*Con base alo estimado en el analisis de regresion lineal, obtenemos la ecuacion de la recta de minimos cuadrados

\[y = 4.74 + 0.17 x \]

Grafica de la recta de minimos cuadrados

plot (video_juegos$videojuegos, video_juegos$consolas, xlab="Videojuegos",ylab="Consolas")
abline(regresion)

Modelación (cálculo) de predicciones

nuevas.videojuegos <- data.frame(videojuegos=seq(20,80))
predict(regresion,nuevas.videojuegos)

##         1         2         3         4         5         6         7         8 
##  8.311821  8.490006  8.668190  8.846374  9.024558  9.202742  9.380926  9.559110 
##         9        10        11        12        13        14        15        16 
##  9.737294  9.915478 10.093663 10.271847 10.450031 10.628215 10.806399 10.984583 
##        17        18        19        20        21        22        23        24 
## 11.162767 11.340951 11.519135 11.697320 11.875504 12.053688 12.231872 12.410056 
##        25        26        27        28        29        30        31        32 
## 12.588240 12.766424 12.944608 13.122792 13.300977 13.479161 13.657345 13.835529 
##        33        34        35        36        37        38        39        40 
## 14.013713 14.191897 14.370081 14.548265 14.726449 14.904634 15.082818 15.261002 
##        41        42        43        44        45        46        47        48 
## 15.439186 15.617370 15.795554 15.973738 16.151922 16.330106 16.508291 16.686475 
##        49        50        51        52        53        54        55        56 
## 16.864659 17.042843 17.221027 17.399211 17.577395 17.755579 17.933763 18.111948 
##        57        58        59        60        61 
## 18.290132 18.468316 18.646500 18.824684 19.002868

Inferencia en el modelo de regresión simple

*Suponemos ahora que los datos proceden de un modelo de regresión simple, de la forma:

\[y_i = \beta_0 + \beta_1 x_i + \epsilon_i, \ \ \ \ i=1,\ldots,n, \] Donde:

Los errores aleatorios $\epsilon_i$ son independientes con distribución normal 0 y varianza $\sigma^2$
Los errores típicos de los stimadores de los parámetros $ _0 y _1 $ se encuentran en la columna std error serían de manera correspondiente: 0.243695 y 0.005817

Cálculo del nivel de confianza

Intervalo de confianza para el 95% de los datos

confint(regresion)

##                 2.5 %    97.5 %
## (Intercept) 4.2669988 5.2292795
## videojuegos 0.1667002 0.1896681

Intervalo de confianza para el 90% de los datos

confint(regresion, level=0.90)

##                  5 %      95 %
## (Intercept) 4.345048 5.1512307
## videojuegos 0.168563 0.1878052

En resumen de este analisis pudimos ver como ambas busquedas de internet de videojuegos y consolas tenian una cierta relacion porque practicamente iban a agarrados de la mano, cuando una persona busca un video juego tal vez busca tambien donde jugarlo o en que plataforma.

U1A9

Francisco

25/9/2020