Se tienen datos de 55 personas que buscan galletas o pastel en google
## galletas pastel
## galletas 1.0000000 0.7325986
## pastel 0.7325986 1.0000000
El comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summary obtenemos un resumen de los principales resultados:
##
## Call:
## lm(data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.8342 -2.7181 -0.5443 1.4630 8.9920
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.53012 2.04385 3.684 0.000564 ***
## pastel 0.24637 0.03237 7.611 6.68e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.521 on 50 degrees of freedom
## Multiple R-squared: 0.5367, Adjusted R-squared: 0.5274
## F-statistic: 57.92 on 1 and 50 DF, p-value: 6.684e-10
Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):
Segun los datos tomados en google, las personas buscan mas la palabra pastel a lo largo del año en vez de buscar galletas.