Correlacion

Larissa

6/7/2020


Análisis de correlacion

Importar paquetes y definir folder de trabajo

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "ggplot2", "tidyr", "plotly", "DT")
setwd("~/proba")

Importar datos

setwd ("~/proba")
library(readxl)
datos <- read_excel("comp.xlsx")

Descripción de datos

Se tienen datos de 55 personas que buscan galletas o pastel en google

datatable(datos)

Corrtelación con matriz de diagrama de dispersión

pairs(datos)

Cuantificar el grado de relación lineal (coef. de correlación)

cor(datos)
##           galletas    pastel
## galletas 1.0000000 0.7325986
## pastel   0.7325986 1.0000000

Estimación y representación de la recta de mínimos cuadrados

El comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summary obtenemos un resumen de los principales resultados:

regresion <- lm(data=datos)
summary(regresion)
## 
## Call:
## lm(data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.8342 -2.7181 -0.5443  1.4630  8.9920 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.53012    2.04385   3.684 0.000564 ***
## pastel       0.24637    0.03237   7.611 6.68e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.521 on 50 degrees of freedom
## Multiple R-squared:  0.5367, Adjusted R-squared:  0.5274 
## F-statistic: 57.92 on 1 and 50 DF,  p-value: 6.684e-10

Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):

plot(datos$galletas, datos$pastel, xlab="Galletas", ylab="Pastel" )
abline(regresion)

Segun los datos tomados en google, las personas buscan mas la palabra pastel a lo largo del año en vez de buscar galletas.

U4A1

  • Encontrar un set de datos (que puede o no ser su proyecto) de 2 variables y
  1. Replique los análisis de este ejemplo con su explicación
xfun::embed_file("correlacion.rmd")
Download correlacion.rmd