U4A1

Carlos Esteban

6/7/2020


Analisis de correlacion

Importar paquetes y definir folder de trabajo

setwd("~/veranoPyE")
library(pacman)
library(readxl)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "ggplot2", "tidyr", "plotly", "DT")

Importar datos

setwd("~/veranoPyE")
AutosDeportivos<- read_excel("AutosDeportivos.xlsx")
names(AutosDeportivos)
## [1] "shelby cobra"     "Chevrolet Camaro"
  • Descripción de datos
datatable(AutosDeportivos)

## Correlación con matriz de diagrama de dispersión

pairs(AutosDeportivos)

*Cuantificar el grado de relación lineal

cor(AutosDeportivos)
##                  shelby cobra Chevrolet Camaro
## shelby cobra      1.000000000      0.008509608
## Chevrolet Camaro  0.008509608      1.000000000
  • Estimación y representación de la recta de mínimos cuadrados

*El comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summary obtenemos un resumen de los principales resultados:

regresion <- lm(data=AutosDeportivos)
summary(regresion)
## 
## Call:
## lm(data = AutosDeportivos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.4783 -1.4691 -0.4628  0.5256  7.5352 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)   
## (Intercept)        5.364607   1.952325   2.748  0.00832 **
## `Chevrolet Camaro` 0.001926   0.032010   0.060  0.95226   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.102 on 50 degrees of freedom
## Multiple R-squared:  7.241e-05,  Adjusted R-squared:  -0.01993 
## F-statistic: 0.003621 on 1 and 50 DF,  p-value: 0.9523
plot(AutosDeportivos$`shelby cobra`,AutosDeportivos$camaro, xlab="shelby", ylab="camaro")
## Warning: Unknown or uninitialised column: `camaro`.
abline(regresion)