Análisis de correlacion

Importar paquetes y definir folder de trabajo

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "ggplot2", "tidyr", "plotly", "DT", "readxl", "graphics")
setwd("~/PYE VERANO")

Importar datos

tl <- read_excel("tvsll.xlsx")
names(tl)
## [1] "lluvia"   "temp max"

Descripción de datos

Se tienen datos de la lluvia total mensual y la temperatura máxima mensual del año 2015 en la Ciudad de Hermosillo, Sonora

datatable(tl)

Correlación con matriz de diagrama de dispersión

pairs(tl)

Cuantificar el grado de relación lineal (coef. de correlación)

cor(tl)
##             lluvia  temp max
## lluvia   1.0000000 0.7588376
## temp max 0.7588376 1.0000000

Estimación y representación de la recta de mínimos cuadrados

El comando básico es lm (linear models). El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresora o independiente (x). El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables. El resultado lo guardamos en un objeto llamado regresion. Este objeto es una lista que contiene toda la información relevante sobre el análisis. Mediante el comando summary obtenemos un resumen de los principales resultados:

regresion <- lm(lluvia~`temp max`, data=tl)
summary(regresion)
## 
## Call:
## lm(formula = lluvia ~ `temp max`, data = tl)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -55.004 -18.192  -0.727  23.492  56.497 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept) -210.711     71.753  -2.937  0.01487 * 
## `temp max`     7.985      2.167   3.685  0.00421 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 37.38 on 10 degrees of freedom
## Multiple R-squared:  0.5758, Adjusted R-squared:  0.5334 
## F-statistic: 13.58 on 1 and 10 DF,  p-value: 0.004215

Los siguientes comandos representan la nube de puntos (comando plot) y añaden la representación gráfica de la recta de mínimos cuadrados (comando abline aplicado al objeto generado por lm):

plot.new()
plot(tl$`temp max`, tl$lluvia, xlab="Temperatura Mensual", ylab="Lluvia Total Mensual" )+
  abline(regresion)

## integer(0)

Cálculo de predicciones

Supongamos que queremos utilizar la recta de mínimos cuadrados para predecir la cantidad de grasas para temperaturas de 40,45..

nuevas.lluvias <- data.frame(temp.max=seq(40,45))
#predict(regresion,nuevas.lluvias)