TALLER INFORMATICA

REGRESIONES LINEALES

Librerias

library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## Warning: package 'dplyr' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(GGally)
## Warning: package 'GGally' was built under R version 4.1.3
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.3
## corrplot 0.92 loaded
data("diamonds")
glimpse(diamonds)
## Rows: 53,940
## Columns: 10
## $ carat   <dbl> 0.23, 0.21, 0.23, 0.29, 0.31, 0.24, 0.24, 0.26, 0.22, 0.23, 0.~
## $ cut     <ord> Ideal, Premium, Good, Premium, Good, Very Good, Very Good, Ver~
## $ color   <ord> E, E, E, I, J, J, I, H, E, H, J, J, F, J, E, E, I, J, J, J, I,~
## $ clarity <ord> SI2, SI1, VS1, VS2, SI2, VVS2, VVS1, SI1, VS2, VS1, SI1, VS1, ~
## $ depth   <dbl> 61.5, 59.8, 56.9, 62.4, 63.3, 62.8, 62.3, 61.9, 65.1, 59.4, 64~
## $ table   <dbl> 55, 61, 65, 58, 58, 57, 57, 55, 61, 61, 55, 56, 61, 54, 62, 58~
## $ price   <int> 326, 326, 327, 334, 335, 336, 336, 337, 337, 338, 339, 340, 34~
## $ x       <dbl> 3.95, 3.89, 4.05, 4.20, 4.34, 3.94, 3.95, 4.07, 3.87, 4.00, 4.~
## $ y       <dbl> 3.98, 3.84, 4.07, 4.23, 4.35, 3.96, 3.98, 4.11, 3.78, 4.05, 4.~
## $ z       <dbl> 2.43, 2.31, 2.31, 2.63, 2.75, 2.48, 2.47, 2.53, 2.49, 2.39, 2.~
diamonds %>% View

Model<-lm(data=diamonds,price~.
          -cut^4
          -clarity^6
          -z)
summary(Model)
## 
## Call:
## lm(formula = price ~ . - cut^4 - clarity^6 - z, data = diamonds)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -24390.7   -583.3    -96.9    387.2  12342.6 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 20330.218    395.596  51.391  < 2e-16 ***
## carat       11367.570     60.175 188.910  < 2e-16 ***
## color.L     -1636.277     21.461 -76.245  < 2e-16 ***
## color.Q      -769.291     19.582 -39.286  < 2e-16 ***
## color.C      -113.561     18.362  -6.185 6.27e-10 ***
## color^4        92.800     16.866   5.502 3.77e-08 ***
## color^5      -146.864     15.943  -9.212  < 2e-16 ***
## color^6      -161.449     14.462 -11.164  < 2e-16 ***
## depth        -193.472      4.578 -42.264  < 2e-16 ***
## table        -101.289      2.909 -34.813  < 2e-16 ***
## x           -1446.022     34.053 -42.463  < 2e-16 ***
## y              66.251     23.836   2.779  0.00545 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1411 on 53928 degrees of freedom
## Multiple R-squared:  0.8749, Adjusted R-squared:  0.8749 
## F-statistic: 3.429e+04 on 11 and 53928 DF,  p-value: < 2.2e-16
plot(Model)

## INTERPRETACIONES

Estimadores:

Interpretación de los Estimadores

  1. La variable “carat” aumenta en una 1 unidad, el precio de los diamantes aumenta en 11373.151 unidades monetarias, bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente carat es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable “color.L” aumenta en una 1 unidad, el precio de los diamantes disminuye en 1636.388 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente color.L es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable color.Q aumenta en una 1 unidad, el precio de los diamantes disminuye en 769.291 unidades monetarias, bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente color.Q es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable color.C aumenta en una 1 unidad, el precio de los diamantes disminuye en 113.561 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente color.C es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable color^4 aumenta en una 1 unidad, el precio de los diamantes aumenta en 92.800 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente color^4 es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable color^5 aumenta en una 1 unidad, el precio de los diamantes disminuye 146.864 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente color^5 es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable color^6 aumenta en una 1 unidad, el precio de los diamantes disminuye 161.449 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente color^6 es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable depth aumenta en una 1 unidad, el precio de los diamantes disminuye 193.472 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente depth es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

9.La variable table aumenta en una 1 unidad, el precio de los diamantes disminuye 101.289 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente table es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

10.La variable x aumenta en una 1 unidad, el precio de los diamantes disminuye 1446.022 unidades monetarias, bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente x es relevante para explicar el precio de los diamantes con un nivel de significancia del 1%.

Interpretación de los Estimadores

  1. La variable y aumenta en una 1 unidad, el precio de los diamantes auemnta 66.251 unidades monetarias,bajo el supuesto de que todo lo demás constante.

Interpretación de los p-valores

La variable dependiente y es relevante para explicar el precio de los diamantes con un nivel de significancia del 5%

RELEVANCIA R2

  1. La variable dependiente color.L es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  2. La variable dependiente color.Q es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  3. La variable dependiente color.C es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  4. La variable dependiente color^4 es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  5. La variable dependiente color^5 es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  6. La variable dependiente color^6 es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  7. La variable dependiente depth es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  8. La variable dependiente table es relevante para explicar el precio de los diamantes bajo un nivel de significancia del 1%.
  9. La variable dependiente x es relevante para explicar el precio de los diamantes con bajo nivel de significancia del 1%.
  10. La variable dependiente y es relevante para explicar el precio de los diamantes con bajo nivel de significancia del 5%.10.