library(GGally)
library(tidyverse)
library(corrplot)

view(diamonds)
data("diamonds")

m1 <- lm(data = diamonds, price~.)
summary(m1)
## 
## Call:
## lm(formula = price ~ ., data = diamonds)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -21376.0   -592.4   -183.5    376.4  10694.2 
## 
## Coefficients:
##              Estimate Std. Error  t value Pr(>|t|)    
## (Intercept)  5753.762    396.630   14.507  < 2e-16 ***
## carat       11256.978     48.628  231.494  < 2e-16 ***
## cut.L         584.457     22.478   26.001  < 2e-16 ***
## cut.Q        -301.908     17.994  -16.778  < 2e-16 ***
## cut.C         148.035     15.483    9.561  < 2e-16 ***
## cut^4         -20.794     12.377   -1.680  0.09294 .  
## color.L     -1952.160     17.342 -112.570  < 2e-16 ***
## color.Q      -672.054     15.777  -42.597  < 2e-16 ***
## color.C      -165.283     14.725  -11.225  < 2e-16 ***
## color^4        38.195     13.527    2.824  0.00475 ** 
## color^5       -95.793     12.776   -7.498 6.59e-14 ***
## color^6       -48.466     11.614   -4.173 3.01e-05 ***
## clarity.L    4097.431     30.259  135.414  < 2e-16 ***
## clarity.Q   -1925.004     28.227  -68.197  < 2e-16 ***
## clarity.C     982.205     24.152   40.668  < 2e-16 ***
## clarity^4    -364.918     19.285  -18.922  < 2e-16 ***
## clarity^5     233.563     15.752   14.828  < 2e-16 ***
## clarity^6       6.883     13.715    0.502  0.61575    
## clarity^7      90.640     12.103    7.489 7.06e-14 ***
## depth         -63.806      4.535  -14.071  < 2e-16 ***
## table         -26.474      2.912   -9.092  < 2e-16 ***
## x           -1008.261     32.898  -30.648  < 2e-16 ***
## y               9.609     19.333    0.497  0.61918    
## z             -50.119     33.486   -1.497  0.13448    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1130 on 53916 degrees of freedom
## Multiple R-squared:  0.9198, Adjusted R-squared:  0.9198 
## F-statistic: 2.688e+04 on 23 and 53916 DF,  p-value: < 2.2e-16
m2<-lm(data = diamonds, price~. -clarity^6-y-z)
summary(m2)
## 
## Call:
## lm(formula = price ~ . - clarity^6 - y - z, data = diamonds)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -23496.1   -588.9   -105.7    391.8  12452.3 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11586.776    462.998  25.026  < 2e-16 ***
## carat       11330.866     59.371 190.847  < 2e-16 ***
## cut.L        1019.277     27.415  37.179  < 2e-16 ***
## cut.Q        -480.919     21.934 -21.926  < 2e-16 ***
## cut.C         321.039     18.962  16.930  < 2e-16 ***
## cut^4          43.433     15.205   2.857  0.00428 ** 
## color.L     -1646.134     21.181 -77.716  < 2e-16 ***
## color.Q      -772.264     19.329 -39.953  < 2e-16 ***
## color.C      -104.514     18.125  -5.766 8.15e-09 ***
## color^4        98.782     16.648   5.934 2.98e-09 ***
## color^5      -147.328     15.736  -9.362  < 2e-16 ***
## color^6      -151.867     14.274 -10.639  < 2e-16 ***
## depth        -115.554      5.015 -23.040  < 2e-16 ***
## table         -40.388      3.584 -11.267  < 2e-16 ***
## x           -1349.739     24.916 -54.171  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1393 on 53925 degrees of freedom
## Multiple R-squared:  0.8782, Adjusted R-squared:  0.8782 
## F-statistic: 2.777e+04 on 14 and 53925 DF,  p-value: < 2.2e-16

#INTERPRETACIONES Y NOTAS

  1. Al eliminar las variables independientes del modelo que no tienen relevancia los errores del modelo aumentan de 1130 a 1393

  2. El R^2 ajustado del segundo modelo (sin variables independientes no relevantes) es menor al R^2 que tienen en cuenta todas las variables independientes.

  3. Cuando los quilates aumentan en 1 unidad, el precio de los diamantes aumenta en 11330.866 dolares y su relación es directa con una relevancia mayor a 0

  4. Cuando el corte L aumenta en 1 unidad, el precio de los diamantes aumenta en 1019.277 dolares y su relación es directa con una relevancia mayor a 0

  5. Cuando el corte Q aumenta en 1 unidad, el precio de los diamantes disminuye en 480.919 dolares y su relación es inversa con una relevancia mayor a 0

  6. Cuando el corte C aumenta en 1 unidad, el precio de los diamantes aumenta en 321.039 dolares y su relación es directa con una relevancia mayor a 0

  7. Cuando el corte^4 aumenta en 1 unidad, el precio de los diamantes aumenta en 43.433 dolares y su relación es directa con una relevancia mayor a 0.001

  8. Cuando el color L aumenta en 1 unidad, el precio de los diamantes disminuye en 1646.134 dolares y su relación es inversa con una relevancia mayor a 0

  9. Cuando el color Q aumenta en 1 unidad, el precio de los diamantes disminuye en 772.264 dolares y su relación es inversa con una relevancia mayor a 0

  10. Cuando el color C aumenta en 1 unidad, el precio de los diamantes disminuye en 104.514 dolares y su relación es inversa con una relevancia mayor a 0

  11. Cuando el color^4 aumenta en 1 unidad, el precio de los diamantes aumenta en 98.782 dolares y su relación es directa con una relevancia mayor a 0

  12. Cuando el color^5 aumenta en 1 unidad, el precio de los diamantes disminuye en 147.328 dolares y su relación es inversa con una relevancia mayor a 0

13.Cuando el color^6 aumenta en 1 unidad, el precio de los diamantes disminuye en 151.867 dolares y su relación es inversa con una relevancia mayor a 0

14.Cuando el depth aumenta en 1 unidad, el precio de los diamantes disminuye en 115.554 dolares y su relación es inversa con una relevancia mayor a 0

15.Cuando el table aumenta en 1 unidad, el precio de los diamantes disminuye en 40.388 dolares y su relación es inversa con una relevancia mayor a 0

16.Cuando el x aumenta en 1 unidad, el precio de los diamantes disminuye en 1349.739 dolares y su relación es inversa con una relevancia mayor a 0