library(tidyverse)
library(GGally)
library(corrplot)
data("diamonds")
m4<- lm(data=diamonds, price~.)
summary(m4)
##
## Call:
## lm(formula = price ~ ., data = diamonds)
##
## Residuals:
## Min 1Q Median 3Q Max
## -21376.0 -592.4 -183.5 376.4 10694.2
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5753.762 396.630 14.507 < 2e-16 ***
## carat 11256.978 48.628 231.494 < 2e-16 ***
## cut.L 584.457 22.478 26.001 < 2e-16 ***
## cut.Q -301.908 17.994 -16.778 < 2e-16 ***
## cut.C 148.035 15.483 9.561 < 2e-16 ***
## cut^4 -20.794 12.377 -1.680 0.09294 .
## color.L -1952.160 17.342 -112.570 < 2e-16 ***
## color.Q -672.054 15.777 -42.597 < 2e-16 ***
## color.C -165.283 14.725 -11.225 < 2e-16 ***
## color^4 38.195 13.527 2.824 0.00475 **
## color^5 -95.793 12.776 -7.498 6.59e-14 ***
## color^6 -48.466 11.614 -4.173 3.01e-05 ***
## clarity.L 4097.431 30.259 135.414 < 2e-16 ***
## clarity.Q -1925.004 28.227 -68.197 < 2e-16 ***
## clarity.C 982.205 24.152 40.668 < 2e-16 ***
## clarity^4 -364.918 19.285 -18.922 < 2e-16 ***
## clarity^5 233.563 15.752 14.828 < 2e-16 ***
## clarity^6 6.883 13.715 0.502 0.61575
## clarity^7 90.640 12.103 7.489 7.06e-14 ***
## depth -63.806 4.535 -14.071 < 2e-16 ***
## table -26.474 2.912 -9.092 < 2e-16 ***
## x -1008.261 32.898 -30.648 < 2e-16 ***
## y 9.609 19.333 0.497 0.61918
## z -50.119 33.486 -1.497 0.13448
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1130 on 53916 degrees of freedom
## Multiple R-squared: 0.9198, Adjusted R-squared: 0.9198
## F-statistic: 2.688e+04 on 23 and 53916 DF, p-value: < 2.2e-16
m5<- lm(data=diamonds, price~.-y -z -clarity^6)
summary(m5)
##
## Call:
## lm(formula = price ~ . - y - z - clarity^6, data = diamonds)
##
## Residuals:
## Min 1Q Median 3Q Max
## -23496.1 -588.9 -105.7 391.8 12452.3
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11586.776 462.998 25.026 < 2e-16 ***
## carat 11330.866 59.371 190.847 < 2e-16 ***
## cut.L 1019.277 27.415 37.179 < 2e-16 ***
## cut.Q -480.919 21.934 -21.926 < 2e-16 ***
## cut.C 321.039 18.962 16.930 < 2e-16 ***
## cut^4 43.433 15.205 2.857 0.00428 **
## color.L -1646.134 21.181 -77.716 < 2e-16 ***
## color.Q -772.264 19.329 -39.953 < 2e-16 ***
## color.C -104.514 18.125 -5.766 8.15e-09 ***
## color^4 98.782 16.648 5.934 2.98e-09 ***
## color^5 -147.328 15.736 -9.362 < 2e-16 ***
## color^6 -151.867 14.274 -10.639 < 2e-16 ***
## depth -115.554 5.015 -23.040 < 2e-16 ***
## table -40.388 3.584 -11.267 < 2e-16 ***
## x -1349.739 24.916 -54.171 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1393 on 53925 degrees of freedom
## Multiple R-squared: 0.8782, Adjusted R-squared: 0.8782
## F-statistic: 2.777e+04 on 14 and 53925 DF, p-value: < 2.2e-16
La cantidad de errores del modelo aumenta al quitar las variables independientes que no son relevantes, aumenta de 1130 a 1393
El r^2 tambien disminuye del modelo completo al modelo sin las variables independientes que no tienen relevancia, sin embargo, el ultimo modelo sigue teniendo un r^2 grande que refleja que tiene una mayor proporción de variabilidad
Cuando los quilates aumentan en una unidad, el precio de los diamantes aumenta en 11330.866 dolares, los quilates y el precio de los quilates tienen una relación directa, con una relevancia mayor a 0
Cuando el corte L aumentan en una unidad, el precio de los diamantes aumenta en 1019.277 dolares, el corte L y el precio de los quilates tienen una relación directa, con una relevancia mayor a 0
Cuando el corte Q aumentan en una unidad, el precio de los diamantes disminuye en 480.919 dolares, el corte Q y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando el corte C aumentan en una unidad, el precio de los diamantes aumenta en 321.039 dolares, el corte C y el precio de los quilates tienen una relación directa, con una relevancia mayor a 0
Cuando el color L aumentan en una unidad, el precio de los diamantes disminuye en 1646.134 dolares, el color L y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando el color Q aumentan en una unidad, el precio de los diamantes disminuye en 772.264 dolares, el color Q y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando el color C aumentan en una unidad, el precio de los diamantes disminuye en 104.514 dolares, el color C y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando el color^4 aumentan en una unidad, el precio de los diamantes aumenta en 98.782 dolares, el color^4 y el precio de los quilates tienen una relación directa, con una relevancia mayor a 0
Cuando el color^5 aumentan en una unidad, el precio de los diamantes disminuye en 147.328 dolares, el color^5 y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando el color^6 aumentan en una unidad, el precio de los diamantes disminuye en 151.867 dolares, el color^6 y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando la profundidad aumentan en una unidad, el precio de los diamantes disminuye en 115.554 dolares, la profundidad y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando la tabla aumentan en una unidad, el precio de los diamantes disminuye en 40.388 dolares, la tabla y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando la x aumentan en una unidad, el precio de los diamantes disminuye en 1349.739 dolares, la x y el precio de los quilates tienen una relación inversa, con una relevancia mayor a 0
Cuando el corte^4 aumentan en una unidad, el precio de los diamantes aumenta en 43.433 dolares, el corte^4 y el precio de los quilates tienen una relación directa, con una relevancia mayor a 0,001