library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.1.3
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## Warning: package 'dplyr' was built under R version 4.1.3
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(GGally)
## Warning: package 'GGally' was built under R version 4.1.3
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.3
## corrplot 0.92 loaded
library(mlbench)
## Warning: package 'mlbench' was built under R version 4.1.3
data(BostonHousing)
glimpse(BostonHousing)
## Rows: 506
## Columns: 14
## $ crim <dbl> 0.00632, 0.02731, 0.02729, 0.03237, 0.06905, 0.02985, 0.08829,~
## $ zn <dbl> 18.0, 0.0, 0.0, 0.0, 0.0, 0.0, 12.5, 12.5, 12.5, 12.5, 12.5, 1~
## $ indus <dbl> 2.31, 7.07, 7.07, 2.18, 2.18, 2.18, 7.87, 7.87, 7.87, 7.87, 7.~
## $ chas <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,~
## $ nox <dbl> 0.538, 0.469, 0.469, 0.458, 0.458, 0.458, 0.524, 0.524, 0.524,~
## $ rm <dbl> 6.575, 6.421, 7.185, 6.998, 7.147, 6.430, 6.012, 6.172, 5.631,~
## $ age <dbl> 65.2, 78.9, 61.1, 45.8, 54.2, 58.7, 66.6, 96.1, 100.0, 85.9, 9~
## $ dis <dbl> 4.0900, 4.9671, 4.9671, 6.0622, 6.0622, 6.0622, 5.5605, 5.9505~
## $ rad <dbl> 1, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 4, 4, 4, 4, 4, 4, 4, 4,~
## $ tax <dbl> 296, 242, 242, 222, 222, 222, 311, 311, 311, 311, 311, 311, 31~
## $ ptratio <dbl> 15.3, 17.8, 17.8, 18.7, 18.7, 18.7, 15.2, 15.2, 15.2, 15.2, 15~
## $ b <dbl> 396.90, 396.90, 392.83, 394.63, 396.90, 394.12, 395.60, 396.90~
## $ lstat <dbl> 4.98, 9.14, 4.03, 2.94, 5.33, 5.21, 12.43, 19.15, 29.93, 17.10~
## $ medv <dbl> 24.0, 21.6, 34.7, 33.4, 36.2, 28.7, 22.9, 27.1, 16.5, 18.9, 15~
BostonHousing %>% View
M0<-lm(data=BostonHousing,medv~.)
summary(M0)
##
## Call:
## lm(formula = medv ~ ., data = BostonHousing)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.595 -2.730 -0.518 1.777 26.199
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.646e+01 5.103e+00 7.144 3.28e-12 ***
## crim -1.080e-01 3.286e-02 -3.287 0.001087 **
## zn 4.642e-02 1.373e-02 3.382 0.000778 ***
## indus 2.056e-02 6.150e-02 0.334 0.738288
## chas1 2.687e+00 8.616e-01 3.118 0.001925 **
## nox -1.777e+01 3.820e+00 -4.651 4.25e-06 ***
## rm 3.810e+00 4.179e-01 9.116 < 2e-16 ***
## age 6.922e-04 1.321e-02 0.052 0.958229
## dis -1.476e+00 1.995e-01 -7.398 6.01e-13 ***
## rad 3.060e-01 6.635e-02 4.613 5.07e-06 ***
## tax -1.233e-02 3.760e-03 -3.280 0.001112 **
## ptratio -9.527e-01 1.308e-01 -7.283 1.31e-12 ***
## b 9.312e-03 2.686e-03 3.467 0.000573 ***
## lstat -5.248e-01 5.072e-02 -10.347 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.745 on 492 degrees of freedom
## Multiple R-squared: 0.7406, Adjusted R-squared: 0.7338
## F-statistic: 108.1 on 13 and 492 DF, p-value: < 2.2e-16
plot(M0)
M1<-lm(data=BostonHousing,medv~.
-indus
-age)
summary(M1)
##
## Call:
## lm(formula = medv ~ . - indus - age, data = BostonHousing)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.5984 -2.7386 -0.5046 1.7273 26.2373
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 36.341145 5.067492 7.171 2.73e-12 ***
## crim -0.108413 0.032779 -3.307 0.001010 **
## zn 0.045845 0.013523 3.390 0.000754 ***
## chas1 2.718716 0.854240 3.183 0.001551 **
## nox -17.376023 3.535243 -4.915 1.21e-06 ***
## rm 3.801579 0.406316 9.356 < 2e-16 ***
## dis -1.492711 0.185731 -8.037 6.84e-15 ***
## rad 0.299608 0.063402 4.726 3.00e-06 ***
## tax -0.011778 0.003372 -3.493 0.000521 ***
## ptratio -0.946525 0.129066 -7.334 9.24e-13 ***
## b 0.009291 0.002674 3.475 0.000557 ***
## lstat -0.522553 0.047424 -11.019 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.736 on 494 degrees of freedom
## Multiple R-squared: 0.7406, Adjusted R-squared: 0.7348
## F-statistic: 128.2 on 11 and 494 DF, p-value: < 2.2e-16
plot(M1)
Estimadores Cuando la variable “nox” aumenta en 1 unidad, el valor mediano de las viviendas disminuye 17.376023 USD bajo el supuesto de que todo lo demás es constante.
P-Value: La variable dependiente “nox” con un p- valuea igual a 1.21e-06 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “nox” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.
Estimadores: Cuando la variable “rm” aumenta en 1 unidad, el valor mediano de las viviendas aumenta 3.801579 USD bajo el supuesto de que todo lo demás es constante.
P-Value: La variable dependiente “rm” con un p- valuea menor a 2e-16 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “rm” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.
Estimadores: Cuando la variable “dis” aumenta en 1 unidad, el valor mediano de las viviendas disminuye 1.492711 USD bajo el supuesto de que todo lo demás es constante.
P-Value La variable dependiente “dis” con un p- valuea igual a 6.84e-15 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “dis” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.
Estimadores: Cuando la variable “rad” aumenta en 1 unidad, el valor mediano de las viviendas aumenta 0.299608 USD bajo el supuesto de que todo lo demás es constante.
P-Value: La variable dependiente “rad” con un p- valuea igual a 3.00e-06 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “rad” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.
Estimadores: Cuando la variable “tax” aumenta en 1 unidad, el valor mediano de las viviendas disminuye 0.011778 USD bajo el supuesto de que todo lo demás es constante.
P-Value: La variable dependiente “tax” con un p- valuea igual a 0.000521 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “tax” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.
Estimadores: Cuando la variable “ptratio” aumenta en 1 unidad, el valor mediano de las viviendas disminuye 0.946525 USD bajo el supuesto de que todo lo demás es constante.
P-Value La variable dependiente “ptratio” con un p- valuea igual a 9.24e-13 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “ptratio” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.
Estimadores: Cuando la variable “b” aumenta en 1 unidad, el valor mediano de las viviendas aumenta 0.009291 USD bajo el supuesto de que todo lo demás es constante.
P-Value La variable dependiente “b” con un p- valuea iagual a 0.000557 es relevante para explicar el valor mediano de las viviendas con un nivel de significancia del 1%
Relevancia R2 La variable dependiente “b” es relevante para explicar el valor mediano de las viviendas bajo un nivel de significancia del 1%.