library(MASS)
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
library(MASS)
library(car)
## Cargando paquete requerido: carData
library(corrplot)
## corrplot 0.95 loaded
library(PerformanceAnalytics)
## Warning: package 'PerformanceAnalytics' was built under R version 4.4.3
## Cargando paquete requerido: xts
## Warning: package 'xts' was built under R version 4.4.3
## Cargando paquete requerido: zoo
## Warning: package 'zoo' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
## Adjuntando el paquete: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
## 
##     legend
help(Boston)
## starting httpd help server ...
##  done
Datos<- Boston
medv <- Datos$medv
rm <- Datos$rm
lstat <- Datos$lstat
crim <- Datos$crim
Datos <- data.frame(medv, rm, lstat, crim)

Análisis explotatorio

Vamos a tratar de encontrar para ver si existe una relación entre el precio mediano de una casa (medv) en función de el número de habitaciones (rm), porcentaje de clase baja (lstat) y el indice de criminalidad (crim).

NORMALIDAD

Veamos si los datos siguen una distribución normal para saber que método aplicar:

shapiro.test(Datos$medv)
## 
##  Shapiro-Wilk normality test
## 
## data:  Datos$medv
## W = 0.91718, p-value = 4.941e-16
shapiro.test(Datos$rm)
## 
##  Shapiro-Wilk normality test
## 
## data:  Datos$rm
## W = 0.96087, p-value = 2.412e-10
shapiro.test(Datos$lstat)
## 
##  Shapiro-Wilk normality test
## 
## data:  Datos$lstat
## W = 0.93691, p-value = 8.287e-14
shapiro.test(Datos$crim)
## 
##  Shapiro-Wilk normality test
## 
## data:  Datos$crim
## W = 0.44996, p-value < 2.2e-16

Como todos los p-valores son menores al nivel de significancia establecido de 0.05, rechazamos la hipótesis nula, es decir, los datos no siguen una distribución aproximadamente normal.

Descriptivo

Primero haremos un analisis descriptivo de los datos, para esto haremos un chart.correlation, gracias a la prueba de normalidad utilizaremos “Spearman”:

chart.Correlation(Datos, histogram = TRUE, method = "spearman")

mat_cor <- cor(Datos, method = "spearman") # Calcula matriz de correlación

mat_cor1<-cor(Datos, method = "spearman")

significancia1<- cor.mtest(Datos,
                           method = "spearman",
                           conf.level = .95)
corrplot(mat_cor1, 
         p.mat = significancia1$p, #llamado del p-valor para cada coeficiente r
         sig.level = 0.05) #definición del nivel de significancia

En cuanto a la distribución, todas parecen tener una asímetria clara hacia la derecha, lo que explica que no hayan pasado la prueba de normalidad. A continuación, se realiza un análisis exhaustivo de la relación de las variables explicativas en torno a la variable respuesta.

medv vs rm: De acuerdo al coeficiente de correlación obtenido (\(R = 0.63\)), remarcado con altos niveles de significancia, se puede afirmar que existe una correlación positiva moderada entre la variable número de habitaciones y el precio mediano de una casa. Esto implica que, en general, a medida que aumenta el número de habitaciones, también tienden a aumentar el precio mediano de una casa.

medv vs lstat: De acuerdo al coeficiente de correlación obtenido (\(R = -0.85\)), remarcado con altos niveles de significancia, se puede afirmar que existe una correlación negativa fuerte entre el porcentaje de clase baja y el precio mediano de una casa. Esto implica que, en general, a medida que aumenta el porcentaje de clase baja, tiende a disminuir el precio mediano de una casa.

medv vs crim: De acuerdo al coeficiente de correlación obtenido (\(R = -0.56\)), remarcado con altos niveles de significancia, se puede afirmar que existe una correlación negativa moderada entre el indice de criminalidad y el precio mediano de una casa. Esto implica que, en general, a medida que aumenta el indice de criminalidad, tiende a disminuir el precio mediano de una casa.

Por otro lado, es importante resaltar que las variables explicativas presentan una correlación moderada entre sí. En particular, la correlación entre rm y lstat fue de \(r = -0.64\), lo que indica una correlación negativa moderada. Por su parte, la correlación entre rm y crim fue de \(r = -0.31\), lo que sugiere una correlación negativa débil , y y entre lstat y crim fue de \(r = 0.63\) indicando que existe una correlación positiva moderada. Por lo tanto, estas correlaciones relativamente “bajas” favorecen nuestro análisis, pues ninguna correlacion es fuerte.

Selección de variables

Para esto, aplicaremos el metodo híbrido o both ya que es el más compacto y nos llevará a mejores resultados. Por temas de eficiencia utilizaremos la función:

modelo_inicial<-lm(Datos$medv ~ 1)
scope = list(lower = ~1, upper = Datos$medv ~ Datos$rm + Datos$lstat + Datos$crim)
modelo_both <- stepAIC(modelo_inicial, trace=TRUE, direction="both", scope=scope, k=2)
## Start:  AIC=2246.51
## Datos$medv ~ 1
## 
##               Df Sum of Sq   RSS    AIC
## + Datos$lstat  1   23243.9 19472 1851.0
## + Datos$rm     1   20654.4 22062 1914.2
## + Datos$crim   1    6440.8 36276 2165.8
## <none>                     42716 2246.5
## 
## Step:  AIC=1851.01
## Datos$medv ~ Datos$lstat
## 
##               Df Sum of Sq   RSS    AIC
## + Datos$rm     1    4033.1 15439 1735.6
## + Datos$crim   1     146.9 19325 1849.2
## <none>                     19472 1851.0
## - Datos$lstat  1   23243.9 42716 2246.5
## 
## Step:  AIC=1735.58
## Datos$medv ~ Datos$lstat + Datos$rm
## 
##               Df Sum of Sq   RSS    AIC
## + Datos$crim   1     311.4 15128 1727.3
## <none>                     15439 1735.6
## - Datos$rm     1    4033.1 19472 1851.0
## - Datos$lstat  1    6622.6 22062 1914.2
## 
## Step:  AIC=1727.27
## Datos$medv ~ Datos$lstat + Datos$rm + Datos$crim
## 
##               Df Sum of Sq   RSS    AIC
## <none>                     15128 1727.3
## - Datos$crim   1     311.4 15439 1735.6
## - Datos$rm     1    4197.6 19325 1849.2
## - Datos$lstat  1    4437.9 19566 1855.4
summary(modelo_both)
## 
## Call:
## lm(formula = Datos$medv ~ Datos$lstat + Datos$rm + Datos$crim)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -17.925  -3.566  -1.157   1.906  29.024 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.56225    3.16602  -0.809  0.41873    
## Datos$lstat -0.57849    0.04767 -12.135  < 2e-16 ***
## Datos$rm     5.21695    0.44203  11.802  < 2e-16 ***
## Datos$crim  -0.10294    0.03202  -3.215  0.00139 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.49 on 502 degrees of freedom
## Multiple R-squared:  0.6459, Adjusted R-squared:  0.6437 
## F-statistic: 305.2 on 3 and 502 DF,  p-value: < 2.2e-16
modelo_both$anova 
## Stepwise Model Path 
## Analysis of Deviance Table
## 
## Initial Model:
## Datos$medv ~ 1
## 
## Final Model:
## Datos$medv ~ Datos$lstat + Datos$rm + Datos$crim
## 
## 
##            Step Df   Deviance Resid. Df Resid. Dev      AIC
## 1                                   505   42716.30 2246.514
## 2 + Datos$lstat  1 23243.9140       504   19472.38 1851.009
## 3    + Datos$rm  1  4033.0722       503   15439.31 1735.577
## 4  + Datos$crim  1   311.4208       502   15127.89 1727.266

Por lo tanto nuestro modelo final, incluyo todas las variables explicativas consideradas, nos queda de esta manera:

\[y = -2.56 -0.57x_{1} + 5.21x_{2} - 0.10x_{3}\]

Interpretación de los coeficientes

  • Intercepto (\(-2.56\)): No tiene sentido evaluarlo en este caso, ya que ningun precio de una casa puede ser negativo. Por lo tanto, haremos caso omiso.

  • lstat (\(-0.57\)): Por cada unidad adicional en porcentaje de clase baja, manteniendo el número de habitaciones constante y el indice de criminalidad constante, el precio mediano de una casa disminuye, en promedio, -2.56 unidades. Muy significativo (\(p ≈ 2e-16\)).

  • rm (\(5.21\)): Por cada cuarto o habitación adicional, manteniendo el porcentaje de clase baja y el indice de criminalidad constante, el precio mediano de una casa aumenta, en promedio, 5.21 unidades. Muy significativo (\(p ≈ 2e-16\)).

  • lstat (\(-0.10\)): Por cada unidad adicional en el indice de criminalidad, manteniendo el número de habitaciones constante y el porcentaje de clase baja constante, el precio mediano de una casa disminuye, en promedio, -0.10 unidades. Es significativo (\(p ≈ 0.00139\)).

Calidad del ajuste

  • \(R^{2} = 0.6459\): El modelo explica aproximadamente el 64.59% de la variabilidad de las ventas, lo cual es ajuste considerable. El 65% de la variabilidad en el precio mediano de una casa se debe a la regresión del número de habitaciones, el indice de criminalidad, y el porcentaje de clase baja, mientras que el 35% se debe a otros factores no incluidos en el estudio. Sin embargo, como es menor al 70% se dice que no tiene una buena capacidad predictiva.

  • \(R^{2}_{ajustado} = 0.6437\) : Considerando el número de predictores, sigue siendo sólido. Además de que no varia mucho entre el coeficiente de determinación, lo que nos indica que las variables explicativas si aportan significativamente al modelo.

Multicolinealidad

Antes de verificar supuestos, veamos si hay multicolinealidad entre las variables explicativas, para eso aplicamos la siguiente función:

vifs <- vif(modelo_both)
print(vifs)
## Datos$lstat    Datos$rm  Datos$crim 
##    1.941883    1.616468    1.271372

Todos los VIF están por debajo de 5, lo que indica que no hay problemas de multicolinealidad, todas las variables son independientes entre sí y aportan información única.

Verificación de supuestos

Primero verifiquemos los residuos:

Residuos <- modelo_both$residuals

Veamos si son normales:

shapiro.test(Residuos)
## 
##  Shapiro-Wilk normality test
## 
## data:  Residuos
## W = 0.89067, p-value < 2.2e-16

Como el p-valor es menor a 0.05, los residuos no siguen una distribución aproximadamente normal.

plot(modelo_both)

Podemos destacar varias cosas de los gráficos generados:

  • EL gráfico de “Residuals Vs Fitted” no se observa una forma, lo que puede sugerir que cumple con la suposición de linealidad e independencia de los errores. Por otro lado, se observa que la mayoría de sus datos están relativamente cerca del 0, sin embargo, las observaciones 372, 373 y 369 aparecen marcados, por lo que podrían ser valores atípicos.

  • El gráfico de “Q- Q Residuals” se destaca que algunos de los datos se encuentran sobre la línea teórica de la normalidad, y otros están relativamente cerca. Con la prueba shapiro pudimos comprobar que los residuos no siguen una distribución normal, ya que su p-valor fue menor a 0.05 que es lo que se sospecha del gráfico. Sin embargo, otra vez las observaciones 372, 373 y 369 se marcan y se encuentran en los extremos, lo cual puede estar desviando a la normalidad.

  • El gráfico de “Scale-Location” no se observa ningún patrón a simple vista, lo cual sugiere que cumple con la suposición de linealidad. No obstante, otra vez se destacan las observaciones 7, 14 y 15.

  • El gráfico de “Leverage” se observa que los puntos 375, 366 y 369 son de alto leverage. De acuerdo a este gráfico, se observa que los puntos marcados puede ser valores atípicos pues pueden tener un rstudent mayor a 3, y ninguno de ellos tiene un Leverage alto. Ninguno cae en las curvas de la distancia de Cook, lo cual puede indicar que no es muy influyente.

Puntos de alto Leverage y puntos influyentes

Primero, hacemos la prueba Bonferroni para identificar las observaciones atípicas que se pueden presentar en el modelo, ya tenemos algunas sospechas de las observaciones 372, 373 y 369.

outlierTest(modelo_both, cutoff = Inf)  # Usa Bonferroni por defecto
##      rstudent unadjusted p-value Bonferroni p
## 369  5.526113         5.2724e-08   2.6678e-05
## 373  5.232812         2.4591e-07   1.2443e-04
## 372  4.969929         9.2096e-07   4.6601e-04
## 370  3.785437         1.7202e-04   8.7044e-02
## 375  3.485393         5.3456e-04   2.7049e-01
## 371  3.390194         7.5357e-04   3.8131e-01
## 413  3.374451         7.9699e-04   4.0328e-01
## 365 -3.351078         8.6577e-04   4.3808e-01
## 366  3.053395         2.3830e-03           NA
## 215  2.805434         5.2203e-03           NA

Podemos destacar los valores que aparecieron marcados en el gráfico de Leverage, ya que solo la observación 375 y 369 son atípicos ya que se rechaza la hipótesis nula pues tienen un p-valor menor a 0.05. Y en las observaciones en las cuales teníamos sospecha, también fueron catalogadas como atípicas.

cooks_d <- cooks.distance(modelo_both)
plot(cooks_d, type = "h", main = "Distancia de Cook",
     ylab = "Cook's Distance", xlab = "Observación")
abline(h = 4 / nrow(Datos), col = "red", lty = 2)  # Umbral sugerido

plot(modelo_both, which=4)

cooks.distance(modelo_both)
##            1            2            3            4            5            6 
## 8.844300e-04 3.516092e-04 2.175317e-04 6.563043e-05 9.082876e-04 2.143734e-05 
##            7            8            9           10           11           12 
## 3.967455e-05 3.666575e-03 8.786128e-03 7.949884e-08 1.095939e-03 1.122697e-04 
##           13           14           15           16           17           18 
## 2.009410e-04 4.416653e-04 6.289417e-04 4.438218e-04 1.097916e-04 1.603822e-04 
##           19           20           21           22           23           24 
## 7.842835e-05 2.519196e-04 2.018634e-05 1.735826e-05 4.576513e-04 1.267555e-04 
##           25           26           27           28           29           30 
## 2.948807e-04 3.658158e-04 1.802132e-04 5.251257e-04 6.487540e-04 4.488255e-04 
##           31           32           33           34           35           36 
## 1.231037e-04 9.551140e-04 1.177512e-04 4.276813e-04 7.573463e-04 5.289224e-04 
##           37           38           39           40           41           42 
## 5.556258e-05 1.609438e-04 1.266137e-04 8.843139e-05 2.152792e-04 4.087460e-04 
##           43           44           45           46           47           48 
## 4.218433e-05 2.250707e-05 1.610115e-04 1.701181e-04 1.023622e-05 8.421573e-05 
##           49           50           51           52           53           54 
## 8.160093e-03 1.770417e-04 2.732526e-05 3.145688e-04 4.135276e-04 7.653962e-06 
##           55           56           57           58           59           60 
## 1.316865e-05 4.258406e-04 2.725741e-04 3.294636e-05 1.976763e-04 4.410571e-04 
##           61           62           63           64           65           66 
## 3.815822e-05 4.366141e-04 7.481973e-04 1.235752e-04 4.001539e-04 8.220715e-04 
##           67           68           69           70           71           72 
## 2.190147e-04 9.651176e-05 1.146228e-04 1.978383e-04 2.437556e-04 3.964907e-05 
##           73           74           75           76           77           78 
## 5.346878e-04 1.576925e-04 1.591593e-04 3.203473e-04 2.065452e-04 1.760576e-04 
##           79           80           81           82           83           84 
## 5.121492e-05 2.641387e-04 7.368438e-05 3.954995e-04 9.023810e-05 1.954686e-04 
##           85           86           87           88           89           90 
## 3.493076e-05 7.747596e-05 2.955877e-05 1.656523e-04 1.958319e-03 2.229951e-04 
##           91           92           93           94           95           96 
## 2.304041e-04 4.104445e-04 2.807631e-04 6.460420e-05 2.261354e-04 1.899757e-06 
##           97           98           99          100          101          102 
## 5.505975e-05 3.389797e-04 5.672558e-03 2.633987e-05 4.539368e-06 9.353365e-05 
##          103          104          105          106          107          108 
## 7.118649e-04 1.174577e-04 1.134323e-04 3.675734e-05 2.432479e-04 1.571549e-05 
##          109          110          111          112          113          114 
## 3.964802e-04 6.243574e-05 5.650907e-06 3.497115e-04 2.726298e-07 1.235715e-05 
##          115          116          117          118          119          120 
## 6.272276e-04 2.428907e-05 4.428629e-05 3.776565e-04 4.324922e-05 7.308787e-07 
##          121          122          123          124          125          126 
## 1.401613e-04 9.474775e-07 2.052529e-04 1.804560e-03 2.706062e-05 4.361356e-05 
##          127          128          129          130          131          132 
## 2.949644e-03 3.476889e-05 5.212076e-04 1.385045e-04 4.538871e-04 2.357270e-04 
##          133          134          135          136          137          138 
## 2.615475e-05 1.343044e-05 1.040309e-04 2.366481e-04 4.735070e-05 8.663625e-04 
##          139          140          141          142          143          144 
## 3.329941e-04 4.152947e-05 2.968991e-04 2.788893e-02 1.342012e-03 2.673450e-03 
##          145          146          147          148          149          150 
## 5.188189e-03 7.930781e-05 6.122772e-05 1.144995e-02 1.252352e-02 1.095072e-04 
##          151          152          153          154          155          156 
## 3.962842e-06 1.819812e-04 1.479533e-04 7.023740e-05 2.729071e-04 4.485093e-04 
##          157          158          159          160          161          162 
## 2.877844e-04 4.370926e-03 4.224920e-05 3.534709e-04 3.351876e-06 1.605773e-02 
##          163          164          165          166          167          168 
## 1.710865e-02 2.114626e-02 8.496575e-05 7.709334e-05 2.041259e-02 2.305377e-04 
##          169          170          171          172          173          174 
## 5.155087e-08 5.176452e-05 1.228153e-04 8.968608e-05 1.068009e-03 9.304234e-05 
##          175          176          177          178          179          180 
## 1.309306e-06 2.919045e-05 1.292525e-06 1.668328e-04 1.409285e-05 1.509902e-03 
##          181          182          183          184          185          186 
## 3.959119e-03 3.914204e-03 1.587290e-03 5.681657e-04 2.456606e-03 1.237646e-03 
##          187          188          189          190          191          192 
## 2.028958e-02 2.716310e-04 2.683731e-05 4.363887e-04 1.469248e-03 1.462864e-05 
##          193          194          195          196          197          198 
## 5.415198e-04 4.306743e-05 2.668743e-06 1.796883e-02 2.368433e-06 2.441474e-05 
##          199          200          201          202          203          204 
## 4.630292e-04 5.542604e-04 3.015324e-05 5.001876e-05 3.745162e-03 1.529787e-02 
##          205          206          207          208          209          210 
## 1.857500e-02 1.717339e-05 2.083709e-06 1.105040e-03 3.500913e-04 5.141691e-03 
##          211          212          213          214          215          216 
## 3.385643e-04 4.913770e-03 4.891367e-04 1.719512e-04 3.709956e-02 1.635101e-05 
##          217          218          219          220          221          222 
## 2.362200e-04 1.104064e-04 4.278908e-04 4.995494e-05 6.093885e-05 1.501390e-03 
##          223          224          225          226          227          228 
## 8.295383e-09 1.673587e-04 7.139594e-03 2.450663e-02 5.705509e-07 1.136527e-05 
##          229          230          231          232          233          234 
## 1.096374e-02 2.095392e-04 1.517395e-04 1.040274e-04 8.488264e-04 1.616412e-02 
##          235          236          237          238          239          240 
## 3.455832e-05 3.066234e-05 4.001722e-05 1.327959e-04 4.650385e-04 4.805405e-04 
##          241          242          243          244          245          246 
## 8.347880e-04 8.193197e-05 6.983888e-05 6.854504e-04 1.395799e-04 2.820386e-04 
##          247          248          249          250          251          252 
## 3.152304e-06 2.709590e-04 1.950347e-05 1.757401e-04 4.014286e-04 9.019086e-04 
##          253          254          255          256          257          258 
## 1.948791e-04 2.988109e-03 5.776733e-04 1.382811e-04 5.906357e-03 2.649946e-02 
##          259          260          261          262          263          264 
## 1.323318e-03 3.124117e-05 9.660620e-04 8.170861e-03 2.378422e-02 2.607340e-04 
##          265          266          267          268          269          270 
## 1.789868e-03 3.574998e-04 1.840168e-03 3.506711e-02 5.401318e-03 2.066509e-06 
##          271          272          273          274          275          276 
## 1.233517e-05 3.486380e-05 1.744674e-04 1.902328e-04 1.374317e-04 1.395186e-05 
##          277          278          279          280          281          282 
## 9.134669e-05 2.452443e-04 1.101278e-04 8.994829e-04 8.496435e-03 7.270597e-04 
##          283          284          285          286          287          288 
## 8.737362e-03 1.854922e-02 2.108702e-04 4.459464e-04 1.137340e-04 2.204446e-04 
##          289          290          291          292          293          294 
## 3.919113e-04 4.044504e-05 3.574685e-04 1.058976e-03 7.554282e-05 8.670434e-06 
##          295          296          297          298          299          300 
## 3.178015e-05 3.887028e-08 1.280258e-06 1.057750e-04 1.196028e-03 2.416158e-04 
##          301          302          303          304          305          306 
## 8.024747e-04 4.013881e-04 2.356086e-07 1.659574e-04 1.151504e-03 5.853087e-05 
##          307          308          309          310          311          312 
## 6.126025e-05 1.064481e-05 1.714073e-03 1.947086e-04 1.013509e-05 6.841838e-04 
##          313          314          315          316          317          318 
## 1.683386e-04 4.462414e-04 1.310739e-04 7.622177e-04 8.193619e-07 6.587399e-05 
##          319          320          321          322          323          324 
## 4.925570e-05 1.719524e-05 2.491439e-04 4.029244e-04 6.672045e-04 1.421605e-04 
##          325          326          327          328          329          330 
## 1.858561e-04 4.795729e-04 5.370169e-04 4.362190e-06 3.319916e-04 3.898823e-04 
##          331          332          333          334          335          336 
## 5.455701e-04 3.182469e-04 9.909742e-04 9.763435e-04 1.115058e-03 3.942553e-04 
##          337          338          339          340          341          342 
## 3.185216e-04 4.257727e-04 4.271210e-04 5.173927e-04 7.080802e-04 2.119588e-05 
##          343          344          345          346          347          348 
## 2.246889e-03 4.968805e-04 1.248104e-05 7.511594e-04 3.670878e-04 6.608075e-04 
##          349          350          351          352          353          354 
## 5.187241e-04 4.560976e-04 8.050246e-04 6.874789e-04 1.269240e-03 1.081551e-06 
##          355          356          357          358          359          360 
## 1.146015e-03 1.385284e-03 2.542854e-05 1.876568e-05 4.841101e-06 1.990030e-05 
##          361          362          363          364          365          366 
## 2.130953e-05 4.190971e-05 2.302168e-04 9.999044e-05 8.866643e-02 1.602101e-01 
##          367          368          369          370          371          372 
## 5.055707e-03 8.458902e-02 2.287920e-01 2.431819e-02 2.263697e-02 2.823846e-02 
##          373          374          375          376          377          378 
## 4.617108e-02 2.720090e-02 9.006181e-02 1.638607e-02 1.189021e-03 3.903946e-03 
##          379          380          381          382          383          384 
## 3.066173e-04 2.180138e-03 6.126804e-02 4.009264e-03 9.950492e-06 7.722725e-05 
##          385          386          387          388          389          390 
## 1.266343e-02 4.137364e-04 1.029602e-02 3.642113e-03 5.488101e-03 6.309435e-05 
##          391          392          393          394          395          396 
## 6.608891e-05 9.554045e-04 3.513101e-04 8.822601e-04 8.639494e-04 1.889009e-03 
##          397          398          399          400          401          402 
## 2.030117e-03 1.493381e-03 1.817111e-04 1.556224e-03 3.764478e-03 6.150218e-03 
##          403          404          405          406          407          408 
## 1.964810e-03 1.317068e-03 1.965182e-03 4.300851e-03 1.691781e-02 6.228249e-03 
##          409          410          411          412          413          414 
## 3.573677e-03 5.111843e-03 1.651627e-03 1.401685e-04 6.133840e-02 8.628304e-03 
##          415          416          417          418          419          420 
## 7.375963e-02 4.880727e-03 1.448958e-02 1.676176e-03 8.116982e-05 1.303394e-02 
##          421          422          423          424          425          426 
## 6.063831e-04 4.754423e-04 5.778351e-04 1.906904e-04 5.724495e-04 1.310566e-03 
##          427          428          429          430          431          432 
## 2.076019e-03 1.540037e-02 1.647050e-03 3.770956e-03 8.068005e-04 3.666093e-03 
##          433          434          435          436          437          438 
## 1.036434e-03 1.274290e-03 2.578912e-03 1.726739e-03 5.069375e-03 1.725791e-03 
##          439          440          441          442          443          444 
## 2.653510e-04 2.216424e-06 4.802200e-04 1.036050e-04 3.917928e-05 7.511803e-04 
##          445          446          447          448          449          450 
## 2.754776e-04 1.892377e-03 7.099893e-04 1.327721e-03 5.322785e-04 1.656114e-03 
##          451          452          453          454          455          456 
## 3.931962e-03 1.909585e-03 3.853354e-04 7.275801e-03 2.209546e-03 1.876754e-03 
##          457          458          459          460          461          462 
## 6.250209e-04 4.438266e-04 6.700703e-04 3.407380e-08 1.596854e-03 3.547041e-04 
##          463          464          465          466          467          468 
## 8.533945e-05 4.778956e-04 1.294172e-08 2.323751e-05 1.660639e-05 4.845874e-04 
##          469          470          471          472          473          474 
## 3.986063e-04 3.835791e-04 5.632020e-07 1.016027e-04 1.564403e-05 3.904395e-04 
##          475          476          477          478          479          480 
## 1.671795e-05 2.339445e-04 5.056293e-04 6.182399e-04 4.185972e-04 1.329940e-05 
##          481          482          483          484          485          486 
## 8.040202e-07 4.817225e-04 9.314928e-04 1.611772e-05 6.004931e-06 1.343352e-04 
##          487          488          489          490          491          492 
## 1.782949e-05 8.090930e-06 2.577414e-06 1.986397e-03 2.662820e-04 8.035713e-04 
##          493          494          495          496          497          498 
## 1.593268e-05 9.362844e-05 4.096794e-04 1.554364e-03 2.638182e-03 4.145400e-05 
##          499          500          501          502          503          504 
## 4.465959e-07 2.295813e-06 3.341313e-04 3.151623e-04 3.545844e-04 1.614989e-03 
##          505          506 
## 1.516662e-03 6.163582e-03
cooks.distance(modelo_both)[which.max(cooks.distance(modelo_both))]
##      369 
## 0.228792

Aqui notamos que las observaciones, 369, 366 y 375 fueron marcadas como puntos influyentes ya que tienen una alta distancia de Cook.

Conclusión

El precio mediano de una casa se puede predecir en función de las variables explicativas escogidas pero no sería un buen modelo, ya que no tiene una buena capacida predictiva, además de que el residuo no cumple con la suposición de normalidad. Por otro lado, hay varios puntos influyentes que pueden afectar drásticamente los coeficientes del modelo, por lo que habría que tener cuidado al eliminarlos.