Limpieza de Datos

library(paqueteMODELOS)
data(vivienda)
vivienda$barrio <- gsub("á", "a", vivienda$barrio)
vivienda$barrio <- gsub("é", "e", vivienda$barrio)
vivienda$barrio <- gsub("í", "i", vivienda$barrio)
vivienda$barrio <- gsub("ó", "o", vivienda$barrio)
vivienda$barrio <- gsub("ú", "u", vivienda$barrio)
vivienda$barrio <- gsub("é", "e", vivienda$barrio)
vivienda$barrio <- gsub("√∫", "u", vivienda$barrio)
vivienda$barrio <- gsub("\\^\\[", "", vivienda$barrio)
vivienda$barrio <- gsub("ñ", "gn", vivienda$barrio)

Se realiza la limpieza de la data para eliminar los caracteres con tildes y otras acentuaciones que pueden generar errores en el procesamiento de los datos

Exploracion de Datos

## spc_tbl_ [8,322 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id          : num [1:8322] 1147 1169 1350 5992 1212 ...
##  $ zona        : chr [1:8322] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
##  $ piso        : chr [1:8322] NA NA NA "02" ...
##  $ estrato     : num [1:8322] 3 3 3 4 5 5 4 5 5 5 ...
##  $ preciom     : num [1:8322] 250 320 350 400 260 240 220 310 320 780 ...
##  $ areaconst   : num [1:8322] 70 120 220 280 90 87 52 137 150 380 ...
##  $ parqueaderos: num [1:8322] 1 1 2 3 1 1 2 2 2 2 ...
##  $ banios      : num [1:8322] 3 2 2 5 2 3 2 3 4 3 ...
##  $ habitaciones: num [1:8322] 6 3 4 3 3 3 3 4 6 3 ...
##  $ tipo        : chr [1:8322] "Casa" "Casa" "Casa" "Casa" ...
##  $ barrio      : chr [1:8322] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
##  $ longitud    : num [1:8322] -76.5 -76.5 -76.5 -76.5 -76.5 ...
##  $ latitud     : num [1:8322] 3.43 3.43 3.44 3.44 3.46 ...
##  - attr(*, "spec")=List of 3
##   ..$ cols   :List of 13
##   .. ..$ id          : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ zona        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ piso        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ estrato     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ preciom     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ areaconst   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ parqueaderos: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ banios      : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ habitaciones: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ tipo        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ barrio      : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ longitud    : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ latitud     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   ..$ default: list()
##   .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
##   ..$ delim  : chr ";"
##   ..- attr(*, "class")= chr "col_spec"
##  - attr(*, "problems")=<externalptr>

Se realiza una exploracion de los datos para conocer su estructura y visualizar posible falta de informacion dentro de la base

Verificacion de Faltantes

Se realiza la verificacion de faltantes en la base evidenciando 1605 datos faltantes en la columna parqueaderos y 2638 en la columna pisos

Imputacion de Faltantes

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   1.000   2.000   1.835   2.000  10.000    1605

## spc_tbl_ [8,319 × 12] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id          : num [1:8319] 1147 1169 1350 5992 1212 ...
##  $ zona        : chr [1:8319] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
##  $ estrato     : num [1:8319] 3 3 3 4 5 5 4 5 5 5 ...
##  $ preciom     : num [1:8319] 250 320 350 400 260 240 220 310 320 780 ...
##  $ areaconst   : num [1:8319] 70 120 220 280 90 87 52 137 150 380 ...
##  $ parqueaderos: num [1:8319] 1 1 2 3 1 1 2 2 2 2 ...
##  $ banios      : num [1:8319] 3 2 2 5 2 3 2 3 4 3 ...
##  $ habitaciones: num [1:8319] 6 3 4 3 3 3 3 4 6 3 ...
##  $ tipo        : chr [1:8319] "Casa" "Casa" "Casa" "Casa" ...
##  $ barrio      : chr [1:8319] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
##  $ longitud    : num [1:8319] -76.5 -76.5 -76.5 -76.5 -76.5 ...
##  $ latitud     : num [1:8319] 3.43 3.43 3.44 3.44 3.46 ...
##  - attr(*, "spec")=List of 3
##   ..$ cols   :List of 13
##   .. ..$ id          : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ zona        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ piso        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ estrato     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ preciom     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ areaconst   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ parqueaderos: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ banios      : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ habitaciones: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ tipo        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ barrio      : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ longitud    : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ latitud     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   ..$ default: list()
##   .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
##   ..$ delim  : chr ";"
##   ..- attr(*, "class")= chr "col_spec"
##  - attr(*, "problems")=<externalptr> 
##  - attr(*, "na.action")= 'omit' Named int [1:3] 8320 8321 8322
##   ..- attr(*, "names")= chr [1:3] "8320" "8321" "8322"
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

Se realiza la imputacion de datos en la columna parqueaderos utilizando la mediana y se elimina la columna pisos, la cual no es relevante para el analisis en general.

Creacion de Variables Binarias

##        id           zona              estrato         preciom      
##  Min.   :   1   Length:8319        Min.   :3.000   Min.   :  58.0  
##  1st Qu.:2080   Class :character   1st Qu.:4.000   1st Qu.: 220.0  
##  Median :4160   Mode  :character   Median :5.000   Median : 330.0  
##  Mean   :4160                      Mean   :4.634   Mean   : 433.9  
##  3rd Qu.:6240                      3rd Qu.:5.000   3rd Qu.: 540.0  
##  Max.   :8319                      Max.   :6.000   Max.   :1999.0  
##    areaconst       parqueaderos        banios        habitaciones   
##  Min.   :  30.0   Min.   : 1.000   Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:  80.0   1st Qu.: 1.000   1st Qu.: 2.000   1st Qu.: 3.000  
##  Median : 123.0   Median : 2.000   Median : 3.000   Median : 3.000  
##  Mean   : 174.9   Mean   : 1.867   Mean   : 3.111   Mean   : 3.605  
##  3rd Qu.: 229.0   3rd Qu.: 2.000   3rd Qu.: 4.000   3rd Qu.: 4.000  
##  Max.   :1745.0   Max.   :10.000   Max.   :10.000   Max.   :10.000  
##      tipo              barrio             longitud         latitud     
##  Length:8319        Length:8319        Min.   :-76.59   Min.   :3.333  
##  Class :character   Class :character   1st Qu.:-76.54   1st Qu.:3.381  
##  Mode  :character   Mode  :character   Median :-76.53   Median :3.416  
##                                        Mean   :-76.53   Mean   :3.418  
##                                        3rd Qu.:-76.52   3rd Qu.:3.452  
##                                        Max.   :-76.46   Max.   :3.498  
##        Z1               Z2               Z3                Z4          E0   
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.00000   Min.   :0   Min.   :0  
##  1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:0.00000   1st Qu.:0   1st Qu.:0  
##  Median :0.0000   Median :1.0000   Median :0.00000   Median :0   Median :0  
##  Mean   :0.2308   Mean   :0.5681   Mean   :0.04219   Mean   :0   Mean   :0  
##  3rd Qu.:0.0000   3rd Qu.:1.0000   3rd Qu.:0.00000   3rd Qu.:0   3rd Qu.:0  
##  Max.   :1.0000   Max.   :1.0000   Max.   :1.00000   Max.   :0   Max.   :0  
##        E1          E2               E3               E4        
##  Min.   :0   Min.   :0.0000   Min.   :0.0000   Min.   :0.0000  
##  1st Qu.:0   1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:0.0000  
##  Median :0   Median :0.0000   Median :0.0000   Median :0.0000  
##  Mean   :0   Mean   :0.1747   Mean   :0.2559   Mean   :0.3306  
##  3rd Qu.:0   3rd Qu.:0.0000   3rd Qu.:1.0000   3rd Qu.:1.0000  
##  Max.   :0   Max.   :1.0000   Max.   :1.0000   Max.   :1.0000  
##        E5        
##  Min.   :0.0000  
##  1st Qu.:0.0000  
##  Median :0.0000  
##  Mean   :0.2389  
##  3rd Qu.:0.0000  
##  Max.   :1.0000

Se raliza la creacion de las variable binarias para poder realizar los procedimientos siguientes que requieren el uso de variables categoricas no numericas creando las variables z1, Z2, Z3 y Z4 para las Zonas y las variables E1, E2, E3, E4 y E5 para los estratos.

Filtro Vivienda 1

Se realiza el filtro para el caso vivienda 1 y se ordena por precio en orden ascendente y se extraen los primeros 3 resultados segun lo solicitado en el caso de estudio.

Filtro vivienda 2

Se realiza la consulta para el caso de vivienda 2 aplicando el filtro sugerido segun lo solicitado en el caso de estudio.

Georeferenciacion

Se crea mapa interactivo con las opciones del caso vivienda1 y la demarcacion de la Zona norte de la ciudad de cali.

Analisis Exploratorio vivienda 1

Unique (#) Missing (%) Mean SD Min Median Max
id 39 0 2913.9 1927.5 766.0 2544.0 7471.0
estrato 2 0 4.6 0.5 4.0 5.0 5.0
preciom 13 0 328.8 27.9 230.0 340.0 350.0
areaconst 27 0 251.5 41.5 200.0 249.0 355.0
parqueaderos 3 0 1.9 0.5 1.0 2.0 3.0
banios 5 0 3.8 1.0 2.0 4.0 6.0
habitaciones 5 0 4.7 1.0 4.0 4.0 8.0
longitud 36 0 -76.5 0.0 -76.5 -76.5 -76.5
latitud 39 0 3.5 0.0 3.4 3.5 3.5
Z1 1 0 1.0 0.0 1.0 1.0 1.0
Z2 1 0 0.0 0.0 0.0 0.0 0.0
Z3 1 0 0.0 0.0 0.0 0.0 0.0
Z4 1 0 0.0 0.0 0.0 0.0 0.0
E0 1 0 0.0 0.0 0.0 0.0 0.0
E1 1 0 0.0 0.0 0.0 0.0 0.0
E2 1 0 0.0 0.0 0.0 0.0 0.0
E3 2 0 0.4 0.5 0.0 0.0 1.0
E4 2 0 0.6 0.5 0.0 1.0 1.0
E5 1 0 0.0 0.0 0.0 0.0 0.0
## Rows: 39
## Columns: 22
## $ id           <dbl> 7471, 4210, 4267, 4800, 4209, 4422, 4458, 4483, 852, 1009…
## $ zona         <chr> "Zona Norte", "Zona Norte", "Zona Norte", "Zona Norte", "…
## $ estrato      <dbl> 4, 5, 5, 5, 5, 5, 4, 5, 5, 5, 5, 4, 4, 4, 5, 5, 5, 5, 4, …
## $ preciom      <dbl> 330, 350, 335, 340, 350, 350, 315, 342, 340, 250, 350, 34…
## $ areaconst    <dbl> 240, 200, 202, 250, 300, 240, 270, 250, 208, 243, 203, 20…
## $ parqueaderos <dbl> 2, 3, 1, 2, 3, 2, 2, 1, 2, 1, 2, 2, 3, 2, 2, 2, 2, 2, 2, …
## $ banios       <dbl> 4, 3, 4, 4, 5, 3, 4, 4, 6, 4, 2, 4, 4, 6, 5, 3, 4, 4, 3, …
## $ habitaciones <dbl> 4, 4, 5, 4, 6, 6, 4, 6, 4, 5, 5, 4, 4, 4, 6, 4, 4, 4, 4, …
## $ tipo         <chr> "Casa", "Casa", "Casa", "Casa", "Casa", "Casa", "Casa", "…
## $ barrio       <chr> "acopi", "el bosque", "el bosque", "el bosque", "el bosqu…
## $ longitud     <dbl> -76.54980, -76.53010, -76.53044, -76.53300, -76.53010, -7…
## $ latitud      <dbl> 3.39758, 3.48503, 3.48399, 3.46500, 3.48577, 3.48635, 3.4…
## $ Z1           <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …
## $ Z2           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ Z3           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ Z4           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E0           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E1           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E2           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E3           <dbl> 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, …
## $ E4           <dbl> 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, …
## $ E5           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …

Se realiza un analisis exploratorio para visualizar la distribucion y el comportamiento de las variables numericas del caso vivienda 1

Se realiza un analisis de correlaciones de las variables predictorias y la variable de interes evidenciando que existe una correlacion muy baja debido a la poca cantidad de datos luego de aplicado el filtro, este analisis debe ser complementado ya que no es concluyente para el ejercicio planteado, por lo cual se realizan algunos analisis de correlacion de tipo individual entre la variable de interes y cada variable predictorias para tener mayor informacion del comportamiento de cada una de ellas.

Analisis de Correlaciones Individual

Se realiza un mapa de calor de correlaciones para obtener informacion mas detallada y visualmente agradable al publico.

## 
## Call:
## lm(formula = preciom ~ areaconst + banios + habitaciones + Z1 + 
##     E2 + E3 + E4, data = Hc)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -89.492  -9.787   6.433  15.661  33.904 
## 
## Coefficients: (3 not defined because of singularities)
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  327.9713    33.7337   9.722 2.39e-11 ***
## areaconst      0.1690     0.1223   1.382    0.176    
## banios        -2.5165     4.8015  -0.524    0.604    
## habitaciones  -5.3647     5.2998  -1.012    0.319    
## Z1                 NA         NA      NA       NA    
## E2                 NA         NA      NA       NA    
## E3           -16.3446     9.7493  -1.676    0.103    
## E4                 NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 27.58 on 34 degrees of freedom
## Multiple R-squared:  0.1236, Adjusted R-squared:  0.02046 
## F-statistic: 1.198 on 4 and 34 DF,  p-value: 0.3293

El modelo de regresión lineal múltiple estimado no muestra resultados estadísticamente significativos para las variables incluidas. Adicionalmente, el R-cuadrado es bajo (0.123), lo que sugiere que las variables en el modelo tienen una capacidad limitada (12.36%)para explicar la variabilidad en los precios de las viviendas. Se podrían explorar otras variables o enfoques de modelado para mejorar la capacidad del modelo para predecir los precios de las viviendas de manera más precisa.

El método “forward” no encontró ninguna combinación de variables predictoras que mejorara significativamente el modelo en comparación con el modelo constante (intercepto solo). Esto podría ser una indicacion de que las variables predictoras seleccionadas inicialmente no están bien correlacionadas con la variable respuesta (precio) o que el conjunto de datos es demasiado pequeño (38) para realizar una selección efectiva de variables. Se podría considerar explorar otras variables o métodos de selección de características para mejorar el modelo.

## 
## Call:
## lm(formula = preciom ~ 1, data = Hc)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -98.821  -8.321  11.179  21.179  21.179 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  328.821      4.462    73.7   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 27.86 on 38 degrees of freedom

El resumen realizado con la funcion forward muestra que los valores del intercepto son los valores con mayor significancia en el modelo de regresion.

## 
## Call:
## lm(formula = preciom ~ areaconst + banios + habitaciones + Z1 + 
##     E2 + E3 + E4, data = Hc, subset = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -73.873 -11.044   6.609  20.803  34.068 
## 
## Coefficients: (3 not defined because of singularities)
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  263.9732    53.9429   4.894 0.000293 ***
## areaconst      0.5998     0.2878   2.084 0.057422 .  
## banios         5.1368     8.1098   0.633 0.537458    
## habitaciones -21.2785    11.8869  -1.790 0.096746 .  
## Z1                 NA         NA      NA       NA    
## E2                 NA         NA      NA       NA    
## E3           -40.2522    20.0571  -2.007 0.066022 .  
## E4                 NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 31.68 on 13 degrees of freedom
## Multiple R-squared:  0.3062, Adjusted R-squared:  0.09266 
## F-statistic: 1.434 on 4 and 13 DF,  p-value: 0.2779

Se entrena un modelo para que tome muestras y realice el calculo de los coeficientes y los estadisticos de prueba, sin embargo nos sigue mostrando que continua siendo el intercepto el de mayor significancia en el modelo y adicionalmente se evidencia que el modelo solo explica el 30.06% a traves de las variables predictorias la variable de interes preciom.

## [1] 1480.806

El MSE de 1480.806 sugiere que el modelo podría no estar ajustando muy bien los datos de prueba, ya que el Error Cuadratico Medio es relativamente alto. Esto significa que las predicciones del modelo pueden estar bastante alejadas de los valores reales en el conjunto de prueba.

Es importante considerar este resultado en el contexto de los datos y el problema en cuestión. Si el MSE es demasiado alto y las predicciones del modelo son inexactas, podría ser necesario revisar y mejorar el modelo, considerar diferentes características o técnicas de modelado, o realizar un análisis más detenido para entender mejor las razones detrás de las discrepancias.

El análisis de validación cruzada dado que los valores de MSE están distribuidos alrededor del valor de referencia 1, y no hay un patrón evidente de sesgo o varianza extrema, esto sugiere que el modelo podría estar proporcionando predicciones razonablemente estables en diferentes conjuntos de datos de prueba.

Al aplicar el metodo Bootstrap se obtienen los rangos para los coeficientes de las variables lo que indica que los valores de estos coeficientes podrian estar en dicho rango con una alta probabilidad, lo que permite una mejor toma de desicion al seleccionar el modelo, por otro lado los datos no se muestran en forma de campana y puede deberse al tamaño de la muestra que para el caso de Hc es de aproximadamente 39 observaciones, sesgos en los datos, multicolinealidas en las variables o ruido en los datos.

## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = Hc, statistic = fun_coeficientes, R = 2000)
## 
## 
## Bootstrap Statistics :
##         original  bias    std. error
## t1* 422.99461602       0           0
## t2*   0.01364138       0           0
## t3*  -4.59389765       0           0
## t4* -17.95661798       0           0
## t7*  -7.17902859       0           0
## WARNING: All values of t5* are NA
## WARNING: All values of t6* are NA
## WARNING: All values of t8* are NA

Al aplicar el estadistico Boots podemos observar que el bias es cero(0) lo que nos indica que no existe sesgo entre las estadisticas originales y las estadisticas bootstrap, sin embargo los errores estandar con valores cero(0) sugieren algun tipo de error ya que es poco probable que no exista variabilidad entre las estadisticas bootstrap en diferentes muestreos.

##                 Estimate Std. Error    t value     Pr(>|t|)
## (Intercept)  327.9712685 33.7336506  9.7223770 2.387046e-11
## areaconst      0.1689544  0.1222945  1.3815376 1.761256e-01
## banios        -2.5164806  4.8014556 -0.5241079 6.036037e-01
## habitaciones  -5.3646655  5.2998426 -1.0122311 3.185772e-01
## E3           -16.3446143  9.7493386 -1.6764844 1.028162e-01

Despues de realizar el resumen del modelo ajustado de los coeficientes se evidencia que el intercepto, areaconst, E2, E3 y E4 son significativos, sin embargo estos 3 ultimos de manera decreciente.

r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC deviance df.residual nobs
0.12 0.02 27.58 1.20 0.33 4 -182.03 376.05 386.03 25856.12 34 39
0.05 -0.03 28.28 0.63 0.60 3 -183.57 377.15 385.47 27993.51 35 39
0.07 0.02 27.58 1.39 0.26 2 -183.14 374.29 380.94 27384.19 36 39
0.07 0.02 27.58 1.39 0.26 2 -183.14 374.29 380.94 27384.19 36 39
0.01 -0.01 28.03 0.54 0.47 1 -184.32 374.63 379.62 29079.46 37 39

La validacion realizada con la tabla comparativa de los diferentes modelos de regresion muestra que los modelos no son lo suficiente mente significativos para explicar la variable de interes.

## 
## ===================================================================
##                               Dependent variable:                  
##              ------------------------------------------------------
##                                     preciom                        
##               modelo0    modelo1    modelo2    modelo3    modelo4  
## -------------------------------------------------------------------
## areaconst      0.169      0.097      0.125      0.125      0.080   
##               (0.122)    (0.117)    (0.112)    (0.112)    (0.110)  
##                                                                    
## banios         -2.516     -3.766                                   
##               (4.801)    (4.864)                                   
##                                                                    
## habitaciones   -5.365     -2.768                                   
##               (5.300)    (5.198)                                   
##                                                                    
## Z1                                                                 
##                                                                    
##                                                                    
## E2                                                                 
##                                                                    
##                                                                    
## E3            -16.345                                              
##               (9.749)                                              
##                                                                    
## E4                                   13.905     13.905             
##                                     (9.314)    (9.314)             
##                                                                    
## Constant     327.971*** 331.796*** 289.232*** 289.232*** 308.608***
##               (33.734)   (34.516)   (30.396)   (30.396)   (27.938) 
##                                                                    
## -------------------------------------------------------------------
## Observations     39         39         39         39         39    
## R2             0.124      0.051      0.072      0.072      0.014   
## Adjusted R2    0.020      -0.030     0.020      0.020      -0.012  
## ===================================================================
## Note:                                 *p<0.05; **p<0.01; ***p<0.001