library(paqueteMODELOS)
data(vivienda)
vivienda$barrio <- gsub("á", "a", vivienda$barrio)
vivienda$barrio <- gsub("é", "e", vivienda$barrio)
vivienda$barrio <- gsub("í", "i", vivienda$barrio)
vivienda$barrio <- gsub("ó", "o", vivienda$barrio)
vivienda$barrio <- gsub("ú", "u", vivienda$barrio)
vivienda$barrio <- gsub("é", "e", vivienda$barrio)
vivienda$barrio <- gsub("√∫", "u", vivienda$barrio)
vivienda$barrio <- gsub("\\^\\[", "", vivienda$barrio)
vivienda$barrio <- gsub("ñ", "gn", vivienda$barrio)
Se realiza la limpieza de la data para eliminar los caracteres con tildes y otras acentuaciones que pueden generar errores en el procesamiento de los datos
## spc_tbl_ [8,322 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8322] 1147 1169 1350 5992 1212 ...
## $ zona : chr [1:8322] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ piso : chr [1:8322] NA NA NA "02" ...
## $ estrato : num [1:8322] 3 3 3 4 5 5 4 5 5 5 ...
## $ preciom : num [1:8322] 250 320 350 400 260 240 220 310 320 780 ...
## $ areaconst : num [1:8322] 70 120 220 280 90 87 52 137 150 380 ...
## $ parqueaderos: num [1:8322] 1 1 2 3 1 1 2 2 2 2 ...
## $ banios : num [1:8322] 3 2 2 5 2 3 2 3 4 3 ...
## $ habitaciones: num [1:8322] 6 3 4 3 3 3 3 4 6 3 ...
## $ tipo : chr [1:8322] "Casa" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8322] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
## $ longitud : num [1:8322] -76.5 -76.5 -76.5 -76.5 -76.5 ...
## $ latitud : num [1:8322] 3.43 3.43 3.44 3.44 3.46 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parqueaderos: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitaciones: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ";"
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
Se realiza una exploracion de los datos para conocer su estructura y visualizar posible falta de informacion dentro de la base
Se realiza la verificacion de faltantes en la base evidenciando 1605 datos faltantes en la columna parqueaderos y 2638 en la columna pisos
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 1.000 2.000 1.835 2.000 10.000 1605
## spc_tbl_ [8,319 × 12] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8319] 1147 1169 1350 5992 1212 ...
## $ zona : chr [1:8319] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ estrato : num [1:8319] 3 3 3 4 5 5 4 5 5 5 ...
## $ preciom : num [1:8319] 250 320 350 400 260 240 220 310 320 780 ...
## $ areaconst : num [1:8319] 70 120 220 280 90 87 52 137 150 380 ...
## $ parqueaderos: num [1:8319] 1 1 2 3 1 1 2 2 2 2 ...
## $ banios : num [1:8319] 3 2 2 5 2 3 2 3 4 3 ...
## $ habitaciones: num [1:8319] 6 3 4 3 3 3 3 4 6 3 ...
## $ tipo : chr [1:8319] "Casa" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8319] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
## $ longitud : num [1:8319] -76.5 -76.5 -76.5 -76.5 -76.5 ...
## $ latitud : num [1:8319] 3.43 3.43 3.44 3.44 3.46 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parqueaderos: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitaciones: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ";"
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
## - attr(*, "na.action")= 'omit' Named int [1:3] 8320 8321 8322
## ..- attr(*, "names")= chr [1:3] "8320" "8321" "8322"
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
Se realiza la imputacion de datos en la columna parqueaderos utilizando la mediana y se elimina la columna pisos, la cual no es relevante para el analisis en general.
## id zona estrato preciom
## Min. : 1 Length:8319 Min. :3.000 Min. : 58.0
## 1st Qu.:2080 Class :character 1st Qu.:4.000 1st Qu.: 220.0
## Median :4160 Mode :character Median :5.000 Median : 330.0
## Mean :4160 Mean :4.634 Mean : 433.9
## 3rd Qu.:6240 3rd Qu.:5.000 3rd Qu.: 540.0
## Max. :8319 Max. :6.000 Max. :1999.0
## areaconst parqueaderos banios habitaciones
## Min. : 30.0 Min. : 1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 80.0 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000
## Median : 123.0 Median : 2.000 Median : 3.000 Median : 3.000
## Mean : 174.9 Mean : 1.867 Mean : 3.111 Mean : 3.605
## 3rd Qu.: 229.0 3rd Qu.: 2.000 3rd Qu.: 4.000 3rd Qu.: 4.000
## Max. :1745.0 Max. :10.000 Max. :10.000 Max. :10.000
## tipo barrio longitud latitud
## Length:8319 Length:8319 Min. :-76.59 Min. :3.333
## Class :character Class :character 1st Qu.:-76.54 1st Qu.:3.381
## Mode :character Mode :character Median :-76.53 Median :3.416
## Mean :-76.53 Mean :3.418
## 3rd Qu.:-76.52 3rd Qu.:3.452
## Max. :-76.46 Max. :3.498
## Z1 Z2 Z3 Z4 E0
## Min. :0.0000 Min. :0.0000 Min. :0.00000 Min. :0 Min. :0
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:0 1st Qu.:0
## Median :0.0000 Median :1.0000 Median :0.00000 Median :0 Median :0
## Mean :0.2308 Mean :0.5681 Mean :0.04219 Mean :0 Mean :0
## 3rd Qu.:0.0000 3rd Qu.:1.0000 3rd Qu.:0.00000 3rd Qu.:0 3rd Qu.:0
## Max. :1.0000 Max. :1.0000 Max. :1.00000 Max. :0 Max. :0
## E1 E2 E3 E4
## Min. :0 Min. :0.0000 Min. :0.0000 Min. :0.0000
## 1st Qu.:0 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
## Median :0 Median :0.0000 Median :0.0000 Median :0.0000
## Mean :0 Mean :0.1747 Mean :0.2559 Mean :0.3306
## 3rd Qu.:0 3rd Qu.:0.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :0 Max. :1.0000 Max. :1.0000 Max. :1.0000
## E5
## Min. :0.0000
## 1st Qu.:0.0000
## Median :0.0000
## Mean :0.2389
## 3rd Qu.:0.0000
## Max. :1.0000
Se raliza la creacion de las variable binarias para poder realizar los procedimientos siguientes que requieren el uso de variables categoricas no numericas creando las variables z1, Z2, Z3 y Z4 para las Zonas y las variables E1, E2, E3, E4 y E5 para los estratos.
Se realiza el filtro para el caso vivienda 1 y se ordena por precio en orden ascendente y se extraen los primeros 3 resultados segun lo solicitado en el caso de estudio.
Se realiza la consulta para el caso de vivienda 2 aplicando el filtro sugerido segun lo solicitado en el caso de estudio.
Se crea mapa interactivo con las opciones del caso vivienda1 y la demarcacion de la Zona norte de la ciudad de cali.
| Unique (#) | Missing (%) | Mean | SD | Min | Median | Max | ||
|---|---|---|---|---|---|---|---|---|
| id | 39 | 0 | 2913.9 | 1927.5 | 766.0 | 2544.0 | 7471.0 | |
| estrato | 2 | 0 | 4.6 | 0.5 | 4.0 | 5.0 | 5.0 | |
| preciom | 13 | 0 | 328.8 | 27.9 | 230.0 | 340.0 | 350.0 | |
| areaconst | 27 | 0 | 251.5 | 41.5 | 200.0 | 249.0 | 355.0 | |
| parqueaderos | 3 | 0 | 1.9 | 0.5 | 1.0 | 2.0 | 3.0 | |
| banios | 5 | 0 | 3.8 | 1.0 | 2.0 | 4.0 | 6.0 | |
| habitaciones | 5 | 0 | 4.7 | 1.0 | 4.0 | 4.0 | 8.0 | |
| longitud | 36 | 0 | -76.5 | 0.0 | -76.5 | -76.5 | -76.5 | |
| latitud | 39 | 0 | 3.5 | 0.0 | 3.4 | 3.5 | 3.5 | |
| Z1 | 1 | 0 | 1.0 | 0.0 | 1.0 | 1.0 | 1.0 | |
| Z2 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
| Z3 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
| Z4 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
| E0 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
| E1 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
| E2 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | |
| E3 | 2 | 0 | 0.4 | 0.5 | 0.0 | 0.0 | 1.0 | |
| E4 | 2 | 0 | 0.6 | 0.5 | 0.0 | 1.0 | 1.0 | |
| E5 | 1 | 0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
## Rows: 39
## Columns: 22
## $ id <dbl> 7471, 4210, 4267, 4800, 4209, 4422, 4458, 4483, 852, 1009…
## $ zona <chr> "Zona Norte", "Zona Norte", "Zona Norte", "Zona Norte", "…
## $ estrato <dbl> 4, 5, 5, 5, 5, 5, 4, 5, 5, 5, 5, 4, 4, 4, 5, 5, 5, 5, 4, …
## $ preciom <dbl> 330, 350, 335, 340, 350, 350, 315, 342, 340, 250, 350, 34…
## $ areaconst <dbl> 240, 200, 202, 250, 300, 240, 270, 250, 208, 243, 203, 20…
## $ parqueaderos <dbl> 2, 3, 1, 2, 3, 2, 2, 1, 2, 1, 2, 2, 3, 2, 2, 2, 2, 2, 2, …
## $ banios <dbl> 4, 3, 4, 4, 5, 3, 4, 4, 6, 4, 2, 4, 4, 6, 5, 3, 4, 4, 3, …
## $ habitaciones <dbl> 4, 4, 5, 4, 6, 6, 4, 6, 4, 5, 5, 4, 4, 4, 6, 4, 4, 4, 4, …
## $ tipo <chr> "Casa", "Casa", "Casa", "Casa", "Casa", "Casa", "Casa", "…
## $ barrio <chr> "acopi", "el bosque", "el bosque", "el bosque", "el bosqu…
## $ longitud <dbl> -76.54980, -76.53010, -76.53044, -76.53300, -76.53010, -7…
## $ latitud <dbl> 3.39758, 3.48503, 3.48399, 3.46500, 3.48577, 3.48635, 3.4…
## $ Z1 <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …
## $ Z2 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ Z3 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ Z4 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E0 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E1 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E2 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ E3 <dbl> 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, …
## $ E4 <dbl> 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, …
## $ E5 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
Se realiza un analisis exploratorio para visualizar la distribucion y el comportamiento de las variables numericas del caso vivienda 1
Se realiza un analisis de correlaciones de las variables predictorias y la variable de interes evidenciando que existe una correlacion muy baja debido a la poca cantidad de datos luego de aplicado el filtro, este analisis debe ser complementado ya que no es concluyente para el ejercicio planteado, por lo cual se realizan algunos analisis de correlacion de tipo individual entre la variable de interes y cada variable predictorias para tener mayor informacion del comportamiento de cada una de ellas.
Se realiza un mapa de calor de correlaciones para obtener informacion mas detallada y visualmente agradable al publico.
##
## Call:
## lm(formula = preciom ~ areaconst + banios + habitaciones + Z1 +
## E2 + E3 + E4, data = Hc)
##
## Residuals:
## Min 1Q Median 3Q Max
## -89.492 -9.787 6.433 15.661 33.904
##
## Coefficients: (3 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 327.9713 33.7337 9.722 2.39e-11 ***
## areaconst 0.1690 0.1223 1.382 0.176
## banios -2.5165 4.8015 -0.524 0.604
## habitaciones -5.3647 5.2998 -1.012 0.319
## Z1 NA NA NA NA
## E2 NA NA NA NA
## E3 -16.3446 9.7493 -1.676 0.103
## E4 NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 27.58 on 34 degrees of freedom
## Multiple R-squared: 0.1236, Adjusted R-squared: 0.02046
## F-statistic: 1.198 on 4 and 34 DF, p-value: 0.3293
El modelo de regresión lineal múltiple estimado no muestra resultados estadísticamente significativos para las variables incluidas. Adicionalmente, el R-cuadrado es bajo (0.123), lo que sugiere que las variables en el modelo tienen una capacidad limitada (12.36%)para explicar la variabilidad en los precios de las viviendas. Se podrían explorar otras variables o enfoques de modelado para mejorar la capacidad del modelo para predecir los precios de las viviendas de manera más precisa.
El método “forward” no encontró ninguna combinación de variables predictoras que mejorara significativamente el modelo en comparación con el modelo constante (intercepto solo). Esto podría ser una indicacion de que las variables predictoras seleccionadas inicialmente no están bien correlacionadas con la variable respuesta (precio) o que el conjunto de datos es demasiado pequeño (38) para realizar una selección efectiva de variables. Se podría considerar explorar otras variables o métodos de selección de características para mejorar el modelo.
##
## Call:
## lm(formula = preciom ~ 1, data = Hc)
##
## Residuals:
## Min 1Q Median 3Q Max
## -98.821 -8.321 11.179 21.179 21.179
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 328.821 4.462 73.7 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 27.86 on 38 degrees of freedom
El resumen realizado con la funcion forward muestra que los valores del intercepto son los valores con mayor significancia en el modelo de regresion.
##
## Call:
## lm(formula = preciom ~ areaconst + banios + habitaciones + Z1 +
## E2 + E3 + E4, data = Hc, subset = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -73.873 -11.044 6.609 20.803 34.068
##
## Coefficients: (3 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 263.9732 53.9429 4.894 0.000293 ***
## areaconst 0.5998 0.2878 2.084 0.057422 .
## banios 5.1368 8.1098 0.633 0.537458
## habitaciones -21.2785 11.8869 -1.790 0.096746 .
## Z1 NA NA NA NA
## E2 NA NA NA NA
## E3 -40.2522 20.0571 -2.007 0.066022 .
## E4 NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 31.68 on 13 degrees of freedom
## Multiple R-squared: 0.3062, Adjusted R-squared: 0.09266
## F-statistic: 1.434 on 4 and 13 DF, p-value: 0.2779
Se entrena un modelo para que tome muestras y realice el calculo de los coeficientes y los estadisticos de prueba, sin embargo nos sigue mostrando que continua siendo el intercepto el de mayor significancia en el modelo y adicionalmente se evidencia que el modelo solo explica el 30.06% a traves de las variables predictorias la variable de interes preciom.
## [1] 1480.806
El MSE de 1480.806 sugiere que el modelo podría no estar ajustando muy bien los datos de prueba, ya que el Error Cuadratico Medio es relativamente alto. Esto significa que las predicciones del modelo pueden estar bastante alejadas de los valores reales en el conjunto de prueba.
Es importante considerar este resultado en el contexto de los datos y el problema en cuestión. Si el MSE es demasiado alto y las predicciones del modelo son inexactas, podría ser necesario revisar y mejorar el modelo, considerar diferentes características o técnicas de modelado, o realizar un análisis más detenido para entender mejor las razones detrás de las discrepancias.
El análisis de validación cruzada dado que los valores de MSE están distribuidos alrededor del valor de referencia 1, y no hay un patrón evidente de sesgo o varianza extrema, esto sugiere que el modelo podría estar proporcionando predicciones razonablemente estables en diferentes conjuntos de datos de prueba.
Al aplicar el metodo Bootstrap se obtienen los rangos para los coeficientes de las variables lo que indica que los valores de estos coeficientes podrian estar en dicho rango con una alta probabilidad, lo que permite una mejor toma de desicion al seleccionar el modelo, por otro lado los datos no se muestran en forma de campana y puede deberse al tamaño de la muestra que para el caso de Hc es de aproximadamente 39 observaciones, sesgos en los datos, multicolinealidas en las variables o ruido en los datos.
##
## ORDINARY NONPARAMETRIC BOOTSTRAP
##
##
## Call:
## boot(data = Hc, statistic = fun_coeficientes, R = 2000)
##
##
## Bootstrap Statistics :
## original bias std. error
## t1* 422.99461602 0 0
## t2* 0.01364138 0 0
## t3* -4.59389765 0 0
## t4* -17.95661798 0 0
## t7* -7.17902859 0 0
## WARNING: All values of t5* are NA
## WARNING: All values of t6* are NA
## WARNING: All values of t8* are NA
Al aplicar el estadistico Boots podemos observar que el bias es cero(0) lo que nos indica que no existe sesgo entre las estadisticas originales y las estadisticas bootstrap, sin embargo los errores estandar con valores cero(0) sugieren algun tipo de error ya que es poco probable que no exista variabilidad entre las estadisticas bootstrap en diferentes muestreos.
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 327.9712685 33.7336506 9.7223770 2.387046e-11
## areaconst 0.1689544 0.1222945 1.3815376 1.761256e-01
## banios -2.5164806 4.8014556 -0.5241079 6.036037e-01
## habitaciones -5.3646655 5.2998426 -1.0122311 3.185772e-01
## E3 -16.3446143 9.7493386 -1.6764844 1.028162e-01
Despues de realizar el resumen del modelo ajustado de los coeficientes se evidencia que el intercepto, areaconst, E2, E3 y E4 son significativos, sin embargo estos 3 ultimos de manera decreciente.
| r.squared | adj.r.squared | sigma | statistic | p.value | df | logLik | AIC | BIC | deviance | df.residual | nobs |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0.12 | 0.02 | 27.58 | 1.20 | 0.33 | 4 | -182.03 | 376.05 | 386.03 | 25856.12 | 34 | 39 |
| 0.05 | -0.03 | 28.28 | 0.63 | 0.60 | 3 | -183.57 | 377.15 | 385.47 | 27993.51 | 35 | 39 |
| 0.07 | 0.02 | 27.58 | 1.39 | 0.26 | 2 | -183.14 | 374.29 | 380.94 | 27384.19 | 36 | 39 |
| 0.07 | 0.02 | 27.58 | 1.39 | 0.26 | 2 | -183.14 | 374.29 | 380.94 | 27384.19 | 36 | 39 |
| 0.01 | -0.01 | 28.03 | 0.54 | 0.47 | 1 | -184.32 | 374.63 | 379.62 | 29079.46 | 37 | 39 |
La validacion realizada con la tabla comparativa de los diferentes modelos de regresion muestra que los modelos no son lo suficiente mente significativos para explicar la variable de interes.
##
## ===================================================================
## Dependent variable:
## ------------------------------------------------------
## preciom
## modelo0 modelo1 modelo2 modelo3 modelo4
## -------------------------------------------------------------------
## areaconst 0.169 0.097 0.125 0.125 0.080
## (0.122) (0.117) (0.112) (0.112) (0.110)
##
## banios -2.516 -3.766
## (4.801) (4.864)
##
## habitaciones -5.365 -2.768
## (5.300) (5.198)
##
## Z1
##
##
## E2
##
##
## E3 -16.345
## (9.749)
##
## E4 13.905 13.905
## (9.314) (9.314)
##
## Constant 327.971*** 331.796*** 289.232*** 289.232*** 308.608***
## (33.734) (34.516) (30.396) (30.396) (27.938)
##
## -------------------------------------------------------------------
## Observations 39 39 39 39 39
## R2 0.124 0.051 0.072 0.072 0.014
## Adjusted R2 0.020 -0.030 0.020 0.020 -0.012
## ===================================================================
## Note: *p<0.05; **p<0.01; ***p<0.001