1 Introducción

El presente informe tiene como propósito apoyar a María, gerente de la firma C&A (Casas y Apartamentos), en la atención de una solicitud corporativa para la compra de dos viviendas en la ciudad de Cali. Para ello, se desarrolla un análisis basado en técnicas de regresión lineal múltiple.

El estudio se divide en dos casos:

  • Vivienda 1: Casa, zona norte, área construida de 200 m², 1 parqueadero, 2 baños, 4 habitaciones, estrato 4 o 5 y presupuesto máximo de 350 millones de pesos.

  • Vivienda 2: Apartamento, zona sur, área construida de 300 m², 3 parqueaderos, 3 baños, 5 habitaciones, estrato 5 o 6 y presupuesto máximo de 850 millones de pesos.

2 Librerías y carga de datos

## Rows: 8,322
## Columns: 13
## $ id           <dbl> 1147, 1169, 1350, 5992, 1212, 1724, 2326, 4386, 1209, 159…
## $ zona         <chr> "Zona Oriente", "Zona Oriente", "Zona Oriente", "Zona Sur…
## $ piso         <chr> NA, NA, NA, "02", "01", "01", "01", "01", "02", "02", "02…
## $ estrato      <dbl> 3, 3, 3, 4, 5, 5, 4, 5, 5, 5, 6, 4, 5, 6, 4, 5, 5, 4, 5, …
## $ preciom      <dbl> 250, 320, 350, 400, 260, 240, 220, 310, 320, 780, 750, 62…
## $ areaconst    <dbl> 70, 120, 220, 280, 90, 87, 52, 137, 150, 380, 445, 355, 2…
## $ parqueaderos <dbl> 1, 1, 2, 3, 1, 1, 2, 2, 2, 2, NA, 3, 2, 2, 1, 4, 2, 2, 2,…
## $ banios       <dbl> 3, 2, 2, 5, 2, 3, 2, 3, 4, 3, 7, 5, 6, 2, 4, 4, 4, 3, 2, …
## $ habitaciones <dbl> 6, 3, 4, 3, 3, 3, 3, 4, 6, 3, 6, 5, 6, 2, 5, 5, 4, 3, 3, …
## $ tipo         <chr> "Casa", "Casa", "Casa", "Casa", "Apartamento", "Apartamen…
## $ barrio       <chr> "20 de julio", "20 de julio", "20 de julio", "3 de julio"…
## $ longitud     <dbl> -76.51168, -76.51237, -76.51537, -76.54000, -76.51350, -7…
## $ latitud      <dbl> 3.43382, 3.43369, 3.43566, 3.43500, 3.45891, 3.36971, 3.4…

3 Diccionario de variables

La base vivienda contiene información de ofertas inmobiliarias en Cali para los últimos tres meses. Las variables relevantes para este estudio son:

  • zona: ubicación de la vivienda.

  • estrato: estrato socioeconómico.

  • preciom: precio de la vivienda en millones de pesos.

  • areaconst: área construida.

  • parqueaderos: número de parqueaderos.

  • banios: número de baños.

  • habitaciones: número de habitaciones.

  • tipo: casa o apartamento.

  • barrio: barrio de ubicación.

  • longitud y latitud: coordenadas geográficas.

La variable respuesta en ambos modelos es preciom.

4 Depuración inicial y validación general de la base

4.1 Estructura general y valores faltantes

## [1] 8322   13
Valores faltantes por variable
variable n_faltantes porcentaje
id id 3 0.04
zona zona 3 0.04
piso piso 2638 31.70
estrato estrato 3 0.04
preciom preciom 2 0.02
areaconst areaconst 3 0.04
parqueaderos parqueaderos 1605 19.29
banios banios 3 0.04
habitaciones habitaciones 3 0.04
tipo tipo 3 0.04
barrio barrio 3 0.04
longitud longitud 3 0.04
latitud latitud 3 0.04

4.2 Estandarización básica y selección de variables de interés

##      zona               piso              estrato         preciom      
##  Length:8322        Length:8322        Min.   :3.000   Min.   :  58.0  
##  Class :character   Class :character   1st Qu.:4.000   1st Qu.: 220.0  
##  Mode  :character   Mode  :character   Median :5.000   Median : 330.0  
##                                        Mean   :4.634   Mean   : 433.9  
##                                        3rd Qu.:5.000   3rd Qu.: 540.0  
##                                        Max.   :6.000   Max.   :1999.0  
##                                        NA's   :3       NA's   :2       
##    areaconst       parqueaderos        banios        habitaciones   
##  Min.   :  30.0   Min.   : 1.000   Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:  80.0   1st Qu.: 1.000   1st Qu.: 2.000   1st Qu.: 3.000  
##  Median : 123.0   Median : 2.000   Median : 3.000   Median : 3.000  
##  Mean   : 174.9   Mean   : 1.835   Mean   : 3.111   Mean   : 3.605  
##  3rd Qu.: 229.0   3rd Qu.: 2.000   3rd Qu.: 4.000   3rd Qu.: 4.000  
##  Max.   :1745.0   Max.   :10.000   Max.   :10.000   Max.   :10.000  
##  NA's   :3        NA's   :1605     NA's   :3        NA's   :3       
##      tipo              barrio             longitud         latitud     
##  Length:8322        Length:8322        Min.   :-76.59   Min.   :3.333  
##  Class :character   Class :character   1st Qu.:-76.54   1st Qu.:3.381  
##  Mode  :character   Mode  :character   Median :-76.53   Median :3.416  
##                                        Mean   :-76.53   Mean   :3.418  
##                                        3rd Qu.:-76.52   3rd Qu.:3.452  
##                                        Max.   :-76.46   Max.   :3.498  
##                                        NA's   :3        NA's   :3

4.3 Eliminación de registros con faltantes en variables críticas

## [1] 6717   12

En esta etapa se depuró la base eliminando registros con información faltante en variables esenciales para el análisis y para la estimación de los modelos. Esto se debe a que la variable respuesta y los predictores principales deben estar completos para poder realizar inferencia, validación y predicción de forma consistente.

5 Validación espacial de las zonas

Este gráfico permite verificar de manera visual si la etiqueta de zona es razonablemente consistente con la localización geográfica de los inmuebles. En términos generales, se observan concentraciones espaciales diferenciadas por zona, lo que respalda la utilidad de esta variable como criterio de segmentación para el análisis.

No obstante, también se aprecia cierto solapamiento espacial entre algunas zonas, especialmente en sectores donde puntos clasificados como Zona Oeste o Zona Sur aparecen próximos a conglomerados dominados por Zona Norte. Este comportamiento no se interpretó automáticamente como un error de codificación, ya que los límites urbanos reales no necesariamente siguen separaciones lineales en latitud o longitud, y el mapa de dispersión utilizado no incorpora fronteras oficiales de las zonas ni polígonos administrativos.

Por esta razón, no se consideró metodológicamente apropiado recodificar observaciones de manera manual solo a partir de inspección visual. En consecuencia, se decidió mantener la clasificación original de la variable zona y utilizar el mapa como una validación espacial del filtro, reconociendo como limitación la posible existencia de áreas de transición o de observaciones geográficamente ambiguas.

Así, la variable zona se conserva como criterio de segmentación inicial del estudio, mientras que la interpretación de los resultados se realiza con cautela, entendiendo que dentro de cada macrozona pueden coexistir submercados con comportamientos heterogéneos.

Para evitar introducir sesgos por recodificación subjetiva, no se modificó manualmente la variable zona.

6 Caso 1: Vivienda 1 - Casa en zona norte

6.1 Filtro del caso 1

## [1] 435  12
Primeros 3 registros - Caso 1
zona piso estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud
Zona Norte 02 5 320 150 2 4 6 Casa acopi -76.51341 3.47968
Zona Norte 02 5 780 380 2 3 3 Casa acopi -76.51674 3.48721
Zona Norte 02 4 625 355 3 5 5 Casa acopi -76.53179 3.40590
Comprobación del filtro - Caso 1
tipo zona n
Casa Zona Norte 435

6.2 Mapa del caso 1

El filtro aplicado para el caso 1 permitió identificar 435 viviendas tipo casa ubicadas en la Zona Norte, lo cual confirma que se dispone de un subconjunto suficientemente amplio para el análisis estadístico y la modelación. El mapa de puntos muestra la distribución espacial de estas ofertas y cumple la función de validar visualmente la coherencia geográfica del filtro aplicado. En términos generales, la concentración de observaciones es consistente con la macrozona norte; sin embargo, la dispersión espacial observada sugiere que la categoría “Zona Norte” agrupa barrios con heterogeneidad importante en ubicación, entorno urbano y nivel de valorización. Por tanto, aunque el filtro por zona es metodológicamente válido, debe reconocerse que dentro de esta misma zona coexisten submercados con comportamientos de precio diferentes.

6.3 Análisis exploratorio de datos - Caso 1

El análisis exploratorio del caso 1 se orienta a evaluar la relación entre el precio de la vivienda y las variables explicativas propuestas en el enunciado: área construida, estrato, número de baños, número de habitaciones y número de parqueaderos. Dado que el caso ya fue filtrado a casas de la Zona Norte, la variable zona se utiliza aquí como criterio de segmentación del análisis y no como variable explicativa interna.

6.3.1 Resumen descriptivo

##     preciom         areaconst         estrato       parqueaderos   
##  Min.   :  89.0   Min.   :  30.0   Min.   :3.000   Min.   : 1.000  
##  1st Qu.: 330.0   1st Qu.: 170.5   1st Qu.:4.000   1st Qu.: 1.000  
##  Median : 425.0   Median : 264.5   Median :5.000   Median : 2.000  
##  Mean   : 479.8   Mean   : 292.7   Mean   :4.455   Mean   : 2.182  
##  3rd Qu.: 582.5   3rd Qu.: 357.0   3rd Qu.:5.000   3rd Qu.: 3.000  
##  Max.   :1940.0   Max.   :1440.0   Max.   :6.000   Max.   :10.000  
##      banios        habitaciones   
##  Min.   : 0.000   Min.   : 0.000  
##  1st Qu.: 3.000   1st Qu.: 4.000  
##  Median : 4.000   Median : 4.000  
##  Mean   : 3.782   Mean   : 4.809  
##  3rd Qu.: 5.000   3rd Qu.: 5.000  
##  Max.   :10.000   Max.   :10.000

6.3.2 Gráficos

6.3.3 Asociación entre la respuesta y las variables explicativas

  • Normalidad de la respuesta
## 
##  Shapiro-Wilk normality test
## 
## data:  caso1$preciom
## W = 0.86086, p-value < 2.2e-16
  • Correlación para variables cuantitativas
Correlaciones de Spearman - Caso 1
variable rho_spearman p_value
areaconst 0.7775 0
banios 0.5626 0
habitaciones 0.3734 0
parqueaderos 0.4782 0
  • Asociación entre precio y estrato
##              Df   Sum Sq Mean Sq F value Pr(>F)    
## estrato_f     3  7409108 2469703   57.03 <2e-16 ***
## Residuals   431 18662886   43301                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Kruskal-Wallis rank sum test
## 
## data:  preciom by estrato_f
## Kruskal-Wallis chi-squared = 170.07, df = 3, p-value < 2.2e-16

En el caso de las casas ubicadas en la Zona Norte, la variable respuesta preciom no presentó normalidad según la prueba de Shapiro-Wilk (W = 0.86086, p < 2.2e-16), por lo que resulta apropiado complementar el análisis con métodos no paramétricos y medidas robustas como la correlación de Spearman. Los resultados muestran que la variable con mayor asociación con el precio es el área construida (rho = 0.7775), seguida por el número de baños (rho = 0.5626) y el número de parqueaderos (rho = 0.4782). La asociación con el número de habitaciones también es positiva, aunque comparativamente más moderada (rho = 0.3734). Todas estas relaciones resultaron estadísticamente significativas (p < 0.001), lo que indica que, en términos bivariados, mayores dimensiones y mejores atributos funcionales tienden a estar asociados con viviendas de mayor precio.

Respecto al estrato, tanto el ANOVA (F = 57.03, p < 2e-16) como la prueba no paramétrica de Kruskal-Wallis (chi-cuadrado = 170.07, p < 2.2e-16) evidencian diferencias estadísticamente significativas en el precio entre niveles de estrato. Esto indica que el estrato sí introduce segmentación relevante en el mercado de casas de la Zona Norte y, por tanto, debe ser considerado en la modelación. En conjunto, el análisis exploratorio sugiere que el precio está principalmente explicado por tamaño, nivel socioeconómico y dotación del inmueble, con una relación visual y estadística especialmente fuerte en el área construida.

Antes de estimar el modelo, es importante aclarar que la variable zona no se incluye como predictor dentro de cada caso, ya que el análisis se realizó sobre subconjuntos previamente filtrados a una única zona geográfica. En consecuencia, dentro de cada caso esta variable no presenta variación y no aporta información adicional al modelo de regresión.

Aunque estrato es, por naturaleza, una variable categórica ordinal, en este estudio se decidió evaluarlo de dos maneras en la etapa de modelación: como variable numérica y como factor. Esta decisión se tomó con el fin de contrastar si su efecto sobre el precio podía aproximarse mediante una tendencia creciente lineal o si, por el contrario, requería una representación categórica más flexible. En consecuencia, el tratamiento final de estrato en cada caso no se definió únicamente por su naturaleza de medición, sino también por criterios de ajuste, capacidad predictiva, parsimonia e interpretabilidad del modelo.

6.4 Estimación y comparación de modelos - Caso 1

6.4.1 División entrenamiento / prueba

## [1] 304  13
## [1] 131  13

6.4.2 Ajuste de modelos

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -820.05  -82.01  -16.44   59.88  927.66 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -298.9580    56.1527  -5.324 2.00e-07 ***
## areaconst       0.7009     0.0626  11.196  < 2e-16 ***
## estrato        88.6349    12.0653   7.346 1.96e-12 ***
## habitaciones    9.5859     6.8033   1.409  0.15988    
## parqueaderos   21.8842     7.0529   3.103  0.00210 ** 
## banios         24.0205     9.1262   2.632  0.00893 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159 on 298 degrees of freedom
## Multiple R-squared:  0.618,  Adjusted R-squared:  0.6116 
## F-statistic: 96.44 on 5 and 298 DF,  p-value: < 2.2e-16
## 
## Call:
## lm(formula = preciom ~ areaconst + factor(estrato) + habitaciones + 
##     parqueaderos + banios, data = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -834.89  -85.52  -14.56   56.43  931.19 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      -20.6593    33.7099  -0.613  0.54044    
## areaconst          0.7025     0.0624  11.259  < 2e-16 ***
## factor(estrato)4  60.8866    30.5540   1.993  0.04721 *  
## factor(estrato)5 149.7487    27.9055   5.366 1.62e-07 ***
## factor(estrato)6 315.2393    47.7024   6.608 1.80e-10 ***
## habitaciones       8.6590     6.8271   1.268  0.20568    
## parqueaderos      22.8799     7.0416   3.249  0.00129 ** 
## banios            26.1028     9.3560   2.790  0.00561 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 158.4 on 296 degrees of freedom
## Multiple R-squared:  0.6236, Adjusted R-squared:  0.6147 
## F-statistic: 70.05 on 7 and 296 DF,  p-value: < 2.2e-16

6.4.3 Comparación de modelos

Comparación de modelos - Caso 1
modelo R2_ajustado AIC RMSE_test MAE_test R2_pred_test
Estrato numérico 0.6116 3952.622 148.7318 97.1848 0.5387
Estrato como factor 0.6147 3952.193 151.9332 96.9536 0.5187
## [1] "num"

Para el caso 1 se compararon dos especificaciones: una con estrato como variable numérica y otra con estrato como factor. Aunque el modelo con estrato como factor obtuvo un R² ajustado ligeramente superior (0.6147 frente a 0.6116) y un AIC marginalmente menor, el modelo con estrato numérico presentó mejor desempeño predictivo en muestra de prueba, con menor RMSE y mejor R² predictivo. En consecuencia, se seleccionó como modelo final la especificación con estrato tratado numéricamente, privilegiando su mejor capacidad predictiva y mayor parsimonia. Si bien estrato corresponde conceptualmente a una variable ordinal, en este caso su especificación numérica ofreció una aproximación adecuada y más parsimoniosa, con un desempeño predictivo ligeramente superior al observado cuando se trató como factor.

6.4.4 Modelo final del caso 1

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -820.05  -82.01  -16.44   59.88  927.66 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -298.9580    56.1527  -5.324 2.00e-07 ***
## areaconst       0.7009     0.0626  11.196  < 2e-16 ***
## estrato        88.6349    12.0653   7.346 1.96e-12 ***
## habitaciones    9.5859     6.8033   1.409  0.15988    
## parqueaderos   21.8842     7.0529   3.103  0.00210 ** 
## banios         24.0205     9.1262   2.632  0.00893 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159 on 298 degrees of freedom
## Multiple R-squared:  0.618,  Adjusted R-squared:  0.6116 
## F-statistic: 96.44 on 5 and 298 DF,  p-value: < 2.2e-16

El modelo final estimado para el caso 1 fue:

\[ preciom = \beta_0 + \beta_1 areaconst + \beta_2 estrato + \beta_3 habitaciones + \beta_4 parqueaderos + \beta_5 banios \]

Los resultados muestran que el área construida es el predictor más importante del precio y su coeficiente fue positivo y altamente significativo (β = 0.7009, p < 2e-16). Esto significa que, manteniendo constantes las demás variables, cada metro cuadrado adicional incrementa en promedio el precio esperado en 0.70 millones de pesos. El estrato también resultó positivo y altamente significativo (β = 88.63, p < 0.001), lo que indica que pasar a un estrato superior se asocia con un aumento promedio de aproximadamente 88.6 millones de pesos, controlando por área, habitaciones, parqueaderos y baños.

El número de parqueaderos presentó un efecto positivo y significativo (β = 21.88, p = 0.0021), al igual que el número de baños (β = 24.02, p = 0.0089). En términos de mercado, esto sugiere que la disponibilidad de estacionamiento y una mayor dotación de baños son atributos valorados por los compradores de casas en esta zona. En cambio, el coeficiente asociado al número de habitaciones fue positivo pero no estadísticamente significativo (p = 0.1599), lo cual sugiere que, una vez controlado el tamaño total de la vivienda y sus demás características, el número de habitaciones no aporta evidencia suficiente para explicar diferencias adicionales de precio. Esto es razonable, porque parte de su efecto puede estar ya absorbido por el área construida.

El ajuste global del modelo es moderado, con R² ajustado = 0.6116, lo que significa que alrededor del 61.2 % de la variabilidad del precio se explica por las variables incluidas. Este nivel de ajuste es aceptable para un mercado inmobiliario, donde el precio también depende de factores no observados en la base, como acabados, antigüedad, estado de conservación, tamaño del lote, seguridad del sector, proximidad a servicios y reputación del barrio.

6.4.5 Interpretación de R²

El coeficiente de determinación R² indica la proporción de la variabilidad del precio explicada por las variables incluidas en el modelo. Por su parte, el R² ajustado corrige por el número de predictores y resulta más apropiado para comparar modelos. Un valor moderado de R² no invalida el modelo, dado que el precio inmobiliario también depende de factores no observados, como acabados, antigüedad, administración, seguridad, cercanía a equipamientos urbanos o prestigio del barrio.

6.5 Validación de supuestos - Caso 1

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(mod_final_c1)
## W = 0.88054, p-value = 1.173e-14
## 
##  studentized Breusch-Pagan test
## 
## data:  mod_final_c1
## BP = 77.254, df = 5, p-value = 3.148e-15
## 
##  Durbin-Watson test
## 
## data:  mod_final_c1
## DW = 2.0314, p-value = 0.6054
## alternative hypothesis: true autocorrelation is greater than 0
##    areaconst      estrato habitaciones parqueaderos       banios 
##     1.442014     1.262229     1.637818     1.203020     1.747273

La validación de supuestos del modelo del caso 1 muestra resultados mixtos. En primer lugar, los residuos no siguen una distribución normal según Shapiro-Wilk (W = 0.88054, p = 1.173e-14), lo cual sugiere desviaciones respecto al supuesto de normalidad. En segundo lugar, la prueba de Breusch-Pagan fue significativa (BP = 77.254, p = 3.148e-15), por lo que existe evidencia de heterocedasticidad, es decir, la variabilidad de los residuos no es constante a lo largo de los valores ajustados. Esto implica que, aunque el modelo sigue siendo útil para predicción exploratoria, la inferencia clásica sobre errores estándar debe interpretarse con cautela.

Por el contrario, no se encontró evidencia de autocorrelación positiva de residuos, ya que la prueba de Durbin-Watson arrojó DW = 2.0314 con p = 0.6054, valor compatible con independencia. Asimismo, los factores de inflación de varianza fueron bajos (todos alrededor de 1 a 1.75), lo que indica que no existe un problema serio de multicolinealidad entre los predictores. En síntesis, los principales incumplimientos del modelo se concentran en normalidad y homocedasticidad, no en independencia ni en colinealidad.

Como mejora futura, sería recomendable evaluar transformaciones sobre preciom, por ejemplo log(preciom), emplear errores estándar robustos y considerar segmentaciones más finas por subzonas o barrios.

6.6 Predicción para la solicitud de la vivienda 1

La solicitud indica estrato 4 o 5, por lo cual se generan dos escenarios de predicción.

Predicción de precio - Vivienda 1
escenario fit lwr upr
1 Estrato 4 304.03 -10.46 618.52
11 Estrato 5 392.66 77.29 708.03

Para la vivienda 1 se evaluaron dos escenarios, correspondientes a los estratos permitidos por el cliente. La predicción puntual fue de aproximadamente 304.03 millones para estrato 4 y de 392.66 millones para estrato 5. Estos resultados muestran que la solicitud es viable en términos puntuales para estrato 4, ya que la estimación se ubica por debajo del presupuesto máximo de 350 millones. En contraste, para estrato 5 la predicción supera el tope presupuestal, lo que sugiere que mantener simultáneamente las características solicitadas y ubicarse en estrato 5 sería más difícil dentro del presupuesto disponible.

No obstante, los intervalos de predicción son amplios, lo cual indica incertidumbre considerable alrededor del valor esperado individual. Por esta razón, la conclusión más prudente es que la solicitud de la vivienda 1 es parcialmente viable: resulta realista si se privilegia el estrato 4 o si se aceptan ofertas muy cercanas al techo presupuestal, pero se vuelve más exigente cuando se pretende una casa de estrato 5 con todas las especificaciones dadas.

Adicionalmente, debe señalarse que el intervalo de predicción del escenario de estrato 4 presenta un límite inferior no interpretable en términos económicos. Esto no implica un error del procedimiento, sino una consecuencia de la amplitud de la incertidumbre del modelo lineal bajo alta dispersión de los datos. Por ello, la interpretación debe centrarse en la predicción puntual y en la lectura general de viabilidad, más que en una interpretación literal de todos los extremos del intervalo.

6.7 Selección de ofertas potenciales - Caso 1

Cinco ofertas potenciales - Caso 1
zona piso estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud estrato_f score
Zona Norte NA 5 350 216 2 2 4 Casa la merced -76.51 3.48 5 36
Zona Norte NA 5 350 203 2 2 5 Casa el bosque -76.51 3.49 5 38
Zona Norte 01 5 340 203 2 3 4 Casa vipasa -76.52 3.48 5 43
Zona Norte NA 5 350 190 1 3 3 Casa la flora -76.52 3.49 5 45
Zona Norte 01 5 335 220 1 3 3 Casa el bosque -76.53 3.49 5 55

Las cinco ofertas seleccionadas para el caso 1 se concentran en barrios como La Merced, El Bosque, Vipasa y La Flora, con precios entre 335 y 350 millones y áreas entre 190 y 220 m², es decir, bastante próximas a la meta de 200 m². Entre ellas, destacan especialmente: una oferta en La Merced de 216 m² por 350 millones, otra en El Bosque de 203 m² por 350 millones, una en Vipasa de 203 m² por 340 millones, una en La Flora de 190 m² por 350 millones y otra en El Bosque de 220 m² por 335 millones. Estas alternativas muestran que sí existen opciones cercanas al perfil solicitado dentro del presupuesto, aunque no todas cumplen de manera exacta cada atributo.

Desde el punto de vista comercial, la mejor alternativa parece ser la oferta de La Merced, por su cercanía simultánea en área, precio y número de habitaciones. La opción de El Bosque con 203 m² también es altamente competitiva, aunque tiene 2 parqueaderos y 5 habitaciones, lo que la hace ligeramente distinta del perfil objetivo. La oferta de Vipasa constituye una buena opción por precio, pero incorpora un baño adicional y 2 parqueaderos. En consecuencia, puede concluirse que el mercado sí ofrece opciones razonablemente compatibles con la solicitud, pero con un margen de maniobra reducido: para mantenerse en el presupuesto, el cliente probablemente deberá aceptar pequeñas desviaciones en parqueaderos, baños o número de habitaciones.

7 Caso 2: Vivienda 2 - Apartamento en zona sur

7.1 Filtro del caso 2

## [1] 2381   12
Primeros 3 registros - Caso 2
zona piso estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud
Zona Sur 05 4 290 96 1 2 3 Apartamento acopi -76.53464 3.44987
Zona Sur 02 3 78 40 1 1 2 Apartamento aguablanca -76.50100 3.40000
Zona Sur NA 6 875 194 2 5 3 Apartamento aguacatal -76.55700 3.45900
Comprobación del filtro - Caso 2
tipo zona n
Apartamento Zona Sur 2381

7.2 Mapa del caso 2

El filtro del caso 2 identificó 2,381 apartamentos en la Zona Sur, lo que constituye una base robusta para el análisis y confirma que este segmento del mercado tiene una oferta mucho más amplia que la observada en el caso 1. La representación espacial muestra una dispersión compatible con la extensión geográfica de la macrozona sur y sugiere la coexistencia de submercados diferenciados dentro de esta misma zona. En consecuencia, aunque el filtro por zona es válido y útil para responder la solicitud, debe reconocerse que la Zona Sur no es homogénea en términos de valorización ni de perfil de oferta.

7.3 Análisis exploratorio de datos - Caso 2

En el caso 2, el análisis exploratorio se enfoca en la relación entre el precio del apartamento y las variables estructurales definidas en el problema: área construida, estrato, número de baños, número de habitaciones y número de parqueaderos. Como el subconjunto ya fue filtrado a apartamentos de la Zona Sur, la variable zona opera como criterio de segmentación y no como predictor dentro del modelo.

7.3.1 Resumen descriptivo

##     preciom         areaconst        estrato       parqueaderos   
##  Min.   :  78.0   Min.   : 40.0   Min.   :3.000   Min.   : 1.000  
##  1st Qu.: 205.0   1st Qu.: 71.0   1st Qu.:4.000   1st Qu.: 1.000  
##  Median : 260.0   Median : 90.0   Median :5.000   Median : 1.000  
##  Mean   : 318.2   Mean   :102.2   Mean   :4.748   Mean   : 1.415  
##  3rd Qu.: 350.0   3rd Qu.:113.0   3rd Qu.:5.000   3rd Qu.: 2.000  
##  Max.   :1750.0   Max.   :932.0   Max.   :6.000   Max.   :10.000  
##      banios       habitaciones  
##  Min.   :0.000   Min.   :0.000  
##  1st Qu.:2.000   1st Qu.:3.000  
##  Median :2.000   Median :3.000  
##  Mean   :2.588   Mean   :3.016  
##  3rd Qu.:3.000   3rd Qu.:3.000  
##  Max.   :8.000   Max.   :6.000

7.3.2 Gráficos

7.3.3 Asociación entre precio y predictores

## 
##  Shapiro-Wilk normality test
## 
## data:  caso2$preciom
## W = 0.75916, p-value < 2.2e-16
Correlaciones de Spearman - Caso 2
variable rho_spearman p_value
areaconst 0.8506 0
banios 0.6802 0
habitaciones 0.3342 0
parqueaderos 0.6878 0
##               Df   Sum Sq  Mean Sq F value Pr(>F)    
## estrato_f      3 46627182 15542394   837.6 <2e-16 ***
## Residuals   2377 44109028    18557                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Kruskal-Wallis rank sum test
## 
## data:  preciom by estrato_f
## Kruskal-Wallis chi-squared = 1271.2, df = 3, p-value < 2.2e-16

En el caso de los apartamentos de la Zona Sur, la variable preciom tampoco siguió una distribución normal (W = 0.75916, p < 2.2e-16), por lo que nuevamente es pertinente apoyar el análisis en métodos no paramétricos. Las correlaciones de Spearman revelan relaciones más fuertes que en el caso 1: el área construida presenta una asociación muy alta con el precio (rho = 0.8506), mientras que los parqueaderos (rho = 0.6878) y los baños (rho = 0.6802) también muestran asociaciones fuertes y altamente significativas. El número de habitaciones mantiene una relación positiva, pero más moderada (rho = 0.3342). En todos los casos, los valores p fueron menores a 0.001.

En relación con estrato, los resultados son aún más contundentes que en el caso 1. El ANOVA reportó F = 837.6 con p < 2e-16, y la prueba de Kruskal-Wallis arrojó chi-cuadrado = 1271.2 con p < 2.2e-16. Esto indica que el estrato segmenta de manera muy marcada el mercado de apartamentos en la Zona Sur. En términos sustantivos, el análisis exploratorio sugiere que este segmento presenta una estructura de precios más clara y explicable que la observada para casas en la Zona Norte.

Aunque estrato es, por naturaleza, una variable categórica ordinal, en este estudio se decidió evaluarlo de dos maneras en la etapa de modelación: como variable numérica y como factor. Esta decisión se tomó con el fin de contrastar si su efecto sobre el precio podía aproximarse mediante una tendencia creciente lineal o si, por el contrario, requería una representación categórica más flexible. En consecuencia, el tratamiento final de estrato en cada caso no se definió únicamente por su naturaleza de medición, sino también por criterios de ajuste, capacidad predictiva, parsimonia e interpretabilidad del modelo. ### Estimación y comparación de modelos - Caso 2 #### División entrenamiento / prueba

## [1] 1666   13
## [1] 715  13

7.3.4 Ajuste y comparación

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -994.93  -40.13   -0.48   40.56  859.65 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -250.46855   19.08685 -13.123  < 2e-16 ***
## areaconst       1.71445    0.07167  23.921  < 2e-16 ***
## estrato        53.36556    3.79658  14.056  < 2e-16 ***
## habitaciones  -26.82342    4.72836  -5.673 1.65e-08 ***
## parqueaderos   73.95996    4.95923  14.914  < 2e-16 ***
## banios         45.50693    4.15427  10.954  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 98.29 on 1660 degrees of freedom
## Multiple R-squared:  0.7705, Adjusted R-squared:  0.7698 
## F-statistic:  1114 on 5 and 1660 DF,  p-value: < 2.2e-16
## 
## Call:
## lm(formula = preciom ~ areaconst + factor(estrato) + habitaciones + 
##     parqueaderos + banios, data = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -951.53  -39.13    1.50   37.94  834.66 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      -44.16459   16.27304  -2.714 0.006717 ** 
## areaconst          1.69453    0.06776  25.008  < 2e-16 ***
## factor(estrato)4  31.27872   12.07623   2.590 0.009679 ** 
## factor(estrato)5  42.39203   12.13450   3.494 0.000489 ***
## factor(estrato)6 189.33500   14.06997  13.457  < 2e-16 ***
## habitaciones     -18.89269    4.51070  -4.188 2.96e-05 ***
## parqueaderos      63.64851    4.74616  13.411  < 2e-16 ***
## banios            36.12340    3.98231   9.071  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 92.84 on 1658 degrees of freedom
## Multiple R-squared:  0.7955, Adjusted R-squared:  0.7946 
## F-statistic: 921.3 on 7 and 1658 DF,  p-value: < 2.2e-16
Comparación de modelos - Caso 2
modelo R2_ajustado AIC RMSE_test MAE_test R2_pred_test
Estrato numérico 0.7698 20022.90 103.1030 59.6835 0.6354
Estrato como factor 0.7946 19834.63 97.1772 56.8952 0.6761
## [1] "fac"

En el caso 2, el modelo con estrato como factor superó claramente al modelo con estrato numérico en prácticamente todos los criterios de comparación. Presentó mayor R² ajustado (0.7946 frente a 0.7698), menor AIC, menor RMSE de prueba y mejor R² predictivo. Por ello, el modelo seleccionado para este caso fue el que trata el estrato como variable categórica, lo cual resulta coherente con la fuerte diferenciación observada entre niveles de estrato en el análisis exploratorio. En este mercado, asumir que el efecto del estrato es estrictamente lineal parece demasiado restrictivo; modelarlo como factor ofrece una representación más flexible y más adecuada a los datos. Este resultado refuerza que, aunque estrato puede explorarse como una variable ordinal con tendencia creciente, en este caso su comportamiento en los datos se representa mejor como una variable categórica, al capturar diferencias no lineales entre niveles.

7.3.5 Modelo final del caso 2

## 
## Call:
## lm(formula = preciom ~ areaconst + factor(estrato) + habitaciones + 
##     parqueaderos + banios, data = train)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -951.53  -39.13    1.50   37.94  834.66 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      -44.16459   16.27304  -2.714 0.006717 ** 
## areaconst          1.69453    0.06776  25.008  < 2e-16 ***
## factor(estrato)4  31.27872   12.07623   2.590 0.009679 ** 
## factor(estrato)5  42.39203   12.13450   3.494 0.000489 ***
## factor(estrato)6 189.33500   14.06997  13.457  < 2e-16 ***
## habitaciones     -18.89269    4.51070  -4.188 2.96e-05 ***
## parqueaderos      63.64851    4.74616  13.411  < 2e-16 ***
## banios            36.12340    3.98231   9.071  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 92.84 on 1658 degrees of freedom
## Multiple R-squared:  0.7955, Adjusted R-squared:  0.7946 
## F-statistic: 921.3 on 7 and 1658 DF,  p-value: < 2.2e-16

El modelo final del caso 2 alcanzó un ajuste alto (R² ajustado = 0.7946), lo que significa que aproximadamente el 79.5 % de la variabilidad del precio de los apartamentos en la Zona Sur queda explicada por las variables incluidas. Este resultado es claramente superior al obtenido en el caso 1 y sugiere que el comportamiento del precio en este segmento es más estructurado y predecible. El coeficiente del área construida fue positivo y altamente significativo (β = 1.6945, p < 2e-16), lo que implica que cada metro cuadrado adicional aumenta en promedio el precio esperado en cerca de 1.69 millones de pesos, manteniendo constantes las demás variables.

Los coeficientes asociados a factor(estrato) muestran incrementos significativos frente al nivel de referencia, siendo especialmente notorio el salto para estrato 6 (β = 189.34, p < 2e-16). Esto confirma que el efecto del estrato no es simplemente lineal, sino que ciertos niveles capturan valorizaciones mucho mayores. De igual manera, tanto los parqueaderos (β = 63.65, p < 2e-16) como los baños (β = 36.12, p < 2e-16) presentan efectos positivos y relevantes desde el punto de vista comercial.

Un resultado que requiere interpretación cuidadosa es el coeficiente negativo de habitaciones (β = -18.89, p < 0.001). Esto no significa que tener más habitaciones reduzca por sí solo el valor del inmueble, sino que, manteniendo constante el área, un mayor número de habitaciones puede reflejar una distribución más subdividida del espacio, con menor amplitud relativa y, por tanto, menor valorización marginal. En otras palabras, el efecto es condicional: a igual tamaño total, un apartamento con más divisiones internas puede no ser percibido como más valioso. Este resultado es estadísticamente válido y también plausible desde el punto de vista inmobiliario.

7.4 Validación de supuestos - Caso 2

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(mod_final_c2)
## W = 0.77523, p-value < 2.2e-16
## 
##  studentized Breusch-Pagan test
## 
## data:  mod_final_c2
## BP = 496.3, df = 7, p-value < 2.2e-16
## 
##  Durbin-Watson test
## 
## data:  mod_final_c2
## DW = 2.014, p-value = 0.6127
## alternative hypothesis: true autocorrelation is greater than 0
##                     GVIF Df GVIF^(1/(2*Df))
## areaconst       2.315410  1        1.521647
## factor(estrato) 1.796171  3        1.102532
## habitaciones    1.512501  1        1.229838
## parqueaderos    1.942133  1        1.393604
## banios          2.742540  1        1.656062

La validación de supuestos del caso 2 muestra un patrón similar al caso 1, pero con mayor intensidad en algunos incumplimientos. Los residuos no siguen una distribución normal (W = 0.77523, p < 2.2e-16) y la prueba de Breusch-Pagan fue claramente significativa (BP = 496.3, p < 2.2e-16), lo cual evidencia heterocedasticidad. Esto indica que la dispersión de los errores crece o cambia según el nivel del precio ajustado, situación frecuente en mercados inmobiliarios donde los inmuebles de mayor valor presentan también mayor variabilidad.

Sin embargo, no se observaron problemas de independencia residual (DW = 2.014, p = 0.6127) ni de multicolinealidad importante, ya que los valores transformados de GVIF permanecen bajos. En consecuencia, el modelo es estable desde la perspectiva de relación entre predictores, pero no cumple plenamente los supuestos clásicos de homocedasticidad y normalidad.

Para fortalecer la inferencia, en futuros análisis sería recomendable considerar transformaciones del precio, errores robustos o modelos alternativos segmentados por subzonas o barrios específicos.

7.5 Predicción para la solicitud de la vivienda 2

La solicitud indica estrato 5 o 6, por lo cual se generan dos escenarios.

Predicción de precio - Vivienda 2
escenario fit lwr upr
1 Estrato 5 711.44 527.24 895.63
11 Estrato 6 858.38 674.11 1042.65

Para la vivienda 2 se evaluaron dos escenarios. La predicción puntual fue de aproximadamente 711.44 millones para estrato 5 y de 858.38 millones para estrato 6. En consecuencia, la solicitud resulta claramente viable para estrato 5, pues la estimación central se encuentra por debajo del presupuesto máximo de 850 millones. En el caso de estrato 6, la predicción puntual supera levemente ese límite, lo que sugiere una situación de frontera: la operación podría ser viable solo si se encuentran inmuebles con condiciones muy competitivas dentro del mercado o si se flexibiliza ligeramente alguna característica.

Los intervalos de predicción muestran, además, que existe variabilidad apreciable en los precios individuales, por lo que la interpretación debe hacerse con prudencia. No obstante, a diferencia del caso 1, aquí el comportamiento del mercado es más favorable frente al presupuesto. En síntesis, la solicitud de la vivienda 2 puede calificarse como viable, especialmente si el cliente prioriza estrato 5; para estrato 6, la viabilidad es más ajustada y debe evaluarse con cautela.

7.6 Selección de ofertas potenciales - Caso 2

Cinco ofertas potenciales - Caso 2
zona piso estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud estrato_f score
Zona Sur 05 5 350 270.00 3 3 4 Apartamento capri -76.54 3.39 5 45.00
Zona Sur NA 5 670 300.00 3 5 6 Apartamento seminario -76.55 3.41 5 55.00
Zona Sur 02 5 410 295.55 2 4 4 Apartamento cuarto de legua -76.56 3.41 5 59.45
Zona Sur 01 5 450 267.00 3 3 3 Apartamento pampa linda -76.55 3.40 5 63.00
Zona Sur 05 5 350 260.00 3 3 3 Apartamento capri -76.54 3.39 5 70.00

Las cinco ofertas seleccionadas para el caso 2 se ubican en Capri, Seminario, Cuarto de Legua y Pampa Linda, con precios entre 350 y 670 millones y áreas entre 260 y 300 m². Entre ellas sobresale un apartamento en Seminario con 300 m², 3 parqueaderos, precio de 670 millones, 5 baños y 6 habitaciones, el cual es el más cercano en área y parqueaderos al requerimiento corporativo. También aparecen dos ofertas en Capri por 350 millones, con áreas de 260 y 270 m², 3 parqueaderos y 3 baños, que representan opciones muy favorables en precio aunque algo inferiores en área y habitaciones respecto al objetivo. A su vez, la opción de Cuarto de Legua con 295.55 m² y precio de 410 millones es especialmente cercana en área, aunque tiene 2 parqueaderos y 4 habitaciones.

Desde el punto de vista comercial, estas alternativas muestran que el mercado ofrece opciones cómodamente por debajo del presupuesto máximo, lo cual favorece la negociación. Sin embargo, también evidencian que no todas las características objetivo se alcanzan simultáneamente: las alternativas más baratas suelen quedarse cortas en habitaciones o área, mientras que las más cercanas al perfil completo tienden a encarecerse. En consecuencia, la mejor recomendación es presentar una combinación de opciones: una muy cercana al requerimiento técnico, como Seminario o Cuarto de Legua, y otras más eficientes en precio, como Capri, para que el cliente compare entre cercanía al perfil y conveniencia económica.

8 Informe ejecutivo: conclusiones y recomendaciones

8.1 Conclusiones del caso 1

En el caso de las casas en la Zona Norte, el análisis evidenció que el área construida es el principal determinante del precio, seguida por el estrato, los baños y los parqueaderos. El modelo seleccionado presentó un ajuste moderado (R² ajustado ≈ 0.612) y una estructura coherente con la lógica del mercado, aunque con limitaciones asociadas a heterocedasticidad y no normalidad de residuos.

La predicción para la vivienda solicitada indica que la operación es factible en estrato 4 y menos probable en estrato 5 bajo el tope de 350 millones. Las ofertas potenciales seleccionadas muestran que sí existen alternativas cercanas al perfil solicitado, pero en general ubicadas justo en el límite del presupuesto o con pequeñas diferencias respecto al requerimiento original. Por tanto, la recomendación para María es presentar la solicitud como viable con restricciones, priorizando inmuebles de estrato 4 o aceptando leves flexibilizaciones en atributos secundarios.

8.2 Conclusiones del caso 2

En el caso de los apartamentos en la Zona Sur, el análisis mostró una estructura de precios más fuerte y más explicable que en el caso de las casas de la Zona Norte. El área construida, el estrato, los parqueaderos y los baños fueron determinantes clave del precio, y el modelo final logró un ajuste alto (R² ajustado ≈ 0.795). Además, la comparación de modelos evidenció que tratar el estrato como variable categórica mejora de forma importante el desempeño predictivo, lo que confirma la existencia de escalones de valorización entre niveles socioeconómicos.

La predicción para la vivienda 2 sugiere que la solicitud es viable, especialmente para estrato 5, y el conjunto de ofertas potenciales ratifica que existen varias alternativas dentro del presupuesto de 850 millones. Por tanto, este segundo caso presenta mejores condiciones de cierre que el primero, tanto por comportamiento estadístico del mercado como por disponibilidad de oferta efectiva.

8.3 Recomendación general para María

Con base en la modelación realizada, la recomendación general para María es diferenciar claramente la estrategia comercial en ambos casos. Para la vivienda 1, la firma debería presentar la búsqueda como una solicitud parcialmente viable, enfatizando que el presupuesto de 350 millones permite encontrar opciones cercanas al perfil, pero principalmente en estrato 4 o con pequeñas flexibilizaciones en atributos como parqueaderos, baños o número de habitaciones. Para la vivienda 2, la recomendación es mucho más favorable: el mercado de apartamentos en la Zona Sur ofrece suficientes alternativas compatibles con el perfil solicitado y, en general, dentro del presupuesto aprobado, especialmente para estrato 5.

Desde el punto de vista metodológico, el estudio también sugiere que las predicciones deben utilizarse como apoyo a la toma de decisión y no como único criterio de compra, ya que tanto en el caso 1 como en el caso 2 se detectaron problemas de heterocedasticidad y no normalidad residual. Por ello, la recomendación final es que María complemente las predicciones con evaluación cualitativa del estado del inmueble, acabados, antigüedad, administración, seguridad y prestigio del sector. Esto permitirá transformar el análisis estadístico en una propuesta comercial más sólida, realista y defendible ante el cliente corporativo.

9 Anexos

9.1 Tablas auxiliares

Muestra de la base limpia
zona piso estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud
Zona Oriente NA 3 250 70 1 3 6 Casa 20 de julio -76.51168 3.43382
Zona Oriente NA 3 320 120 1 2 3 Casa 20 de julio -76.51237 3.43369
Zona Oriente NA 3 350 220 2 2 4 Casa 20 de julio -76.51537 3.43566
Zona Sur 02 4 400 280 3 5 3 Casa 3 de julio -76.54000 3.43500
Zona Norte 01 5 260 90 1 2 3 Apartamento acopi -76.51350 3.45891
Zona Norte 01 5 240 87 1 3 3 Apartamento acopi -76.51700 3.36971
Zona Norte 01 4 220 52 2 2 3 Apartamento acopi -76.51974 3.42627
Zona Norte 01 5 310 137 2 3 4 Apartamento acopi -76.53105 3.38296
Zona Norte 02 5 320 150 2 4 6 Casa acopi -76.51341 3.47968
Zona Norte 02 5 780 380 2 3 3 Casa acopi -76.51674 3.48721

9.2 Coeficientes del modelo final caso 1

Coeficientes del modelo final - Caso 1
term estimate std.error statistic p.value conf.low conf.high
(Intercept) -298.9580 56.1527 -5.3240 0.0000 -409.4640 -188.4519
areaconst 0.7009 0.0626 11.1963 0.0000 0.5777 0.8241
estrato 88.6349 12.0653 7.3463 0.0000 64.8909 112.3790
habitaciones 9.5859 6.8033 1.4090 0.1599 -3.8028 22.9746
parqueaderos 21.8842 7.0529 3.1028 0.0021 8.0043 35.7641
banios 24.0205 9.1262 2.6320 0.0089 6.0606 41.9804

9.3 Coeficientes del modelo final caso 2

Coeficientes del modelo final - Caso 2
term estimate std.error statistic p.value conf.low conf.high
(Intercept) -44.1646 16.2730 -2.7140 0.0067 -76.0825 -12.2467
areaconst 1.6945 0.0678 25.0077 0.0000 1.5616 1.8274
factor(estrato)4 31.2787 12.0762 2.5901 0.0097 7.5925 54.9650
factor(estrato)5 42.3920 12.1345 3.4935 0.0005 18.5915 66.1926
factor(estrato)6 189.3350 14.0700 13.4567 0.0000 161.7382 216.9318
habitaciones -18.8927 4.5107 -4.1884 0.0000 -27.7399 -10.0454
parqueaderos 63.6485 4.7462 13.4105 0.0000 54.3394 72.9576
banios 36.1234 3.9823 9.0710 0.0000 28.3125 43.9343

9.4 Ajustes y diagnósticos

Resumen del modelo final - Caso 1
r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC deviance df.residual nobs
0.618 0.6116 159.0192 96.4368 0 5 -1969.311 3952.622 3978.641 7535560 298 304
Resumen del modelo final - Caso 2
r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC deviance df.residual nobs
0.7955 0.7946 92.8362 921.3178 0 7 -9908.316 19834.63 19883.39 14289569 1658 1666