El presente informe tiene como propósito apoyar a María, gerente de la firma C&A (Casas y Apartamentos), en la atención de una solicitud corporativa para la compra de dos viviendas en la ciudad de Cali. Para ello, se desarrolla un análisis basado en técnicas de regresión lineal múltiple.
El estudio se divide en dos casos:
Vivienda 1: Casa, zona norte, área construida de 200 m², 1 parqueadero, 2 baños, 4 habitaciones, estrato 4 o 5 y presupuesto máximo de 350 millones de pesos.
Vivienda 2: Apartamento, zona sur, área construida de 300 m², 3 parqueaderos, 3 baños, 5 habitaciones, estrato 5 o 6 y presupuesto máximo de 850 millones de pesos.
## Rows: 8,322
## Columns: 13
## $ id <dbl> 1147, 1169, 1350, 5992, 1212, 1724, 2326, 4386, 1209, 159…
## $ zona <chr> "Zona Oriente", "Zona Oriente", "Zona Oriente", "Zona Sur…
## $ piso <chr> NA, NA, NA, "02", "01", "01", "01", "01", "02", "02", "02…
## $ estrato <dbl> 3, 3, 3, 4, 5, 5, 4, 5, 5, 5, 6, 4, 5, 6, 4, 5, 5, 4, 5, …
## $ preciom <dbl> 250, 320, 350, 400, 260, 240, 220, 310, 320, 780, 750, 62…
## $ areaconst <dbl> 70, 120, 220, 280, 90, 87, 52, 137, 150, 380, 445, 355, 2…
## $ parqueaderos <dbl> 1, 1, 2, 3, 1, 1, 2, 2, 2, 2, NA, 3, 2, 2, 1, 4, 2, 2, 2,…
## $ banios <dbl> 3, 2, 2, 5, 2, 3, 2, 3, 4, 3, 7, 5, 6, 2, 4, 4, 4, 3, 2, …
## $ habitaciones <dbl> 6, 3, 4, 3, 3, 3, 3, 4, 6, 3, 6, 5, 6, 2, 5, 5, 4, 3, 3, …
## $ tipo <chr> "Casa", "Casa", "Casa", "Casa", "Apartamento", "Apartamen…
## $ barrio <chr> "20 de julio", "20 de julio", "20 de julio", "3 de julio"…
## $ longitud <dbl> -76.51168, -76.51237, -76.51537, -76.54000, -76.51350, -7…
## $ latitud <dbl> 3.43382, 3.43369, 3.43566, 3.43500, 3.45891, 3.36971, 3.4…
La base vivienda contiene información de ofertas inmobiliarias en Cali para los últimos tres meses. Las variables relevantes para este estudio son:
zona: ubicación de la vivienda.
estrato: estrato socioeconómico.
preciom: precio de la vivienda en millones de pesos.
areaconst: área construida.
parqueaderos: número de parqueaderos.
banios: número de baños.
habitaciones: número de habitaciones.
tipo: casa o apartamento.
barrio: barrio de ubicación.
longitud y latitud: coordenadas geográficas.
La variable respuesta en ambos modelos es preciom.
## [1] 8322 13
| variable | n_faltantes | porcentaje | |
|---|---|---|---|
| id | id | 3 | 0.04 |
| zona | zona | 3 | 0.04 |
| piso | piso | 2638 | 31.70 |
| estrato | estrato | 3 | 0.04 |
| preciom | preciom | 2 | 0.02 |
| areaconst | areaconst | 3 | 0.04 |
| parqueaderos | parqueaderos | 1605 | 19.29 |
| banios | banios | 3 | 0.04 |
| habitaciones | habitaciones | 3 | 0.04 |
| tipo | tipo | 3 | 0.04 |
| barrio | barrio | 3 | 0.04 |
| longitud | longitud | 3 | 0.04 |
| latitud | latitud | 3 | 0.04 |
## zona piso estrato preciom
## Length:8322 Length:8322 Min. :3.000 Min. : 58.0
## Class :character Class :character 1st Qu.:4.000 1st Qu.: 220.0
## Mode :character Mode :character Median :5.000 Median : 330.0
## Mean :4.634 Mean : 433.9
## 3rd Qu.:5.000 3rd Qu.: 540.0
## Max. :6.000 Max. :1999.0
## NA's :3 NA's :2
## areaconst parqueaderos banios habitaciones
## Min. : 30.0 Min. : 1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 80.0 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000
## Median : 123.0 Median : 2.000 Median : 3.000 Median : 3.000
## Mean : 174.9 Mean : 1.835 Mean : 3.111 Mean : 3.605
## 3rd Qu.: 229.0 3rd Qu.: 2.000 3rd Qu.: 4.000 3rd Qu.: 4.000
## Max. :1745.0 Max. :10.000 Max. :10.000 Max. :10.000
## NA's :3 NA's :1605 NA's :3 NA's :3
## tipo barrio longitud latitud
## Length:8322 Length:8322 Min. :-76.59 Min. :3.333
## Class :character Class :character 1st Qu.:-76.54 1st Qu.:3.381
## Mode :character Mode :character Median :-76.53 Median :3.416
## Mean :-76.53 Mean :3.418
## 3rd Qu.:-76.52 3rd Qu.:3.452
## Max. :-76.46 Max. :3.498
## NA's :3 NA's :3
## [1] 6717 12
En esta etapa se depuró la base eliminando registros con información faltante en variables esenciales para el análisis y para la estimación de los modelos. Esto se debe a que la variable respuesta y los predictores principales deben estar completos para poder realizar inferencia, validación y predicción de forma consistente.
Este gráfico permite verificar de manera visual si la etiqueta de
zona es razonablemente consistente con la localización
geográfica de los inmuebles. En términos generales, se observan
concentraciones espaciales diferenciadas por zona, lo que respalda la
utilidad de esta variable como criterio de segmentación para el
análisis.
No obstante, también se aprecia cierto solapamiento espacial entre algunas zonas, especialmente en sectores donde puntos clasificados como Zona Oeste o Zona Sur aparecen próximos a conglomerados dominados por Zona Norte. Este comportamiento no se interpretó automáticamente como un error de codificación, ya que los límites urbanos reales no necesariamente siguen separaciones lineales en latitud o longitud, y el mapa de dispersión utilizado no incorpora fronteras oficiales de las zonas ni polígonos administrativos.
Por esta razón, no se consideró metodológicamente apropiado
recodificar observaciones de manera manual solo a partir de inspección
visual. En consecuencia, se decidió mantener la clasificación original
de la variable zona y utilizar el mapa como una validación
espacial del filtro, reconociendo como limitación la posible existencia
de áreas de transición o de observaciones geográficamente ambiguas.
Así, la variable zona se conserva como criterio de
segmentación inicial del estudio, mientras que la interpretación de los
resultados se realiza con cautela, entendiendo que dentro de cada
macrozona pueden coexistir submercados con comportamientos
heterogéneos.
Para evitar introducir sesgos por recodificación subjetiva, no se
modificó manualmente la variable zona.
## [1] 435 12
| zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| Zona Norte | 02 | 4 | 625 | 355 | 3 | 5 | 5 | Casa | acopi | -76.53179 | 3.40590 |
| tipo | zona | n |
|---|---|---|
| Casa | Zona Norte | 435 |
El filtro aplicado para el caso 1 permitió identificar 435 viviendas tipo casa ubicadas en la Zona Norte, lo cual confirma que se dispone de un subconjunto suficientemente amplio para el análisis estadístico y la modelación. El mapa de puntos muestra la distribución espacial de estas ofertas y cumple la función de validar visualmente la coherencia geográfica del filtro aplicado. En términos generales, la concentración de observaciones es consistente con la macrozona norte; sin embargo, la dispersión espacial observada sugiere que la categoría “Zona Norte” agrupa barrios con heterogeneidad importante en ubicación, entorno urbano y nivel de valorización. Por tanto, aunque el filtro por zona es metodológicamente válido, debe reconocerse que dentro de esta misma zona coexisten submercados con comportamientos de precio diferentes.
El análisis exploratorio del caso 1 se orienta a evaluar la relación
entre el precio de la vivienda y las variables explicativas propuestas
en el enunciado: área construida, estrato, número de baños, número de
habitaciones y número de parqueaderos. Dado que el caso ya fue filtrado
a casas de la Zona Norte, la variable zona se utiliza aquí
como criterio de segmentación del análisis y no como variable
explicativa interna.
## preciom areaconst estrato parqueaderos
## Min. : 89.0 Min. : 30.0 Min. :3.000 Min. : 1.000
## 1st Qu.: 330.0 1st Qu.: 170.5 1st Qu.:4.000 1st Qu.: 1.000
## Median : 425.0 Median : 264.5 Median :5.000 Median : 2.000
## Mean : 479.8 Mean : 292.7 Mean :4.455 Mean : 2.182
## 3rd Qu.: 582.5 3rd Qu.: 357.0 3rd Qu.:5.000 3rd Qu.: 3.000
## Max. :1940.0 Max. :1440.0 Max. :6.000 Max. :10.000
## banios habitaciones
## Min. : 0.000 Min. : 0.000
## 1st Qu.: 3.000 1st Qu.: 4.000
## Median : 4.000 Median : 4.000
## Mean : 3.782 Mean : 4.809
## 3rd Qu.: 5.000 3rd Qu.: 5.000
## Max. :10.000 Max. :10.000
##
## Shapiro-Wilk normality test
##
## data: caso1$preciom
## W = 0.86086, p-value < 2.2e-16
| variable | rho_spearman | p_value |
|---|---|---|
| areaconst | 0.7775 | 0 |
| banios | 0.5626 | 0 |
| habitaciones | 0.3734 | 0 |
| parqueaderos | 0.4782 | 0 |
## Df Sum Sq Mean Sq F value Pr(>F)
## estrato_f 3 7409108 2469703 57.03 <2e-16 ***
## Residuals 431 18662886 43301
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Kruskal-Wallis rank sum test
##
## data: preciom by estrato_f
## Kruskal-Wallis chi-squared = 170.07, df = 3, p-value < 2.2e-16
En el caso de las casas ubicadas en la Zona Norte, la variable respuesta preciom no presentó normalidad según la prueba de Shapiro-Wilk (W = 0.86086, p < 2.2e-16), por lo que resulta apropiado complementar el análisis con métodos no paramétricos y medidas robustas como la correlación de Spearman. Los resultados muestran que la variable con mayor asociación con el precio es el área construida (rho = 0.7775), seguida por el número de baños (rho = 0.5626) y el número de parqueaderos (rho = 0.4782). La asociación con el número de habitaciones también es positiva, aunque comparativamente más moderada (rho = 0.3734). Todas estas relaciones resultaron estadísticamente significativas (p < 0.001), lo que indica que, en términos bivariados, mayores dimensiones y mejores atributos funcionales tienden a estar asociados con viviendas de mayor precio.
Respecto al estrato, tanto el ANOVA (F = 57.03, p < 2e-16) como la prueba no paramétrica de Kruskal-Wallis (chi-cuadrado = 170.07, p < 2.2e-16) evidencian diferencias estadísticamente significativas en el precio entre niveles de estrato. Esto indica que el estrato sí introduce segmentación relevante en el mercado de casas de la Zona Norte y, por tanto, debe ser considerado en la modelación. En conjunto, el análisis exploratorio sugiere que el precio está principalmente explicado por tamaño, nivel socioeconómico y dotación del inmueble, con una relación visual y estadística especialmente fuerte en el área construida.
Antes de estimar el modelo, es importante aclarar que la variable
zona no se incluye como predictor dentro de cada caso, ya
que el análisis se realizó sobre subconjuntos previamente filtrados a
una única zona geográfica. En consecuencia, dentro de cada caso esta
variable no presenta variación y no aporta información adicional al
modelo de regresión.
Aunque estrato es, por naturaleza, una variable
categórica ordinal, en este estudio se decidió evaluarlo de dos maneras
en la etapa de modelación: como variable numérica y como factor. Esta
decisión se tomó con el fin de contrastar si su efecto sobre el precio
podía aproximarse mediante una tendencia creciente lineal o si, por el
contrario, requería una representación categórica más flexible. En
consecuencia, el tratamiento final de estrato en cada caso
no se definió únicamente por su naturaleza de medición, sino también por
criterios de ajuste, capacidad predictiva, parsimonia e
interpretabilidad del modelo.
## [1] 304 13
## [1] 131 13
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -820.05 -82.01 -16.44 59.88 927.66
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -298.9580 56.1527 -5.324 2.00e-07 ***
## areaconst 0.7009 0.0626 11.196 < 2e-16 ***
## estrato 88.6349 12.0653 7.346 1.96e-12 ***
## habitaciones 9.5859 6.8033 1.409 0.15988
## parqueaderos 21.8842 7.0529 3.103 0.00210 **
## banios 24.0205 9.1262 2.632 0.00893 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 159 on 298 degrees of freedom
## Multiple R-squared: 0.618, Adjusted R-squared: 0.6116
## F-statistic: 96.44 on 5 and 298 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = preciom ~ areaconst + factor(estrato) + habitaciones +
## parqueaderos + banios, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -834.89 -85.52 -14.56 56.43 931.19
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -20.6593 33.7099 -0.613 0.54044
## areaconst 0.7025 0.0624 11.259 < 2e-16 ***
## factor(estrato)4 60.8866 30.5540 1.993 0.04721 *
## factor(estrato)5 149.7487 27.9055 5.366 1.62e-07 ***
## factor(estrato)6 315.2393 47.7024 6.608 1.80e-10 ***
## habitaciones 8.6590 6.8271 1.268 0.20568
## parqueaderos 22.8799 7.0416 3.249 0.00129 **
## banios 26.1028 9.3560 2.790 0.00561 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 158.4 on 296 degrees of freedom
## Multiple R-squared: 0.6236, Adjusted R-squared: 0.6147
## F-statistic: 70.05 on 7 and 296 DF, p-value: < 2.2e-16
| modelo | R2_ajustado | AIC | RMSE_test | MAE_test | R2_pred_test |
|---|---|---|---|---|---|
| Estrato numérico | 0.6116 | 3952.622 | 148.7318 | 97.1848 | 0.5387 |
| Estrato como factor | 0.6147 | 3952.193 | 151.9332 | 96.9536 | 0.5187 |
## [1] "num"
Para el caso 1 se compararon dos especificaciones: una con estrato
como variable numérica y otra con estrato como factor. Aunque el modelo
con estrato como factor obtuvo un R² ajustado ligeramente superior
(0.6147 frente a 0.6116) y un AIC marginalmente menor, el modelo con
estrato numérico presentó mejor desempeño predictivo en muestra de
prueba, con menor RMSE y mejor R² predictivo. En consecuencia, se
seleccionó como modelo final la especificación con estrato tratado
numéricamente, privilegiando su mejor capacidad predictiva y mayor
parsimonia. Si bien estrato corresponde conceptualmente a
una variable ordinal, en este caso su especificación numérica ofreció
una aproximación adecuada y más parsimoniosa, con un desempeño
predictivo ligeramente superior al observado cuando se trató como
factor.
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -820.05 -82.01 -16.44 59.88 927.66
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -298.9580 56.1527 -5.324 2.00e-07 ***
## areaconst 0.7009 0.0626 11.196 < 2e-16 ***
## estrato 88.6349 12.0653 7.346 1.96e-12 ***
## habitaciones 9.5859 6.8033 1.409 0.15988
## parqueaderos 21.8842 7.0529 3.103 0.00210 **
## banios 24.0205 9.1262 2.632 0.00893 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 159 on 298 degrees of freedom
## Multiple R-squared: 0.618, Adjusted R-squared: 0.6116
## F-statistic: 96.44 on 5 and 298 DF, p-value: < 2.2e-16
El modelo final estimado para el caso 1 fue:
\[ preciom = \beta_0 + \beta_1 areaconst + \beta_2 estrato + \beta_3 habitaciones + \beta_4 parqueaderos + \beta_5 banios \]
Los resultados muestran que el área construida es el predictor más importante del precio y su coeficiente fue positivo y altamente significativo (β = 0.7009, p < 2e-16). Esto significa que, manteniendo constantes las demás variables, cada metro cuadrado adicional incrementa en promedio el precio esperado en 0.70 millones de pesos. El estrato también resultó positivo y altamente significativo (β = 88.63, p < 0.001), lo que indica que pasar a un estrato superior se asocia con un aumento promedio de aproximadamente 88.6 millones de pesos, controlando por área, habitaciones, parqueaderos y baños.
El número de parqueaderos presentó un efecto positivo y significativo (β = 21.88, p = 0.0021), al igual que el número de baños (β = 24.02, p = 0.0089). En términos de mercado, esto sugiere que la disponibilidad de estacionamiento y una mayor dotación de baños son atributos valorados por los compradores de casas en esta zona. En cambio, el coeficiente asociado al número de habitaciones fue positivo pero no estadísticamente significativo (p = 0.1599), lo cual sugiere que, una vez controlado el tamaño total de la vivienda y sus demás características, el número de habitaciones no aporta evidencia suficiente para explicar diferencias adicionales de precio. Esto es razonable, porque parte de su efecto puede estar ya absorbido por el área construida.
El ajuste global del modelo es moderado, con R² ajustado = 0.6116, lo que significa que alrededor del 61.2 % de la variabilidad del precio se explica por las variables incluidas. Este nivel de ajuste es aceptable para un mercado inmobiliario, donde el precio también depende de factores no observados en la base, como acabados, antigüedad, estado de conservación, tamaño del lote, seguridad del sector, proximidad a servicios y reputación del barrio.
El coeficiente de determinación R² indica la proporción de la variabilidad del precio explicada por las variables incluidas en el modelo. Por su parte, el R² ajustado corrige por el número de predictores y resulta más apropiado para comparar modelos. Un valor moderado de R² no invalida el modelo, dado que el precio inmobiliario también depende de factores no observados, como acabados, antigüedad, administración, seguridad, cercanía a equipamientos urbanos o prestigio del barrio.
##
## Shapiro-Wilk normality test
##
## data: residuals(mod_final_c1)
## W = 0.88054, p-value = 1.173e-14
##
## studentized Breusch-Pagan test
##
## data: mod_final_c1
## BP = 77.254, df = 5, p-value = 3.148e-15
##
## Durbin-Watson test
##
## data: mod_final_c1
## DW = 2.0314, p-value = 0.6054
## alternative hypothesis: true autocorrelation is greater than 0
## areaconst estrato habitaciones parqueaderos banios
## 1.442014 1.262229 1.637818 1.203020 1.747273
La validación de supuestos del modelo del caso 1 muestra resultados mixtos. En primer lugar, los residuos no siguen una distribución normal según Shapiro-Wilk (W = 0.88054, p = 1.173e-14), lo cual sugiere desviaciones respecto al supuesto de normalidad. En segundo lugar, la prueba de Breusch-Pagan fue significativa (BP = 77.254, p = 3.148e-15), por lo que existe evidencia de heterocedasticidad, es decir, la variabilidad de los residuos no es constante a lo largo de los valores ajustados. Esto implica que, aunque el modelo sigue siendo útil para predicción exploratoria, la inferencia clásica sobre errores estándar debe interpretarse con cautela.
Por el contrario, no se encontró evidencia de autocorrelación positiva de residuos, ya que la prueba de Durbin-Watson arrojó DW = 2.0314 con p = 0.6054, valor compatible con independencia. Asimismo, los factores de inflación de varianza fueron bajos (todos alrededor de 1 a 1.75), lo que indica que no existe un problema serio de multicolinealidad entre los predictores. En síntesis, los principales incumplimientos del modelo se concentran en normalidad y homocedasticidad, no en independencia ni en colinealidad.
Como mejora futura, sería recomendable evaluar transformaciones sobre preciom, por ejemplo log(preciom), emplear errores estándar robustos y considerar segmentaciones más finas por subzonas o barrios.
La solicitud indica estrato 4 o 5, por lo cual se generan dos escenarios de predicción.
| escenario | fit | lwr | upr | |
|---|---|---|---|---|
| 1 | Estrato 4 | 304.03 | -10.46 | 618.52 |
| 11 | Estrato 5 | 392.66 | 77.29 | 708.03 |
Para la vivienda 1 se evaluaron dos escenarios, correspondientes a los estratos permitidos por el cliente. La predicción puntual fue de aproximadamente 304.03 millones para estrato 4 y de 392.66 millones para estrato 5. Estos resultados muestran que la solicitud es viable en términos puntuales para estrato 4, ya que la estimación se ubica por debajo del presupuesto máximo de 350 millones. En contraste, para estrato 5 la predicción supera el tope presupuestal, lo que sugiere que mantener simultáneamente las características solicitadas y ubicarse en estrato 5 sería más difícil dentro del presupuesto disponible.
No obstante, los intervalos de predicción son amplios, lo cual indica incertidumbre considerable alrededor del valor esperado individual. Por esta razón, la conclusión más prudente es que la solicitud de la vivienda 1 es parcialmente viable: resulta realista si se privilegia el estrato 4 o si se aceptan ofertas muy cercanas al techo presupuestal, pero se vuelve más exigente cuando se pretende una casa de estrato 5 con todas las especificaciones dadas.
Adicionalmente, debe señalarse que el intervalo de predicción del escenario de estrato 4 presenta un límite inferior no interpretable en términos económicos. Esto no implica un error del procedimiento, sino una consecuencia de la amplitud de la incertidumbre del modelo lineal bajo alta dispersión de los datos. Por ello, la interpretación debe centrarse en la predicción puntual y en la lectura general de viabilidad, más que en una interpretación literal de todos los extremos del intervalo.
| zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud | estrato_f | score |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Zona Norte | NA | 5 | 350 | 216 | 2 | 2 | 4 | Casa | la merced | -76.51 | 3.48 | 5 | 36 |
| Zona Norte | NA | 5 | 350 | 203 | 2 | 2 | 5 | Casa | el bosque | -76.51 | 3.49 | 5 | 38 |
| Zona Norte | 01 | 5 | 340 | 203 | 2 | 3 | 4 | Casa | vipasa | -76.52 | 3.48 | 5 | 43 |
| Zona Norte | NA | 5 | 350 | 190 | 1 | 3 | 3 | Casa | la flora | -76.52 | 3.49 | 5 | 45 |
| Zona Norte | 01 | 5 | 335 | 220 | 1 | 3 | 3 | Casa | el bosque | -76.53 | 3.49 | 5 | 55 |
Las cinco ofertas seleccionadas para el caso 1 se concentran en barrios como La Merced, El Bosque, Vipasa y La Flora, con precios entre 335 y 350 millones y áreas entre 190 y 220 m², es decir, bastante próximas a la meta de 200 m². Entre ellas, destacan especialmente: una oferta en La Merced de 216 m² por 350 millones, otra en El Bosque de 203 m² por 350 millones, una en Vipasa de 203 m² por 340 millones, una en La Flora de 190 m² por 350 millones y otra en El Bosque de 220 m² por 335 millones. Estas alternativas muestran que sí existen opciones cercanas al perfil solicitado dentro del presupuesto, aunque no todas cumplen de manera exacta cada atributo.
Desde el punto de vista comercial, la mejor alternativa parece ser la oferta de La Merced, por su cercanía simultánea en área, precio y número de habitaciones. La opción de El Bosque con 203 m² también es altamente competitiva, aunque tiene 2 parqueaderos y 5 habitaciones, lo que la hace ligeramente distinta del perfil objetivo. La oferta de Vipasa constituye una buena opción por precio, pero incorpora un baño adicional y 2 parqueaderos. En consecuencia, puede concluirse que el mercado sí ofrece opciones razonablemente compatibles con la solicitud, pero con un margen de maniobra reducido: para mantenerse en el presupuesto, el cliente probablemente deberá aceptar pequeñas desviaciones en parqueaderos, baños o número de habitaciones.
## [1] 2381 12
| zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Zona Sur | 05 | 4 | 290 | 96 | 1 | 2 | 3 | Apartamento | acopi | -76.53464 | 3.44987 |
| Zona Sur | 02 | 3 | 78 | 40 | 1 | 1 | 2 | Apartamento | aguablanca | -76.50100 | 3.40000 |
| Zona Sur | NA | 6 | 875 | 194 | 2 | 5 | 3 | Apartamento | aguacatal | -76.55700 | 3.45900 |
| tipo | zona | n |
|---|---|---|
| Apartamento | Zona Sur | 2381 |
El filtro del caso 2 identificó 2,381 apartamentos en la Zona Sur, lo que constituye una base robusta para el análisis y confirma que este segmento del mercado tiene una oferta mucho más amplia que la observada en el caso 1. La representación espacial muestra una dispersión compatible con la extensión geográfica de la macrozona sur y sugiere la coexistencia de submercados diferenciados dentro de esta misma zona. En consecuencia, aunque el filtro por zona es válido y útil para responder la solicitud, debe reconocerse que la Zona Sur no es homogénea en términos de valorización ni de perfil de oferta.
En el caso 2, el análisis exploratorio se enfoca en la relación entre
el precio del apartamento y las variables estructurales definidas en el
problema: área construida, estrato, número de baños, número de
habitaciones y número de parqueaderos. Como el subconjunto ya fue
filtrado a apartamentos de la Zona Sur, la variable zona
opera como criterio de segmentación y no como predictor dentro del
modelo.
## preciom areaconst estrato parqueaderos
## Min. : 78.0 Min. : 40.0 Min. :3.000 Min. : 1.000
## 1st Qu.: 205.0 1st Qu.: 71.0 1st Qu.:4.000 1st Qu.: 1.000
## Median : 260.0 Median : 90.0 Median :5.000 Median : 1.000
## Mean : 318.2 Mean :102.2 Mean :4.748 Mean : 1.415
## 3rd Qu.: 350.0 3rd Qu.:113.0 3rd Qu.:5.000 3rd Qu.: 2.000
## Max. :1750.0 Max. :932.0 Max. :6.000 Max. :10.000
## banios habitaciones
## Min. :0.000 Min. :0.000
## 1st Qu.:2.000 1st Qu.:3.000
## Median :2.000 Median :3.000
## Mean :2.588 Mean :3.016
## 3rd Qu.:3.000 3rd Qu.:3.000
## Max. :8.000 Max. :6.000
##
## Shapiro-Wilk normality test
##
## data: caso2$preciom
## W = 0.75916, p-value < 2.2e-16
| variable | rho_spearman | p_value |
|---|---|---|
| areaconst | 0.8506 | 0 |
| banios | 0.6802 | 0 |
| habitaciones | 0.3342 | 0 |
| parqueaderos | 0.6878 | 0 |
## Df Sum Sq Mean Sq F value Pr(>F)
## estrato_f 3 46627182 15542394 837.6 <2e-16 ***
## Residuals 2377 44109028 18557
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Kruskal-Wallis rank sum test
##
## data: preciom by estrato_f
## Kruskal-Wallis chi-squared = 1271.2, df = 3, p-value < 2.2e-16
En el caso de los apartamentos de la Zona Sur, la variable preciom tampoco siguió una distribución normal (W = 0.75916, p < 2.2e-16), por lo que nuevamente es pertinente apoyar el análisis en métodos no paramétricos. Las correlaciones de Spearman revelan relaciones más fuertes que en el caso 1: el área construida presenta una asociación muy alta con el precio (rho = 0.8506), mientras que los parqueaderos (rho = 0.6878) y los baños (rho = 0.6802) también muestran asociaciones fuertes y altamente significativas. El número de habitaciones mantiene una relación positiva, pero más moderada (rho = 0.3342). En todos los casos, los valores p fueron menores a 0.001.
En relación con estrato, los resultados son aún más contundentes que en el caso 1. El ANOVA reportó F = 837.6 con p < 2e-16, y la prueba de Kruskal-Wallis arrojó chi-cuadrado = 1271.2 con p < 2.2e-16. Esto indica que el estrato segmenta de manera muy marcada el mercado de apartamentos en la Zona Sur. En términos sustantivos, el análisis exploratorio sugiere que este segmento presenta una estructura de precios más clara y explicable que la observada para casas en la Zona Norte.
Aunque estrato es, por naturaleza, una variable
categórica ordinal, en este estudio se decidió evaluarlo de dos maneras
en la etapa de modelación: como variable numérica y como factor. Esta
decisión se tomó con el fin de contrastar si su efecto sobre el precio
podía aproximarse mediante una tendencia creciente lineal o si, por el
contrario, requería una representación categórica más flexible. En
consecuencia, el tratamiento final de estrato en cada caso
no se definió únicamente por su naturaleza de medición, sino también por
criterios de ajuste, capacidad predictiva, parsimonia e
interpretabilidad del modelo. ### Estimación y comparación de modelos -
Caso 2 #### División entrenamiento / prueba
## [1] 1666 13
## [1] 715 13
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -994.93 -40.13 -0.48 40.56 859.65
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -250.46855 19.08685 -13.123 < 2e-16 ***
## areaconst 1.71445 0.07167 23.921 < 2e-16 ***
## estrato 53.36556 3.79658 14.056 < 2e-16 ***
## habitaciones -26.82342 4.72836 -5.673 1.65e-08 ***
## parqueaderos 73.95996 4.95923 14.914 < 2e-16 ***
## banios 45.50693 4.15427 10.954 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 98.29 on 1660 degrees of freedom
## Multiple R-squared: 0.7705, Adjusted R-squared: 0.7698
## F-statistic: 1114 on 5 and 1660 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = preciom ~ areaconst + factor(estrato) + habitaciones +
## parqueaderos + banios, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -951.53 -39.13 1.50 37.94 834.66
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -44.16459 16.27304 -2.714 0.006717 **
## areaconst 1.69453 0.06776 25.008 < 2e-16 ***
## factor(estrato)4 31.27872 12.07623 2.590 0.009679 **
## factor(estrato)5 42.39203 12.13450 3.494 0.000489 ***
## factor(estrato)6 189.33500 14.06997 13.457 < 2e-16 ***
## habitaciones -18.89269 4.51070 -4.188 2.96e-05 ***
## parqueaderos 63.64851 4.74616 13.411 < 2e-16 ***
## banios 36.12340 3.98231 9.071 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 92.84 on 1658 degrees of freedom
## Multiple R-squared: 0.7955, Adjusted R-squared: 0.7946
## F-statistic: 921.3 on 7 and 1658 DF, p-value: < 2.2e-16
| modelo | R2_ajustado | AIC | RMSE_test | MAE_test | R2_pred_test |
|---|---|---|---|---|---|
| Estrato numérico | 0.7698 | 20022.90 | 103.1030 | 59.6835 | 0.6354 |
| Estrato como factor | 0.7946 | 19834.63 | 97.1772 | 56.8952 | 0.6761 |
## [1] "fac"
En el caso 2, el modelo con estrato como factor superó claramente al
modelo con estrato numérico en prácticamente todos los criterios de
comparación. Presentó mayor R² ajustado (0.7946 frente a 0.7698), menor
AIC, menor RMSE de prueba y mejor R² predictivo. Por ello, el modelo
seleccionado para este caso fue el que trata el estrato como variable
categórica, lo cual resulta coherente con la fuerte diferenciación
observada entre niveles de estrato en el análisis exploratorio. En este
mercado, asumir que el efecto del estrato es estrictamente lineal parece
demasiado restrictivo; modelarlo como factor ofrece una representación
más flexible y más adecuada a los datos. Este resultado refuerza que,
aunque estrato puede explorarse como una variable ordinal
con tendencia creciente, en este caso su comportamiento en los datos se
representa mejor como una variable categórica, al capturar diferencias
no lineales entre niveles.
##
## Call:
## lm(formula = preciom ~ areaconst + factor(estrato) + habitaciones +
## parqueaderos + banios, data = train)
##
## Residuals:
## Min 1Q Median 3Q Max
## -951.53 -39.13 1.50 37.94 834.66
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -44.16459 16.27304 -2.714 0.006717 **
## areaconst 1.69453 0.06776 25.008 < 2e-16 ***
## factor(estrato)4 31.27872 12.07623 2.590 0.009679 **
## factor(estrato)5 42.39203 12.13450 3.494 0.000489 ***
## factor(estrato)6 189.33500 14.06997 13.457 < 2e-16 ***
## habitaciones -18.89269 4.51070 -4.188 2.96e-05 ***
## parqueaderos 63.64851 4.74616 13.411 < 2e-16 ***
## banios 36.12340 3.98231 9.071 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 92.84 on 1658 degrees of freedom
## Multiple R-squared: 0.7955, Adjusted R-squared: 0.7946
## F-statistic: 921.3 on 7 and 1658 DF, p-value: < 2.2e-16
El modelo final del caso 2 alcanzó un ajuste alto (R² ajustado = 0.7946), lo que significa que aproximadamente el 79.5 % de la variabilidad del precio de los apartamentos en la Zona Sur queda explicada por las variables incluidas. Este resultado es claramente superior al obtenido en el caso 1 y sugiere que el comportamiento del precio en este segmento es más estructurado y predecible. El coeficiente del área construida fue positivo y altamente significativo (β = 1.6945, p < 2e-16), lo que implica que cada metro cuadrado adicional aumenta en promedio el precio esperado en cerca de 1.69 millones de pesos, manteniendo constantes las demás variables.
Los coeficientes asociados a factor(estrato) muestran incrementos significativos frente al nivel de referencia, siendo especialmente notorio el salto para estrato 6 (β = 189.34, p < 2e-16). Esto confirma que el efecto del estrato no es simplemente lineal, sino que ciertos niveles capturan valorizaciones mucho mayores. De igual manera, tanto los parqueaderos (β = 63.65, p < 2e-16) como los baños (β = 36.12, p < 2e-16) presentan efectos positivos y relevantes desde el punto de vista comercial.
Un resultado que requiere interpretación cuidadosa es el coeficiente negativo de habitaciones (β = -18.89, p < 0.001). Esto no significa que tener más habitaciones reduzca por sí solo el valor del inmueble, sino que, manteniendo constante el área, un mayor número de habitaciones puede reflejar una distribución más subdividida del espacio, con menor amplitud relativa y, por tanto, menor valorización marginal. En otras palabras, el efecto es condicional: a igual tamaño total, un apartamento con más divisiones internas puede no ser percibido como más valioso. Este resultado es estadísticamente válido y también plausible desde el punto de vista inmobiliario.
##
## Shapiro-Wilk normality test
##
## data: residuals(mod_final_c2)
## W = 0.77523, p-value < 2.2e-16
##
## studentized Breusch-Pagan test
##
## data: mod_final_c2
## BP = 496.3, df = 7, p-value < 2.2e-16
##
## Durbin-Watson test
##
## data: mod_final_c2
## DW = 2.014, p-value = 0.6127
## alternative hypothesis: true autocorrelation is greater than 0
## GVIF Df GVIF^(1/(2*Df))
## areaconst 2.315410 1 1.521647
## factor(estrato) 1.796171 3 1.102532
## habitaciones 1.512501 1 1.229838
## parqueaderos 1.942133 1 1.393604
## banios 2.742540 1 1.656062
La validación de supuestos del caso 2 muestra un patrón similar al caso 1, pero con mayor intensidad en algunos incumplimientos. Los residuos no siguen una distribución normal (W = 0.77523, p < 2.2e-16) y la prueba de Breusch-Pagan fue claramente significativa (BP = 496.3, p < 2.2e-16), lo cual evidencia heterocedasticidad. Esto indica que la dispersión de los errores crece o cambia según el nivel del precio ajustado, situación frecuente en mercados inmobiliarios donde los inmuebles de mayor valor presentan también mayor variabilidad.
Sin embargo, no se observaron problemas de independencia residual (DW = 2.014, p = 0.6127) ni de multicolinealidad importante, ya que los valores transformados de GVIF permanecen bajos. En consecuencia, el modelo es estable desde la perspectiva de relación entre predictores, pero no cumple plenamente los supuestos clásicos de homocedasticidad y normalidad.
Para fortalecer la inferencia, en futuros análisis sería recomendable considerar transformaciones del precio, errores robustos o modelos alternativos segmentados por subzonas o barrios específicos.
La solicitud indica estrato 5 o 6, por lo cual se generan dos escenarios.
| escenario | fit | lwr | upr | |
|---|---|---|---|---|
| 1 | Estrato 5 | 711.44 | 527.24 | 895.63 |
| 11 | Estrato 6 | 858.38 | 674.11 | 1042.65 |
Para la vivienda 2 se evaluaron dos escenarios. La predicción puntual fue de aproximadamente 711.44 millones para estrato 5 y de 858.38 millones para estrato 6. En consecuencia, la solicitud resulta claramente viable para estrato 5, pues la estimación central se encuentra por debajo del presupuesto máximo de 850 millones. En el caso de estrato 6, la predicción puntual supera levemente ese límite, lo que sugiere una situación de frontera: la operación podría ser viable solo si se encuentran inmuebles con condiciones muy competitivas dentro del mercado o si se flexibiliza ligeramente alguna característica.
Los intervalos de predicción muestran, además, que existe variabilidad apreciable en los precios individuales, por lo que la interpretación debe hacerse con prudencia. No obstante, a diferencia del caso 1, aquí el comportamiento del mercado es más favorable frente al presupuesto. En síntesis, la solicitud de la vivienda 2 puede calificarse como viable, especialmente si el cliente prioriza estrato 5; para estrato 6, la viabilidad es más ajustada y debe evaluarse con cautela.
| zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud | estrato_f | score |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Zona Sur | 05 | 5 | 350 | 270.00 | 3 | 3 | 4 | Apartamento | capri | -76.54 | 3.39 | 5 | 45.00 |
| Zona Sur | NA | 5 | 670 | 300.00 | 3 | 5 | 6 | Apartamento | seminario | -76.55 | 3.41 | 5 | 55.00 |
| Zona Sur | 02 | 5 | 410 | 295.55 | 2 | 4 | 4 | Apartamento | cuarto de legua | -76.56 | 3.41 | 5 | 59.45 |
| Zona Sur | 01 | 5 | 450 | 267.00 | 3 | 3 | 3 | Apartamento | pampa linda | -76.55 | 3.40 | 5 | 63.00 |
| Zona Sur | 05 | 5 | 350 | 260.00 | 3 | 3 | 3 | Apartamento | capri | -76.54 | 3.39 | 5 | 70.00 |
Las cinco ofertas seleccionadas para el caso 2 se ubican en Capri, Seminario, Cuarto de Legua y Pampa Linda, con precios entre 350 y 670 millones y áreas entre 260 y 300 m². Entre ellas sobresale un apartamento en Seminario con 300 m², 3 parqueaderos, precio de 670 millones, 5 baños y 6 habitaciones, el cual es el más cercano en área y parqueaderos al requerimiento corporativo. También aparecen dos ofertas en Capri por 350 millones, con áreas de 260 y 270 m², 3 parqueaderos y 3 baños, que representan opciones muy favorables en precio aunque algo inferiores en área y habitaciones respecto al objetivo. A su vez, la opción de Cuarto de Legua con 295.55 m² y precio de 410 millones es especialmente cercana en área, aunque tiene 2 parqueaderos y 4 habitaciones.
Desde el punto de vista comercial, estas alternativas muestran que el mercado ofrece opciones cómodamente por debajo del presupuesto máximo, lo cual favorece la negociación. Sin embargo, también evidencian que no todas las características objetivo se alcanzan simultáneamente: las alternativas más baratas suelen quedarse cortas en habitaciones o área, mientras que las más cercanas al perfil completo tienden a encarecerse. En consecuencia, la mejor recomendación es presentar una combinación de opciones: una muy cercana al requerimiento técnico, como Seminario o Cuarto de Legua, y otras más eficientes en precio, como Capri, para que el cliente compare entre cercanía al perfil y conveniencia económica.
En el caso de las casas en la Zona Norte, el análisis evidenció que el área construida es el principal determinante del precio, seguida por el estrato, los baños y los parqueaderos. El modelo seleccionado presentó un ajuste moderado (R² ajustado ≈ 0.612) y una estructura coherente con la lógica del mercado, aunque con limitaciones asociadas a heterocedasticidad y no normalidad de residuos.
La predicción para la vivienda solicitada indica que la operación es factible en estrato 4 y menos probable en estrato 5 bajo el tope de 350 millones. Las ofertas potenciales seleccionadas muestran que sí existen alternativas cercanas al perfil solicitado, pero en general ubicadas justo en el límite del presupuesto o con pequeñas diferencias respecto al requerimiento original. Por tanto, la recomendación para María es presentar la solicitud como viable con restricciones, priorizando inmuebles de estrato 4 o aceptando leves flexibilizaciones en atributos secundarios.
En el caso de los apartamentos en la Zona Sur, el análisis mostró una estructura de precios más fuerte y más explicable que en el caso de las casas de la Zona Norte. El área construida, el estrato, los parqueaderos y los baños fueron determinantes clave del precio, y el modelo final logró un ajuste alto (R² ajustado ≈ 0.795). Además, la comparación de modelos evidenció que tratar el estrato como variable categórica mejora de forma importante el desempeño predictivo, lo que confirma la existencia de escalones de valorización entre niveles socioeconómicos.
La predicción para la vivienda 2 sugiere que la solicitud es viable, especialmente para estrato 5, y el conjunto de ofertas potenciales ratifica que existen varias alternativas dentro del presupuesto de 850 millones. Por tanto, este segundo caso presenta mejores condiciones de cierre que el primero, tanto por comportamiento estadístico del mercado como por disponibilidad de oferta efectiva.
Con base en la modelación realizada, la recomendación general para María es diferenciar claramente la estrategia comercial en ambos casos. Para la vivienda 1, la firma debería presentar la búsqueda como una solicitud parcialmente viable, enfatizando que el presupuesto de 350 millones permite encontrar opciones cercanas al perfil, pero principalmente en estrato 4 o con pequeñas flexibilizaciones en atributos como parqueaderos, baños o número de habitaciones. Para la vivienda 2, la recomendación es mucho más favorable: el mercado de apartamentos en la Zona Sur ofrece suficientes alternativas compatibles con el perfil solicitado y, en general, dentro del presupuesto aprobado, especialmente para estrato 5.
Desde el punto de vista metodológico, el estudio también sugiere que las predicciones deben utilizarse como apoyo a la toma de decisión y no como único criterio de compra, ya que tanto en el caso 1 como en el caso 2 se detectaron problemas de heterocedasticidad y no normalidad residual. Por ello, la recomendación final es que María complemente las predicciones con evaluación cualitativa del estado del inmueble, acabados, antigüedad, administración, seguridad y prestigio del sector. Esto permitirá transformar el análisis estadístico en una propuesta comercial más sólida, realista y defendible ante el cliente corporativo.
| zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Zona Oriente | NA | 3 | 250 | 70 | 1 | 3 | 6 | Casa | 20 de julio | -76.51168 | 3.43382 |
| Zona Oriente | NA | 3 | 320 | 120 | 1 | 2 | 3 | Casa | 20 de julio | -76.51237 | 3.43369 |
| Zona Oriente | NA | 3 | 350 | 220 | 2 | 2 | 4 | Casa | 20 de julio | -76.51537 | 3.43566 |
| Zona Sur | 02 | 4 | 400 | 280 | 3 | 5 | 3 | Casa | 3 de julio | -76.54000 | 3.43500 |
| Zona Norte | 01 | 5 | 260 | 90 | 1 | 2 | 3 | Apartamento | acopi | -76.51350 | 3.45891 |
| Zona Norte | 01 | 5 | 240 | 87 | 1 | 3 | 3 | Apartamento | acopi | -76.51700 | 3.36971 |
| Zona Norte | 01 | 4 | 220 | 52 | 2 | 2 | 3 | Apartamento | acopi | -76.51974 | 3.42627 |
| Zona Norte | 01 | 5 | 310 | 137 | 2 | 3 | 4 | Apartamento | acopi | -76.53105 | 3.38296 |
| Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| term | estimate | std.error | statistic | p.value | conf.low | conf.high |
|---|---|---|---|---|---|---|
| (Intercept) | -298.9580 | 56.1527 | -5.3240 | 0.0000 | -409.4640 | -188.4519 |
| areaconst | 0.7009 | 0.0626 | 11.1963 | 0.0000 | 0.5777 | 0.8241 |
| estrato | 88.6349 | 12.0653 | 7.3463 | 0.0000 | 64.8909 | 112.3790 |
| habitaciones | 9.5859 | 6.8033 | 1.4090 | 0.1599 | -3.8028 | 22.9746 |
| parqueaderos | 21.8842 | 7.0529 | 3.1028 | 0.0021 | 8.0043 | 35.7641 |
| banios | 24.0205 | 9.1262 | 2.6320 | 0.0089 | 6.0606 | 41.9804 |
| term | estimate | std.error | statistic | p.value | conf.low | conf.high |
|---|---|---|---|---|---|---|
| (Intercept) | -44.1646 | 16.2730 | -2.7140 | 0.0067 | -76.0825 | -12.2467 |
| areaconst | 1.6945 | 0.0678 | 25.0077 | 0.0000 | 1.5616 | 1.8274 |
| factor(estrato)4 | 31.2787 | 12.0762 | 2.5901 | 0.0097 | 7.5925 | 54.9650 |
| factor(estrato)5 | 42.3920 | 12.1345 | 3.4935 | 0.0005 | 18.5915 | 66.1926 |
| factor(estrato)6 | 189.3350 | 14.0700 | 13.4567 | 0.0000 | 161.7382 | 216.9318 |
| habitaciones | -18.8927 | 4.5107 | -4.1884 | 0.0000 | -27.7399 | -10.0454 |
| parqueaderos | 63.6485 | 4.7462 | 13.4105 | 0.0000 | 54.3394 | 72.9576 |
| banios | 36.1234 | 3.9823 | 9.0710 | 0.0000 | 28.3125 | 43.9343 |
| r.squared | adj.r.squared | sigma | statistic | p.value | df | logLik | AIC | BIC | deviance | df.residual | nobs |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0.618 | 0.6116 | 159.0192 | 96.4368 | 0 | 5 | -1969.311 | 3952.622 | 3978.641 | 7535560 | 298 | 304 |
| r.squared | adj.r.squared | sigma | statistic | p.value | df | logLik | AIC | BIC | deviance | df.residual | nobs |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0.7955 | 0.7946 | 92.8362 | 921.3178 | 0 | 7 | -9908.316 | 19834.63 | 19883.39 | 14289569 | 1658 | 1666 |