Problema

Con base en los datos de ofertas de vivienda descargadas del portal Fincaraiz para apartamento de estrato 4 con área construida menor a 200 m2 (vivienda4.RDS) la inmobiliaria A&C requiere el apoyo de un cientifico de datos en la construcción de un modelo que lo oriente sobre los precios de inmuebles.

data(vivienda4)
summary_data_viviendas <- summary(vivienda4)

# Crear la tabla con formato
kable(summary_data_viviendas, caption = "Resumen de las Variables en vivienda") %>%
  kable_styling(full_width = FALSE, position = "left") %>%
  row_spec(0, bold = TRUE, color = "white", background = "darkblue") %>%
  column_spec(1, bold = TRUE, color = "blue") %>%
  add_header_above(c(" " = 1, "Estadísticas Descriptivas" = 5))  # Ajusta según el número de columnas
Resumen de las Variables en vivienda
Estadísticas Descriptivas
zona estrato preciom areaconst tipo
Zona Centro : 8 3: 0 Min. :207.4 Min. : 40.00 Apartamento:1363
Zona Norte : 288 4:1706 1st Qu.:230.7 1st Qu.: 60.00 Casa : 343
Zona Oeste : 60 5: 0 Median :238.8 Median : 75.00 NA
Zona Oriente: 6 6: 0 Mean :243.7 Mean : 87.63 NA
Zona Sur :1344 NA 3rd Qu.:251.5 3rd Qu.: 98.00 NA
NA NA Max. :309.7 Max. :200.00 NA

Esta base a los datos anteriores se cuenta con 1706 observaciones de viviendas inmobiliarias y 5 variables relacionadas con el mercado inmobiliario. De tipo cuantitativo (precio, area construida) y variables de tipo cualitativo (tipo de vivienda, zona de ubicación y estrato sociodemografico), la base no presenta valores faltantes por lo cual no se realiza ningun tipo de transformación de los datos.

data_aptos_sur = vivienda4 %>% filter(estrato == 4 & areaconst < 200 & tipo == 'Apartamento' & zona=='Zona Sur')
summary_data_aptos <- summary(data_aptos_sur)

# Crear la tabla con formato
kable(summary_data_aptos, caption = "Resumen de las Variables de Vivienda Tipo= Apartamento, Zona Sur") %>%
  kable_styling(full_width = FALSE, position = "left") %>%
  row_spec(0, bold = TRUE, color = "white", background = "darkblue") %>%
  column_spec(1, bold = TRUE, color = "blue") %>%
  add_header_above(c(" " = 1, "Estadísticas Descriptivas Para Vivienda Tipo= Apartamento, Zona = Zona Sur " = 5))  # Ajusta según el número de columnas
Resumen de las Variables de Vivienda Tipo= Apartamento, Zona Sur
Estadísticas Descriptivas Para Vivienda Tipo= Apartamento, Zona = Zona Sur
zona estrato preciom areaconst tipo
Zona Centro : 0 3: 0 Min. :207.4 Min. : 40.00 Apartamento:1063
Zona Norte : 0 4:1063 1st Qu.:228.6 1st Qu.: 60.00 Casa : 0
Zona Oeste : 0 5: 0 Median :235.7 Median : 70.00 NA
Zona Oriente: 0 6: 0 Mean :237.1 Mean : 74.33 NA
Zona Sur :1063 NA 3rd Qu.:243.2 3rd Qu.: 83.00 NA
NA NA Max. :300.4 Max. :198.00 NA

1.Realice un análisis exploratorio de las variables precio de vivienda (millones de pesos COP) y área de la vivienda (metros cuadrados) - incluir gráficos e indicadores apropiados interpretados.

# Estadísticas descriptivas
summarytools::descr(data_aptos_sur[,c(3,4)])
## Descriptive Statistics  
## data_aptos_sur  
## N: 1063  
## 
##                     areaconst   preciom
## ----------------- ----------- ---------
##              Mean       74.33    237.06
##           Std.Dev       20.90     12.65
##               Min       40.00    207.41
##                Q1       60.00    228.56
##            Median       70.00    235.74
##                Q3       83.00    243.21
##               Max      198.00    300.45
##               MAD       14.83     10.80
##               IQR       23.00     14.62
##                CV        0.28      0.05
##          Skewness        1.98      1.14
##       SE.Skewness        0.08      0.08
##          Kurtosis        6.29      2.86
##           N.Valid     1063.00   1063.00
##         Pct.Valid      100.00    100.00
# Histograma de precios 
g1 <-ggplot(data_aptos_sur, aes(x = preciom)) +
  stat_bin(aes(y = ..count..), bins = 30, fill = "#548b54", color = "#2E8B57", size = 1) +  # Líneas del histograma
  geom_density(aes(y = ..density.. * nrow(data_aptos_sur)), color = "red", size = 1) +  # Línea de densidad
  labs(title = "Distrib.Precio de Vivienda (millones de COP)",
       x = "Precio (millones de COP)",
       y = "Frecuencia") +
  theme_minimal()+
  theme(text = element_text(size = 10),  # Tamaño del texto general
        plot.title = element_text(size = 10, hjust = 0.5),  # Ajusta el tamaño del título
        axis.title = element_text(size = 10),  # Títulos de los ejes
        axis.text = element_text(size = 9))  # Texto de los ejes

# Histograma de área construida
g2 <- ggplot(data_aptos_sur,aes(x = areaconst)) +
  stat_bin(aes(y = ..count..), bins = 30, fill = "#548b54", color = "#2E8B57", size = 1) +  # Líneas del histograma
  geom_density(aes(y = ..density.. * nrow(data_aptos_sur)), color = "red", size = 1) +  # Línea de densidad
  labs(title = "Distrib. del Area de Vivienda (m2)",
       x = "Area (m2)",
       y = "Frecuencia") +
  theme_minimal() +
  theme(text = element_text(size = 10),  # Tamaño del texto general
        plot.title = element_text(size = 10, hjust = 0.5),  # Ajusta el tamaño del título
        axis.title = element_text(size = 10),  # Títulos de los ejes
        axis.text = element_text(size = 9))  # Texto de los ejes

grid.arrange(g1, g2, ncol = 2)

Se indica que el precio de los Apartamentos de estrato 4, ubicados en la zona sur los valores van desde 207.4 hasta 300.4. Esto indica una variabilidad considerable en los precios.

Distribución: La media (237.5) es ligeramente superior a la mediana (236.1), lo que sugiere que podría haber algunos valores altos que están aumentando la media, pero en general los datos parecen estar bastante equilibrados.

Cuartiles: El primer cuartil (228.8) y el tercer cuartil (243.6) muestran que el 50% central de los datos se encuentra entre estos valores, lo que indica una tendencia a que la mayoría de los precios se concentran en ese rango.

Se indica que el Area construida de los Apartamentos de estrato 4, ubicados en la zona sur, los valores oscilan entre 40.0 y 198.0, mostrando también una variabilidad, aunque no tan amplia como el precio.

Distribución: La media (75.2) es mayor que la mediana (70.0), lo que sugiere que hay algunos valores relativamente altos que están influyendo en la media, similar a lo que se observa en el precio.

Cuartiles: El primer cuartil (60.0) y el tercer cuartil (83.0) indican que la mayoría de las áreas se sitúan dentro de este rango, sugiriendo que la mayoría de los datos están concentrados en áreas más pequeñas.

  1. Realice un análisis exploratorio bivariado de datos, enfocado en la relación entre la variable respuesta (precio) en función de la variable predictora (área construida) - incluir gráficos e indicadores apropiados interpretados.
# Diagrama de dispersión
ggplot(data_aptos_sur, aes(x = areaconst, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm", col = "blue") +
  labs(title = "Relación entre Área de Construcción y Precio por m²",
       x = "Área de Construcción (m²)",
       y = "Precio por m² ($)") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

cor(data_aptos_sur$areaconst, data_aptos_sur$preciom)
## [1] 0.8271749

Un coeficiente de 0.8272 indica una relación fuerte. Esto sugiere que cambios en el área de construcción están significativamente asociados con cambios en el precio por metro cuadrado.

La correlación es positiva, lo que significa que a medida que el área de construcción aumenta, el precio por metro cuadrado también tiende a aumentar. Esto podría implicar que propiedades más grandes o espacios más amplios son valorados más en el mercado.

  1. Estime el modelo de regresión lineal simple entre precio=f(area)+ε. Interprete los coeficientes del modelo β0, β1 en caso de ser correcto.
modelo <- lm(preciom ~ areaconst, data_aptos_sur)
summary(modelo)
## 
## Call:
## lm(formula = preciom ~ areaconst, data = data_aptos_sur)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -26.615  -5.083  -0.005   4.638  21.581 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 199.83270    0.80650  247.78   <2e-16 ***
## areaconst     0.50084    0.01045   47.95   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.114 on 1061 degrees of freedom
## Multiple R-squared:  0.6842, Adjusted R-squared:  0.6839 
## F-statistic:  2299 on 1 and 1061 DF,  p-value: < 2.2e-16
mresiduals = modelo$residuals

Interpretación: Cuando areaconst es 0, se espera que el precio por metro cuadrado sea aproximadamente $199.83. Este valor puede no ser relevante en la práctica, pero sirve como un punto de referencia.

Interpretación: Por cada metro cuadrado adicional de areaconst, se espera que el precio por metro cuadrado aumente en aproximadamente $0.50. Esto sugiere que existe una relación positiva entre el área de construcción y el precio por metro cuadrado.

El modelo sugiere que existe una relación positiva significativa entre el área de construcción y el precio por metro cuadrado, con un ajuste razonable del modelo a los datos. Esto implica que un aumento en el área de construcción está asociado con un aumento en el precio por metro cuadrado.

4.Construir un intervalo de confianza (95%) para el coeficiente β1, interpretar y concluir si el coeficiente es igual a cero o no. Compare este resultado con una prueba de hipótesis t.

# Intervalo de confianza del 95% para los coeficientes
kable(confint(modelo, level = 0.95))
2.5 % 97.5 %
(Intercept) 198.2501786 201.4152135
areaconst 0.4803427 0.5213358
# Estadístico t y p-valor
prueba_t <- shapiro.test(mresiduals)
prueba_t 
## 
##  Shapiro-Wilk normality test
## 
## data:  mresiduals
## W = 0.99885, p-value = 0.7465

Intercepto:

Límite inferior (2.5%): 198.25 Límite superior (97.5%): 201.42 Interpretación: Estás 95% seguro de que el verdadero valor del intercepto se encuentra entre 198.25 y 201.42. Esto significa que, cuando areaconst es cero, el precio esperado (preciom) está en ese rango. Aunque el intercepto puede no ser siempre interpretado de manera práctica (especialmente si areaconst no puede ser cero), es una estimación válida.

Pendiente (areaconst): Límite inferior (2.5%): 0.48034 Límite superior (97.5%): 0.52134 Interpretación: Estás 95% seguro de que el verdadero valor de 𝛽1 β1 ​ (el efecto del área en el precio) se encuentra entre 0.48034 y 0.52134. Esto significa que por cada unidad adicional de areaconst, se espera que preciom aumente entre 0.48034 y 0.52134 unidades monetarias. Conclusión sobre la significancia Dado que el intervalo de confianza para areaconst no incluye el cero, puedes concluir que hay una relación significativa entre el área y el precio en tu modelo de regresión. Esto indica que aumentar el área constante tiene un efecto positivo en el precio.

Este valor está muy cerca de 1, lo cual sugiere que la distribución de los residuos (en este caso, mresiduals) es bastante cercana a una distribución normal. Valor p:

El valor p es 0.7465, lo que es mucho mayor que el nivel de significancia comúnmente utilizado (0.05 o 0.01).

Esto significa que no hay suficiente evidencia para rechazar la hipótesis nula del test, que establece que los datos provienen de una distribución normal.

Conclusión Dado que el valor p es alto (0.7465), puedes concluir que los residuos del modelo se distribuyen normalmente. Esto es un buen indicativo para validar las suposiciones del modelo de regresión lineal, ya que una de las suposiciones es que los errores (residuos) deben ser normalmente distribuidos.

  1. Calcule e interprete el indicador de bondad R2.
summary(modelo)$r.squared
## [1] 0.6842183

Proporción de Variabilidad Explicada:

Este valor indica que aproximadamente el 68.42% de la variabilidad en preciom puede ser explicada por el modelo que incluye areaconst. Es decir, el área constante tiene una relación significativa con el precio.

Relación Moderada: Un R2 de 0.6842 sugiere que hay una relación moderada entre las variables. Aunque el modelo explica una buena parte de la variabilidad, todavía hay un 31.58% de la variabilidad en preciom que no es explicada por areaconst.

Esto podría indicar que hay otros factores que influyen en el precio que no se han incluido en el modelo.

El valor de R2 =0.6842 sugiere que tu modelo de regresión lineal es razonablemente bueno para predecir preciom a partir de areaconst, pero también indica que hay espacio para mejorar, ya sea incluyendo más variables o explorando diferentes formas del modelo.

  1. ¿Cuál sería el precio promedio estimado para un apartamento de 110 metros cuadrados? Considera entonces con este resultado que un apartamento en la misma zona con 110 metros cuadrados en un precio de 200 millones sería una atractiva esta oferta? ¿Qué consideraciones adicionales se deben tener?.
# Predecir el precio para un apartamento de 110 metros cuadrados
 prediccion <- predict(modelo, data.frame(areaconst = 110), interval = "confidence")

# Mostrar la predicción y el intervalo de confianza
print(prediccion)
##       fit      lwr      upr
## 1 254.925 254.0777 255.7723

Interpretación Precio Estimado (fit):

254.925 millones: Este es el precio promedio estimado para un apartamento de 110 metros cuadrados. Intervalo de Confianza:

Límite Inferior (lwr): 254.0777 millones: Este es el límite inferior del intervalo de confianza, lo que significa que estamos 95% seguros de que el verdadero precio promedio de un apartamento de 110 metros cuadrados no es inferior a este valor. Límite Superior (upr): 255.7723 millones: Este es el límite superior del intervalo de confianza, lo que indica que estamos 95% seguros de que el verdadero precio promedio no excede este valor. Comparación con la Oferta Precio de 200 millones: El precio estimado (254.925 millones) está significativamente por encima del precio de 200 millones. Esto sugiere que la oferta de 200 millones sería muy atractiva, ya que está considerablemente por debajo de la estimación de precio para un apartamento de ese tamaño en la misma zona. Consideraciones Adicionales Condiciones del Apartamento:

Aunque la oferta parece atractiva desde un punto de vista financiero, también es importante considerar el estado del apartamento, su ubicación, y otros factores que pueden influir en su valor real. Mercado Inmobiliario:

La dinámica del mercado puede variar, por lo que también es recomendable investigar precios de propiedades similares en la misma área. Costos Adicionales:

Considera también posibles costos adicionales, como impuestos, mantenimiento, y cualquier trabajo que necesite el apartamento. Resumen La oferta de 200 millones es muy atractiva en comparación con el precio estimado de 254.925 millones.

  1. Realice la validación de los supuestos del modelo por medio de gráficos apropiados, interpretarlos y sugerir posibles soluciones si se violan algunos de ellos. Utilice las pruebas de hipótesis para la validación de supuestos y compare los resultados con lo observado en los gráficos asociados.
# Establecer la disposición de gráficos en 2 filas y 2 columnas
par(mfrow = c(2, 2))

# Graficar los diagnósticos del modelo
plot(modelo)

# Restablecer la configuración gráfica
par(mfrow = c(1, 1))


normalu  <- modelo$residuals
shapiro.test(normalu )
## 
##  Shapiro-Wilk normality test
## 
## data:  normalu
## W = 0.99885, p-value = 0.7465

El p-valor de 0.7465 es mucho mayor que el nivel común de significancia de 0.05. Esto significa que no hay suficiente evidencia para rechazar la hipótesis nula, que afirma que los datos son normalmente distribuidos.

gqtest(modelo)
## 
##  Goldfeld-Quandt test
## 
## data:  modelo
## GQ = 1.0651, df1 = 530, df2 = 529, p-value = 0.2342
## alternative hypothesis: variance increases from segment 1 to 2

Un p-valor de 0.2342 es mayor que el nivel común de significancia de 0.05.sugiere que no hay suficiente n p-valor de 0.2342 es mayor que 0.05, lo que indica que no hay suficiente evidencia para rechazar la hipótesis nula. Por lo tanto, concluyo que no hay evidencia de heterocedasticidad en los residuos del modelo y las varianzas de los errores son constantes.

dwtest(modelo)
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 2.0044, p-value = 0.5242
## alternative hypothesis: true autocorrelation is greater than 0

El valor de DW está cerca de 2, lo que generalmente indica que no hay autocorrelación en los residuos. Un p-valor de 0.5242 es alto, lo que sugiere que no hay suficiente evidencia para rechazar la hipótesis nula. Esto indica que no hay evidencia de autocorrelación en los residuos del modelo.

8.De ser necesario realice una transformación apropiada para mejorar el ajuste y supuestos del modelo.

modelo_transformado = lm( log( preciom ) ~ areaconst, data_aptos_sur)

#Transformación raíz cuadrada
modelo_raiz <- lm(sqrt(preciom) ~ areaconst, data_aptos_sur)

stargazer(modelo_transformado,modelo_raiz, type = "text", df=FALSE)
## 
## ================================================
##                         Dependent variable:     
##                     ----------------------------
##                      log(preciom)  sqrt(preciom)
##                          (1)            (2)     
## ------------------------------------------------
## areaconst              0.002***      0.016***   
##                       (0.00004)      (0.0003)   
##                                                 
## Constant               5.316***      14.207***  
##                        (0.003)        (0.026)   
##                                                 
## ------------------------------------------------
## Observations            1,063          1,063    
## R2                      0.665          0.675    
## Adjusted R2             0.665          0.675    
## Residual Std. Error     0.030          0.231    
## F Statistic          2,105.564***  2,202.016*** 
## ================================================
## Note:                *p<0.1; **p<0.05; ***p<0.01
  1. De ser necesario compare el ajuste y supuestos del modelo inicial y el transformado.

Dado los resultados de las transformaciones y del modelo inicial, no es necesario comparar los supuestos de ambos modelos, ya que las pruebas de normalidad y el valor de R² del modelo proporcionan resultados confiables.

  1. Estime varios modelos y compare los resultados obtenidos. En el mejor de los modelos, ¿se cumplen los supuestos sobre los errores?
modelo = lm( preciom ~ areaconst, data_aptos_sur)           #lin - lin
modelo2 = lm(log(preciom) ~ areaconst, data_aptos_sur)      #log - lin
modelo_raiz <- lm(sqrt(preciom) ~ areaconst, data_aptos_sur)


#Imprimir los resultados de los modelos
stargazer(modelo,modelo2,modelo_raiz, type = "text", df=FALSE)
## 
## ===========================================================
##                               Dependent variable:          
##                     ---------------------------------------
##                       preciom    log(preciom) sqrt(preciom)
##                         (1)          (2)           (3)     
## -----------------------------------------------------------
## areaconst             0.501***     0.002***     0.016***   
##                       (0.010)     (0.00004)     (0.0003)   
##                                                            
## Constant             199.833***    5.316***     14.207***  
##                       (0.807)      (0.003)       (0.026)   
##                                                            
## -----------------------------------------------------------
## Observations           1,063        1,063         1,063    
## R2                     0.684        0.665         0.675    
## Adjusted R2            0.684        0.665         0.675    
## Residual Std. Error    7.114        0.030         0.231    
## F Statistic         2,298.916*** 2,105.564*** 2,202.016*** 
## ===========================================================
## Note:                           *p<0.1; **p<0.05; ***p<0.01
#Coeficientes del modelo
coeficientes <- coef(modelo)
print(coeficientes)
## (Intercept)   areaconst 
## 199.8326961   0.5008392
#Coeficiente modelo logarítmico en el precio
coeficientes1 <- coef(modelo2)
print(coeficientes1)
## (Intercept)   areaconst 
##  5.31592054  0.00203171
#Coeficiente modelo raiz cuadrada
coeficientes2 <- coef(modelo_raiz)
print(coeficientes2)
## (Intercept)   areaconst 
## 14.20651834  0.01594107
# Imprimir los resultados con formato personalizado
stargazer(modelo, modelo2, modelo_raiz, 
          type = "text",              # Salida en texto
          dep.var.labels = c("Precio (Modelo Lineal)", "Log(Precio)", "Raíz Cuadrada de Precio"),
          covariate.labels = c("Área Constante"),
          digits = 3,                 # Número de decimales
          omit.stat = c("f", "ser"),  # Omitir estadísticas F y errores estándar
          star.char = c("*", "**", "***"),  # Caracteres de significancia
          star.size = 1.5,            # Tamaño de los caracteres de significancia
          no.space = TRUE)            # Eliminar espacios adicionales
## 
## =========================================================================
##                                   Dependent variable:                    
##                ----------------------------------------------------------
##                Precio (Modelo Lineal) Log(Precio) Raíz Cuadrada de Precio
##                         (1)               (2)               (3)          
## -------------------------------------------------------------------------
## Área Constante        0.501***         0.002***          0.016***        
##                       (0.010)          (0.00004)         (0.0003)        
## Constant             199.833***        5.316***          14.207***       
##                       (0.807)           (0.003)           (0.026)        
## -------------------------------------------------------------------------
## Observations           1,063             1,063             1,063         
## R2                     0.684             0.665             0.675         
## Adjusted R2            0.684             0.665             0.675         
## =========================================================================
## Note:                                         *p<0.1; **p<0.05; ***p<0.01
## 
## =====
## 1.500
## -----
#Prueba de Shapiro
shapiro <- shapiro.test(residuals(modelo2))
print(shapiro)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo2)
## W = 0.99885, p-value = 0.7458
#Durbin-Watson
wtest <- dwtest(modelo2) 
print(wtest)
## 
##  Durbin-Watson test
## 
## data:  modelo2
## DW = 2.0055, p-value = 0.5313
## alternative hypothesis: true autocorrelation is greater than 0
#Breusch-Pagan
bptest <- bptest(modelo2)
print(bptest)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo2
## BP = 3.3629, df = 1, p-value = 0.06668
#Prueba de Shapiro
shapiro <- shapiro.test(residuals(modelo_raiz))
print(shapiro)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_raiz)
## W = 0.999, p-value = 0.8435
#Durbin-Watson
wtest <- dwtest(modelo_raiz) 
print(wtest)
## 
##  Durbin-Watson test
## 
## data:  modelo_raiz
## DW = 2.0055, p-value = 0.5317
## alternative hypothesis: true autocorrelation is greater than 0
#Breusch-Pagan
bptest <- bptest(modelo_raiz)
print(bptest)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_raiz
## BP = 1.3622, df = 1, p-value = 0.2432
# Establecer la disposición de gráficos en 2 filas y 2 columnas
par(mfrow = c(2, 2))

plot(modelo2)

# Restablecer la configuración gráfica

par(mfrow = c(1, 1))



# Establecer la disposición de gráficos en 2 filas y 2 columnas
par(mfrow = c(2, 2))

plot(modelo_raiz)

par(mfrow = c(1, 1))

El modelo original muestra mejores resultados que los modelos logarítmicos y de raíz cuadrada. En una prueba de hipótesis, como la de Breusch-Pagan, los modelos alternativos presentaron valores p por debajo del nivel de significancia, indicando heterocedasticidad. Además, el valor R² de estos modelos es menor que el del modelo original, lo que sugiere que la variable independiente es relevante para predecir la variable dependiente.

El análisis realizado sobre los modelos de regresión lineal, logarítmico y de raíz cuadrada para predecir el Precio en función del Área Constante revela que el Modelo Lineal es el más efectivo y significativo. Este modelo no solo presenta el mayor coeficiente de determinación (R² = 0.684), indicando que explica adecuadamente la variabilidad del Precio, sino que también ofrece una interpretación clara y directa de la relación entre las variables.

Los coeficientes obtenidos muestran que el área tiene un impacto positivo y significativo en el Precio, lo que sugiere que a medida que el área aumenta, también lo hace el Precio, con una relación lineal robusta. Aunque los modelos alternativos, como el logarítmico y la raíz cuadrada, pueden ser útiles en contextos específicos, sus menores capacidades explicativas limitan su efectividad en este caso.

En resumen, el Modelo Lineal es la mejor elección para entender y predecir el Precio basado en el Área Constante, proporcionando una base sólida para futuras investigaciones o aplicaciones en el ámbito de precios y propiedades.