PREGUNTAS

Con base en los datos de ofertas de vivienda descargadas del portal Fincaraiz (datos_vivienda.xls), realizar los siguientes puntos:

  1. Análisis exploratorio (Variables “Precio de vivienda” y “Área de la vivienda”)

Realice un análisis exploratorio de las variables precio de vivienda (millones de pesos COP) y área de la vivienda (m2) - incluir gráficos e indicadores apropiados interpretados

##                                    prom_precio mediana_precio desvi_precio
## 25% Precio (Millones de pesos COP)    332.0769            305     82.14423
##     P25_prom_precio P50_prom_precio P75_prom_precio
## 25%          251.25             305             395
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   240.0   251.2   305.0   332.1   395.0   480.0
##                             prom_area mediana_area desvi_area P25_prom_area
## 25% Area (Metros cuadrados)  115.7469           97   35.54332            86
##     P50_prom_area P75_prom_area
## 25%            97           130
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    80.0    86.0    97.0   115.7   130.0   195.0

En los analisis realizado se puede observar que el precio promedio se observa alrededor de los 330 millones,con un rango de precios distribuidos uniformente entre 200 a 500 millones, con un area promedio alredor de los 115 metros cuadrados con una mayor inferencia en los metros sobre los 80 metros cuadrados.

  1. Realice un análisis exploratorio bivariado de datos enfocado en la relación entre la variable respuesta (y=precio) en función de la variable predictora (x=area) - incluir graficos e indicadores apropiados interpretados.
## [1] 0.9190295

En este analisis se muestra una relacion significativa directamente proporcional lo que indica que a mayor area construida, mayor será el precio en millones, como no lo indica las graficas,mostrando una relacion fuerte.

  1. Estime el modelo de regresión lineal simple entre precio = f(area)+e. Interprete los coeficientes del modelo β0, β1 en caso de ser correcto.
## 
## Call:
## lm(formula = precio_millon ~ Area_contruida)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -51.673 -25.612  -6.085  24.875  67.650 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      86.234     22.479   3.836 0.000796 ***
## Area_contruida    2.124      0.186  11.422 3.45e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared:  0.8446, Adjusted R-squared:  0.8381 
## F-statistic: 130.5 on 1 and 24 DF,  p-value: 3.45e-11

Para este analisis B0 es el minimo valor de la vivienda, es decir que si no tiene un área construida (x=0), que en este caso es 86.234 milllones. B1 por su parte nos dice que por cada metro cuadrado construido el valor de la vivienda incrementara 2.124 veces

  1. Construir un intervalo de confianza (95%) para el coeficiente 1, interpretar y concluir si el coeficiente es igual a cero o no. Compare este resultado con una prueba de hipotesis t.
##                   2.5 %     97.5 %
## (Intercept)    39.83983 132.627917
## Area_contruida  1.74017   2.507771

Para el analisis cuando un intervalo de confianza es del 95% podemos esperar β1 este entre 39.84 y 132.63.Con un intervalo de confianza del 95% podemos esperar β2 este entre 1.74 y 2.51.En ninguno de los casos el intervalo con el valor 0

  1. Calcule e interprete el indicador de bondad y ajuste R2.
## [1] 0.8446152

Por medio de este indicador nos demuestra que el area impacta sobre los precios con porcentaje sobre el 84%.

  1. Cual seria el precio promedio estimado para un apartamento de 110 metros cuadrados? Considera entonces con este resultado que un apartamento en la misma zona con 110 metros cuadrados en un precio de 200 millones seria una buena oferta? Que consideraciones adicionales se deben tener?.
## [1] 319.874

Segun el analisis sepodria determinar como una buena oferta, teniendo en cuenta que los precios para esa area construida oscilan entre 305 y 334 millones, y el precio pronosticado por el modelo estaría en aproximadamente 320 millones. Deebemos evaluar tambien varios factores como son depronto la necesidad del vendedor, el estado de conservacion en que se encuentre el inmueble y demas.

  1. Realice la validación de supuestos del modelo por medio de graficos apropiados, interpretarlos y sugerir posibles soluciones si se violan algunos de ellos.

Recordemos que modelo nos viene proporcionando un R-Squared de 0.8446, y por eso viendo la gráfica de los residuales contra los valores ajustados, se puede evidenicar una dispersicon ya que los datos tienen un comportamiento no lineal. Por tal motivo considero que se podría ajustar mejor el modelo.

  1. De ser necesario realice una transformación apropiada para mejorar el ajuste y supuestos del modelo.
## 
## Call:
## lm(formula = precio_millon ~ log(Area_contruida))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -45.837 -20.153  -1.878  20.145  55.145 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -948.53      89.09  -10.65 1.42e-10 ***
## log(Area_contruida)   271.88      18.88   14.40 2.63e-13 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 27 on 24 degrees of freedom
## Multiple R-squared:  0.8963, Adjusted R-squared:  0.8919 
## F-statistic: 207.4 on 1 and 24 DF,  p-value: 2.63e-13

  1. De ser necesario compare el ajuste y supuestos del modelo inicial y el transformado.
## 
## Call:
## lm(formula = precio_millon ~ Area_contruida)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -51.673 -25.612  -6.085  24.875  67.650 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      86.234     22.479   3.836 0.000796 ***
## Area_contruida    2.124      0.186  11.422 3.45e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared:  0.8446, Adjusted R-squared:  0.8381 
## F-statistic: 130.5 on 1 and 24 DF,  p-value: 3.45e-11
## 
## Call:
## lm(formula = precio_millon ~ log(Area_contruida))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -45.837 -20.153  -1.878  20.145  55.145 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -948.53      89.09  -10.65 1.42e-10 ***
## log(Area_contruida)   271.88      18.88   14.40 2.63e-13 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 27 on 24 degrees of freedom
## Multiple R-squared:  0.8963, Adjusted R-squared:  0.8919 
## F-statistic: 207.4 on 1 and 24 DF,  p-value: 2.63e-13

Analizando el modelo propuesto podemos ver que la distribución continua siendo normal, y mejora R-squared, dejando como conclusión que el modelo propuesto puede explicar el precio de la vivienda un 89.63% con respecto al inicial del 84.46%