PREGUNTAS
Con base en los datos de ofertas de vivienda descargadas del portal Fincaraiz (datos_vivienda.xls), realizar los siguientes puntos:
Realice un análisis exploratorio de las variables precio de vivienda (millones de pesos COP) y área de la vivienda (m2) - incluir gráficos e indicadores apropiados interpretados
## prom_precio mediana_precio desvi_precio
## 25% Precio (Millones de pesos COP) 332.0769 305 82.14423
## P25_prom_precio P50_prom_precio P75_prom_precio
## 25% 251.25 305 395
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 240.0 251.2 305.0 332.1 395.0 480.0
## prom_area mediana_area desvi_area P25_prom_area
## 25% Area (Metros cuadrados) 115.7469 97 35.54332 86
## P50_prom_area P75_prom_area
## 25% 97 130
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 80.0 86.0 97.0 115.7 130.0 195.0
En los analisis realizado se puede observar que el precio promedio se observa alrededor de los 330 millones,con un rango de precios distribuidos uniformente entre 200 a 500 millones, con un area promedio alredor de los 115 metros cuadrados con una mayor inferencia en los metros sobre los 80 metros cuadrados.
## [1] 0.9190295
En este analisis se muestra una relacion significativa directamente proporcional lo que indica que a mayor area construida, mayor será el precio en millones, como no lo indica las graficas,mostrando una relacion fuerte.
##
## Call:
## lm(formula = precio_millon ~ Area_contruida)
##
## Residuals:
## Min 1Q Median 3Q Max
## -51.673 -25.612 -6.085 24.875 67.650
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.234 22.479 3.836 0.000796 ***
## Area_contruida 2.124 0.186 11.422 3.45e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared: 0.8446, Adjusted R-squared: 0.8381
## F-statistic: 130.5 on 1 and 24 DF, p-value: 3.45e-11
Para este analisis B0 es el minimo valor de la vivienda, es decir que si no tiene un área construida (x=0), que en este caso es 86.234 milllones. B1 por su parte nos dice que por cada metro cuadrado construido el valor de la vivienda incrementara 2.124 veces
## 2.5 % 97.5 %
## (Intercept) 39.83983 132.627917
## Area_contruida 1.74017 2.507771
Para el analisis cuando un intervalo de confianza es del 95% podemos esperar β1 este entre 39.84 y 132.63.Con un intervalo de confianza del 95% podemos esperar β2 este entre 1.74 y 2.51.En ninguno de los casos el intervalo con el valor 0
## [1] 0.8446152
Por medio de este indicador nos demuestra que el area impacta sobre los precios con porcentaje sobre el 84%.
## [1] 319.874
Segun el analisis sepodria determinar como una buena oferta, teniendo en cuenta que los precios para esa area construida oscilan entre 305 y 334 millones, y el precio pronosticado por el modelo estaría en aproximadamente 320 millones. Deebemos evaluar tambien varios factores como son depronto la necesidad del vendedor, el estado de conservacion en que se encuentre el inmueble y demas.
Recordemos que modelo nos viene proporcionando un R-Squared de 0.8446, y por eso viendo la gráfica de los residuales contra los valores ajustados, se puede evidenicar una dispersicon ya que los datos tienen un comportamiento no lineal. Por tal motivo considero que se podría ajustar mejor el modelo.
##
## Call:
## lm(formula = precio_millon ~ log(Area_contruida))
##
## Residuals:
## Min 1Q Median 3Q Max
## -45.837 -20.153 -1.878 20.145 55.145
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -948.53 89.09 -10.65 1.42e-10 ***
## log(Area_contruida) 271.88 18.88 14.40 2.63e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 27 on 24 degrees of freedom
## Multiple R-squared: 0.8963, Adjusted R-squared: 0.8919
## F-statistic: 207.4 on 1 and 24 DF, p-value: 2.63e-13
##
## Call:
## lm(formula = precio_millon ~ Area_contruida)
##
## Residuals:
## Min 1Q Median 3Q Max
## -51.673 -25.612 -6.085 24.875 67.650
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.234 22.479 3.836 0.000796 ***
## Area_contruida 2.124 0.186 11.422 3.45e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared: 0.8446, Adjusted R-squared: 0.8381
## F-statistic: 130.5 on 1 and 24 DF, p-value: 3.45e-11
##
## Call:
## lm(formula = precio_millon ~ log(Area_contruida))
##
## Residuals:
## Min 1Q Median 3Q Max
## -45.837 -20.153 -1.878 20.145 55.145
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -948.53 89.09 -10.65 1.42e-10 ***
## log(Area_contruida) 271.88 18.88 14.40 2.63e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 27 on 24 degrees of freedom
## Multiple R-squared: 0.8963, Adjusted R-squared: 0.8919
## F-statistic: 207.4 on 1 and 24 DF, p-value: 2.63e-13
Analizando el modelo propuesto podemos ver que la distribución continua siendo normal, y mejora R-squared, dejando como conclusión que el modelo propuesto puede explicar el precio de la vivienda un 89.63% con respecto al inicial del 84.46%