Analisis datos vivienda

#Cargar librerias
library(readxl)
library(ggplot2)
library(CGPfunctions)
setwd("C:/Users/User/Documents/Clase")
viviendas=read_excel("datos_vivienda.xlsx")
head(viviendas)
## # A tibble: 6 × 2
##   Area_contruida precio_millon
##            <dbl>         <dbl>
## 1             86           250
## 2            118           385
## 3            130           395
## 4            181           419
## 5             86           240
## 6             98           320
attach(viviendas)

Estadísticos Descriptivos

prom_area=mean(Area_contruida)
desv_area=sd(Area_contruida)
p25_area=quantile(Area_contruida,prob=c(0.25))
p50_area=quantile(Area_contruida,prob=c(0.50))
p75_area=quantile(Area_contruida,prob=c(0.75))

data.frame(prom_area,desv_area,p25_area,p50_area,p75_area)
##     prom_area desv_area p25_area p50_area p75_area
## 25%  115.7469  35.54332       86       97      130
ggplot(viviendas,aes(x=Area_contruida))+
  geom_histogram()+theme_bw()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

par(mfrow=c(1,2))
boxplot(Area_contruida,col = 'ivory',main= "Área construida", ylab='Metros2')
boxplot(precio_millon,col = 'azure',main= "Precio Inmueble", ylab='Precio en millones')

cor(precio_millon,Area_contruida)
## [1] 0.9190295
plot(precio_millon, Area_contruida,col="#CD6600",main = 'Precio vs área construida')

Regresion Lineal

modelo=lm(Area_contruida ~ precio_millon)
summary(modelo)
## 
## Call:
## lm(formula = Area_contruida ~ precio_millon)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -24.687 -10.580   1.403   5.868  32.360 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -16.30633   11.89687  -1.371    0.183    
## precio_millon   0.39766    0.03482  11.422 3.45e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.3 on 24 degrees of freedom
## Multiple R-squared:  0.8446, Adjusted R-squared:  0.8381 
## F-statistic: 130.5 on 1 and 24 DF,  p-value: 3.45e-11
plot(precio_millon, Area_contruida,col="#CD6600",main = 'Precio vs área construida')
abline(modelo,col='blue',lwd=2)