Analisis datos vivienda Metrocuadrado

#cargar librerias
library(readxl)
library(ggplot2)
library(CGPfunctions)
setwd("D:/GOMBRA/TRABAJO/DOCENCIA/KONRAND LORENZ/Nivelatorios")
viviendas=read_excel("datos_vivienda.xlsx")
head(viviendas)
## # A tibble: 6 × 2
##   Area_contruida precio_millon
##            <dbl>         <dbl>
## 1             86           250
## 2            118           385
## 3            130           395
## 4            181           419
## 5             86           240
## 6             98           320
attach(viviendas)

Estadisticos Descriptivos

prom_area=mean(Area_contruida)
desv_area=sd(Area_contruida)
p25_area=quantile(Area_contruida,prob=c(0.25))
p50_area=quantile(Area_contruida,prob=c(0.50))
p75_area=quantile(Area_contruida,prob=c(0.75))

data.frame(prom_area,desv_area,p25_area,p50_area,p75_area)
##     prom_area desv_area p25_area p50_area p75_area
## 25%  115.7469  35.54332       86       97      130

Analisis Grafico

ggplot(viviendas,aes(x=Area_contruida))+
  geom_histogram()+theme_bw()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

par(mfrow=c(1,2))
boxplot(Area_contruida,col = 'ivory',main="Area Construida",ylab='metros2')
boxplot(precio_millon,col = 'azure1',main="Precio Inmueble",ylab='Precio en Millones')

cor(precio_millon,Area_contruida)
## [1] 0.9190295
plot(precio_millon,Area_contruida,col="#CD6600",main='precio vs area construida')

Regresion Lineal

modelo=lm(precio_millon~Area_contruida)
summary(modelo)
## 
## Call:
## lm(formula = precio_millon ~ Area_contruida)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -51.673 -25.612  -6.085  24.875  67.650 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      86.234     22.479   3.836 0.000796 ***
## Area_contruida    2.124      0.186  11.422 3.45e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared:  0.8446, Adjusted R-squared:  0.8381 
## F-statistic: 130.5 on 1 and 24 DF,  p-value: 3.45e-11
plot(Area_contruida,precio_millon,col="#CD6600",main='precio vs area construida')
modelo2=lm(precio_millon~Area_contruida)
abline(modelo2,col="blue",lwd=2)

summary(modelo2)
## 
## Call:
## lm(formula = precio_millon ~ Area_contruida)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -51.673 -25.612  -6.085  24.875  67.650 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      86.234     22.479   3.836 0.000796 ***
## Area_contruida    2.124      0.186  11.422 3.45e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 33.05 on 24 degrees of freedom
## Multiple R-squared:  0.8446, Adjusted R-squared:  0.8381 
## F-statistic: 130.5 on 1 and 24 DF,  p-value: 3.45e-11