Asignatura: Métodos y Simulación Estadistica

Profesor: David Arango Londoño

-Maestria en Ciencia de Datos-

Universidad Javeriana de Cali

Explorando la ciudad de Cali

Paso 1: Carga de datos desde fuente de información en Excel

viviendas_cali <- read_excel("D:/Dropbox/Maestria Ciencias de Datos/cali.xlsx")
viviendas_cali$Precio=viviendas_cali$Precio/1000000
head(viviendas_cali)
ID URL ciudad Zona Barrio Cordenada_latitud cordenada_longitud Tipo piso Estrato Area_contruida parqueaderos Baños Habitaciones Precio
1564437042-4552 https://www.fincaraiz.com.co/casa-en-venta/cali/buitrera-det-4138458.aspx Cali Zona Sur la buitrera 3.483072 -76.20885 Casa 2 2 240 NA 3 6 180
1564437042-4882 https://www.fincaraiz.com.co/casa-en-venta/cali/villagorogona-det-2924818.aspx Cali Zona Norte villagorogona 3.403000 -76.38700 Casa NA 2 140 1 3 4 140
1564442091-12739 https://www.fincaraiz.com.co/apartamento-en-venta/cali/cristales-det-4503603.aspx Cali Zona Oeste cristales 3.404000 -76.45500 Apartamento 2 6 103 2 2 3 395
1564437042-2992 https://www.fincaraiz.com.co/casa-en-venta/cali/poblado_campestre_candelaria_valle-det-4640392.aspx Cali Zona Norte poblado campestre candelaria 3.414577 -76.45580 Casa NA 3 82 1 3 3 115
1564437042-4607 https://www.fincaraiz.com.co/casa-en-venta/cali/poblado_campestre-det-4396780.aspx Cali Zona Oriente poblado campestre 3.411383 -76.45618 Casa 1 3 72 1 2 4 130
1564442091-14584 https://www.fincaraiz.com.co/apartamento-en-venta/cali/valle_del_lili-det-3964526.aspx Cali Zona Sur valle del lili 3.435000 -76.45700 Apartamento NA 4 75 1 2 3 218

Paso 2: Análisis descriptivo de variables precio y área

Promedio_Precio Mediana_Precio Promedio_Area Medina_Area Cantidad_Ofertas
442.5289 330 187.6118 137 5919

Paso 2.a: Gráfico de cajas y bigotes (Box)

Paso 3 : Mapa con colores por Zonas

Paso 4: Gráfica de Area vs Precio (Cali)

## `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'

Paso 4: Gráfica de Area vs Precio (Zona Sur)

## `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'

Paso 5: Ejecucución de regresión lineal

regresion = lm( viviendas_cali$Precio ~ viviendas_cali$Area_contruida )

Paso 5.a: Gráfica de regresión lineal

Paso 5.b: Calculo de Beta_0 y Beta_1 parapredicción de Y cuando X = 100

plot(viviendas_cali$Area_contruida, viviendas_cali$Precio, xlab='Area', ylab='Precio', col="blue")
abline(regresion, col="red")
Beta_0 = regresion$coefficients[1]
Beta_1 = regresion$coefficients[2]
X = 100
Y = Beta_0 + (X*Beta_1)
X
## [1] 100
Y
## (Intercept) 
##    295.0033
points(X, Y, cex=1.5, pch=16, col="green")