El sector inmobilario juega un papel importante dentro de la economia de un pais, una region y una ciudad, puesto que se ocupa de satisfacer una de las 3 principales necesidades del ser humano las cuales son: Alimentacion, Vestimenta y Vivienda.Por otra parte la vivienda es, desde luego, un componente importante de la inversión. Y en muchos países la vivienda es el mayor componente de la riqueza. Por ejemplo, en Estados Unidos, las propiedades inmuebles representan aproximadamente la mitad de los activos totales en poder del sector privado no financiero. La mayoría de los hogares tiende a mantener su riqueza en su vivienda más que en activos financieros: en Francia, por ejemplo, menos de una cuarta parte de los hogares es propietaria de acciones, pero casi un 60% es propietaria de su vivienda. La vivienda también desempeña otras funciones clave; por ejemplo, los mercados hipotecarios son importantes para la transmisión de la política monetaria. Una vivienda adecuada también puede facilitar la movilidad dentro de una economía y ayudar a las economías a adaptarse a shocks adversos. En pocas palabras, para la salud general de la economía es vital que el sector inmobiliario funcione bien. Y se prevé que a medida que las economías se desarrollan, los mercados inmobiliarios crezcan y se vuelvan más profundos. Cali es una de las ciudades con mayor crecimiento economico del pais, por ende el sector inmboliario sera uno de los grandes beneficiados de dicho crecimiento, de alli la importancia de hacer un analisis exploratorio de como se encuentra este sector economico en la ciudad de cali, para descubrir algunas tendencias, de hacia donde se esta proyectando la ciudad y que lugares y que tipo de construccion, pueden generar una mayor rentabilidad para los inversionista, en este caso para la empresa B&C
Brindar un analisis estadistico descriptivo de como se encuentra el sector inmobilario en la ciudad de cali, para que la empresa B&C, quien es la que esta solicitando este informe, pueda mejorar la toma de decisiones de inversion y focalizar sus campañas de marketing, en lugares donde pueda obtener una mayor rentabilidad. Analizar el precio de las viviendas y los factores que mas influyen en estas, para que la empresa pueda ofertar un precio justo y atractivo en el mercado.
La base de datos fue proveida por la misma empresa que esta solicitando el estudio, en metodos se empleara la tecnica EDA (Analisis exploratorio de datos), el cual consiste en, primero realizar una limpieza de los datos, en la que se revisara los datos faltantes y se analizara si es viable eliminarlos, imputarlos, o dejarlos tal cual como estan, segundo verificar inconsistencia de escritura de la informacion para que este consolidada en un solo formato, luego de esto se procedera hacer resumenes descriptivos de las variables de interes, asi como su visualizacion grafica de acuerdo al tipo de variable, si es cualitativa o cuantitativa con la respectiva interpretacion de los hallazgos que se vayan presentando.
# librerias a utilizar
#devtools::install_github("dgonxalex80/paqueteMETODOS")
library(paqueteMETODOS)
library(dplyr)
library(naniar)
library(plotly)
library(ggplot2)
knitr::opts_chunk$set(echo = TRUE)
# se carga la base de datos
data(vivienda_faltantes)
vivienda<-vivienda_faltantes # se guarda la base con un nombre mas corto
rm(vivienda_faltantes) # se elimina la primera base
str(vivienda)
## spc_tbl_ [8,330 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8330] 8312 8311 8307 8296 8297 ...
## $ zona : chr [1:8330] "Zona Oeste" "Zona Oeste" "Zona Oeste" "Zona Sur" ...
## $ piso : num [1:8330] 4 1 NA 2 NA NA 2 NA NA 2 ...
## $ estrato : num [1:8330] 6 6 5 3 5 5 6 5 5 5 ...
## $ preciom : num [1:8330] 1300 480 1200 220 330 1350 305 480 275 285 ...
## $ areaconst: num [1:8330] 318 300 800 150 112 390 125 280 74 120 ...
## $ parquea : num [1:8330] 2 1 4 1 2 8 2 4 1 2 ...
## $ banios : num [1:8330] 4 4 7 2 4 10 3 4 2 4 ...
## $ habitac : num [1:8330] 2 4 5 4 3 10 3 4 3 3 ...
## $ tipo : chr [1:8330] "Apartamento" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8330] "arboleda" "normandía" "miraflores" "el guabal" ...
## $ longitud : num [1:8330] -76576 -76571 -76568 -76565 -76565 ...
## $ latitud : num [1:8330] 3454 3454 3455 3417 3408 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parquea : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitac : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ","
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
La base de datos cuenta inicialmente con 8330 observaciones, con 13 variables, de las cuales 3 son de tipo caracter o cualitativo (zona de residencia, tipo de vivienda, y el barrio donde esta ubicada), el resto son de tipo cuantitativo el cual ofrece informacion del (numero de baños, habitaciones, parqueaderos, el precio en millones de la casa, el area en metros construida, el estrato, el piso donde esta ubicada la vivienda, un identificador de la casa y las coordenadas de longitud y latitud de la vivienda)
faltantes <- colSums(is.na(vivienda)) %>%
as.data.frame()
faltantes
## .
## id 3
## zona 3
## piso 2641
## estrato 3
## preciom 2
## areaconst 3
## parquea 1606
## banios 3
## habitac 3
## tipo 3
## barrio 3
## longitud 3
## latitud 3
gg_miss_var(vivienda) # grafico de datos faltantes
vivienda1 <- na.omit(vivienda) # elimina todos los valores con NA
rm(vivienda1)
Como se puede observar en la grafica, las variables piso y parqueadero son las que mas datos faltantes tienen, con 2641 y 1606 cada una respectivamente y al momento de crear una nueva base de datos, eliminando las filas que no contienen esa informacion pasa de 8330 a 4812 observaciones, por lo que que se esta perdiendo un 43% de la informacion, lo que hace que esta opcion no sea viable, una alternativa es la imputacion de datos pero tampoco se tiene la informacion necesaria para realizar dicho procedimiento, por tanto se procede a seguir analizando la base de datos en su forma original.
# tabla de frecuencias
table(vivienda$tipo)
##
## Apartamento APARTAMENTO apto casa Casa CASA
## 5032 61 13 14 3195 12
Al analizar esta variable se observa que hay problemas de sistematizacion de la informacion por lo que se procede a unificar los criterios
vivienda$tipo[vivienda$tipo=="APARTAMENTO"]= "Apartamento"
vivienda$tipo[vivienda$tipo=="apto"]= "Apartamento"
vivienda$tipo[vivienda$tipo=="casa"]= "Casa"
vivienda$tipo[vivienda$tipo=="CASA"]= "Casa"
table(vivienda$tipo)
##
## Apartamento Casa
## 5106 3221
summarytools::freq(vivienda$tipo)
## Frequencies
## vivienda$tipo
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------------- ------ --------- -------------- --------- --------------
## Apartamento 5106 61.319 61.319 61.297 61.297
## Casa 3221 38.681 100.000 38.667 99.964
## <NA> 3 0.036 100.000
## Total 8330 100.000 100.000 100.000 100.000
# grafico de de tortas
# Datos
labels1 <- c("Apartamento","Casa")
values1 <- c(61.16,38.84)
# Crear el gráfico de torta 3D con porcentajes adentro
torta2_3d <- plot_ly(labels = labels1, values = values1, type = "pie",
textinfo = "percent+label",
insidetextfont = list(color = "#FFFFFF"),
hoverinfo = "label+percent",
hole = 0.3,
marker = list(colors = c("red", "green")))
# Crear la figura
figura2 <- subplot(torta2_3d, margin = 0.04)
# se le agrega un titulo al grafico
figura2 <- figura2 %>%
add_annotations(
text = "Porcentaje de casas y apartamentos vendidos",
x = 0.5,
y = 1.08,
xref = "paper",
yref = "paper",
showarrow = FALSE,
font = list(size = 15)
)
# Mostrar el gráfico
figura2
Segun la informacion del grafico, lo que mas se vende en cali son los Apartamentos con un 61.2% luego las casas con un 38.8%
table(vivienda$zona)
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 124 1922 1204 351 4726
summarytools::freq(vivienda$zona)
## Frequencies
## vivienda$zona
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ------------------ ------ --------- -------------- --------- --------------
## Zona Centro 124 1.489 1.489 1.489 1.489
## Zona Norte 1922 23.082 24.571 23.073 24.562
## Zona Oeste 1204 14.459 39.030 14.454 39.016
## Zona Oriente 351 4.215 43.245 4.214 43.229
## Zona Sur 4726 56.755 100.000 56.735 99.964
## <NA> 3 0.036 100.000
## Total 8330 100.000 100.000 100.000 100.000
# Datos
labels <- c("Zona Centro","Zona Norte","Zona Oeste","Zona Oriente","Zona Sur")
values <- c(1.49, 23.08, 14.46, 4.21, 56.76)
# Crear el gráfico de torta 3D con porcentajes adentro
torta_3d <- plot_ly(labels = labels, values = values, type = "pie",
textinfo = "percent+label",
insidetextfont = list(color = "#FFFFFF"),
hoverinfo = "label+percent",
hole = 0.3)
# Crear la figura
figura <- subplot(torta_3d, margin = 0.04)
# se le coloca un titulo
figura <- figura %>%
add_annotations(
text = "Ventas de casas y apartamentos segun la zona",
x = 0.5,
y = 1.08,
xref = "paper",
yref = "paper",
showarrow = FALSE,
font = list(size = 15)
)
# Mostrar el gráfico
figura
Del siguiente grafico se puede decir que entre la zona sur y la zona norte de la ciudad de cali, es donde hay mayor porcentaje de casas y aparatmentos vendidos con un 56.8% y un 23.1% respectivamente, el resto de zonas se reparten el 20.1% del mercado, destacando que el centro es el lugar donde menos se venden casas y apartamentos tan solo 1.49% del total de las ventas.
tabla_cruzada<-table(vivienda$zona, vivienda$tipo)
tabla_cruzada
##
## Apartamento Casa
## Zona Centro 24 100
## Zona Norte 1199 723
## Zona Oeste 1035 169
## Zona Oriente 62 289
## Zona Sur 2786 1940
porcentaje<-round(prop.table(tabla_cruzada, margin = 1) * 100,2)
porcentaje
##
## Apartamento Casa
## Zona Centro 19.35 80.65
## Zona Norte 62.38 37.62
## Zona Oeste 85.96 14.04
## Zona Oriente 17.66 82.34
## Zona Sur 58.95 41.05
# cuenta el numero de casa y apartamentos segun la zona
conteo <- table(vivienda$tipo, vivienda$zona)
# Convertir la tabla en un data frame
df_conteo <- as.data.frame(conteo)
# Renombrar las columnas
colnames(df_conteo) <- c("Tipo", "Zona", "Conteo")
# Crear el gráfico con ggplot2
ggplot(df_conteo, aes(x = Zona, y = Conteo, fill = Tipo)) +
geom_bar(stat = "identity", position = "dodge", width = 0.7) +
labs(title = "Número de casas y apartamentos vendidos según la zona",
x = "Zona Geográfica", y = "Numero de Unidades Vendidas") +
scale_fill_manual(values = c("#0d3b66", "#f4d35e")) +
theme_minimal() +
theme(legend.position = "top") +
scale_y_continuous(limits = c(0, 3000)) +
scale_x_discrete(labels = c("Zona Centro", "Zona Norte", "Zona Oeste", "Zona Oriente", "Zona Sur"))
Del siguiente grafico se puede apreciar de manera en especifica como esta distribuida la venta de casas y apartamentos segun la zona, y se puede destacar en especial 2 zonas de la ciudad, donde el porcentaje de casas vendidas supera en mas de un 80% al porcentaje de apartamentos vendidos y es en la zona del centro, con un porcentaje de casas vendidas de 80.65% y en la zona oriente con un porcentaje de casas vendidas de 82.34$ en el resto de las otras zonas se venden mas los apartamentos que las casas.
summarytools::freq(vivienda$estrato)
## Frequencies
## vivienda$estrato
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 3 1453 17.449 17.449 17.443 17.443
## 4 2131 25.591 43.041 25.582 43.025
## 5 2751 33.037 76.078 33.025 76.050
## 6 1992 23.922 100.000 23.914 99.964
## <NA> 3 0.036 100.000
## Total 8330 100.000 100.000 100.000 100.000
labels2 <- c("Estrato 3","Estrato 4","Estrato 5","Estrato 6")
values2 <- c(17.45, 25.59, 33.03, 23.93)
# Crear el gráfico de torta 3D con porcentajes adentro
torta3_3d <- plot_ly(labels = labels2, values = values2, type = "pie",
textinfo = "percent+label",
insidetextfont = list(color = "#FFFFFF"),
hoverinfo = "label+percent",
hole = 0.3)
# Crear la figura
figura3 <- subplot(torta3_3d, margin = 0.04)
# se le coloca un titulo
figura3 <- figura3 %>%
add_annotations(
text = "Ventas de viviendas segun el estrato",
x = 0.5,
y = 1.08,
xref = "paper",
yref = "paper",
showarrow = FALSE,
font = list(size = 15)
)
# Mostrar el gráfico
figura3
Como se puede observar en el grafico anterior el estrato en donde mas se venden casas y apartamentos es el estrato 5, esta informacion es util porque uno creeria que el estrato 3 por ser mas economico el precio de las viviendas, es donde mas ventas tendria y es todo lo contrario, por tanto nos da entender el nivel socioeconomico y el poder adquisitivo que tienen los habitantes de Cali
tabla_cruzada2<-table(vivienda$estrato, vivienda$tipo)
tabla_cruzada2
##
## Apartamento Casa
## 3 639 814
## 4 1404 727
## 5 1767 984
## 6 1296 696
porcentaje2<-round(prop.table(tabla_cruzada2, margin = 1) * 100,2)
porcentaje2
##
## Apartamento Casa
## 3 43.98 56.02
## 4 65.88 34.12
## 5 64.23 35.77
## 6 65.06 34.94
conteo1 <- table(vivienda$tipo, vivienda$estrato)
# Convertir la tabla en un data frame
df_conteo1 <- as.data.frame(conteo1)
# Renombrar las columnas
colnames(df_conteo1) <- c("Tipo", "Estrato", "Count")
# Crear el gráfico con ggplot2
ggplot(df_conteo1, aes(x = Estrato, y = Count, fill = Tipo)) +
geom_bar(stat = "identity", position = "dodge", width = 0.7) +
labs(title = "Número de casas y apartamentos vendidos según el estrato",
x = "Estrato", y = "Numero de Unidades Vendidas") +
scale_fill_manual(values = c("#0d3b66", "#f4d35e")) +
theme_minimal() +
theme(legend.position = "top") +
scale_y_continuous(limits = c(0, 3000)) +
scale_x_discrete(labels = c("Estrato 3", "Estrato 4", "Estrato 5", "Estrato 6"))
Como se puede evidenciar en este siguiente grafico, el numero de apartamentos vendido siempre es mayor que el numero de casas vendidas en cada uno de los estratos excepto en el estrato 3 en donde el numero de casas vendidas supera al de los apartamentos
# Crear grafico de Boxplot de precios de vivienda por Zona
ggplot(vivienda, aes(x = zona, y = preciom, fill = zona)) +
geom_boxplot(na.rm = TRUE) +
labs(y = "Precio de la vivienda en millones") +
scale_fill_manual(values = c("#FFF68F", "#C2F0C2", "#FFDAC1", "#B5EAD7", "#FFADAD")) +
coord_cartesian(ylim = c(0, 2000)) +
scale_y_continuous(breaks = seq(0, 2000, 200)) +
ggtitle("Boxplot de precios de vivienda por Zona")
Al analizar el siguiente grafico se observa que las viviendas que tienen en promedio mayor precio son las que se encuentra en la zona Oeste, es de destacar que las viviendas que estan en la zona del centro por su importancia dentro de la economia,en promedio tienen uno de los precios mas bajos junto con la zona del oriente. Por otra parte se observa que todas las zonas tienen datos atipicos por lo que no es viable fijar el precio de las casa en base al promedio del precio segun la zona sino en base a la mediana que es una medida un poco mas robusta a los datos atipicos
mediana_por_zona <- tapply(vivienda$preciom, vivienda$zona, median)
mediana_por_zona
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 297 300 580 210 320
ggplot(vivienda, aes(x = zona, y = preciom, fill = tipo)) +
geom_boxplot(na.rm = TRUE, position = position_dodge(width = 0.8)) +
labs(y = "Precio de la vivienda en millones") +
scale_fill_brewer(palette = "Set3") +
coord_cartesian(ylim = c(0, 2000)) +
scale_y_continuous(breaks = seq(0, 2000, 200)) +
ggtitle("Boxplot de precios de vivienda por Zona y Tipo")+
scale_color_manual(values = c("#E41A1C", "#377EB8"))
Como se puede observar en todos las zonas geograficas, el precio promedio de las casas supera al de los apartamentos y es interesante analizar que precio promedio de los apartamentos en la zona sur supera al precio promedio de las casas en la zona oriente
mediana_por_tipo_y_zona <- vivienda %>%
group_by(tipo, zona) %>%
summarize(mediana_precio = median(preciom))
print(mediana_por_tipo_y_zona)
## # A tibble: 11 × 3
## # Groups: tipo [3]
## tipo zona mediana_precio
## <chr> <chr> <dbl>
## 1 Apartamento Zona Centro 152.
## 2 Apartamento Zona Norte 250
## 3 Apartamento Zona Oeste 570
## 4 Apartamento Zona Oriente 115
## 5 Apartamento Zona Sur 245
## 6 Casa Zona Centro 310
## 7 Casa Zona Norte 390
## 8 Casa Zona Oeste 680
## 9 Casa Zona Oriente 235
## 10 Casa Zona Sur 480
## 11 <NA> <NA> 330
y en la siguiente tabla se da el precio promedio de las casas y apartamentos segun la zona, esto como referencia, para que la empresa pueda fijar un precio de venta en segun el sector. nota: se realizo el calculo en base a la mediana para evitar el sesgo producido en el caluclo de la media por la presencia de valores atipicos.
# Grafico de Violinplot del precio de las viviendas segun el estrato
ggplot(vivienda, aes(x = as.factor(estrato), y = preciom, fill = as.factor(estrato))) +
geom_violin(trim = FALSE) +
scale_fill_brewer(palette = "Set3") +
labs(title = "Precio de la vivienda segun el estrato",
x = "Estrato",
y = "Precio de la vivienda en millones ") +
theme_minimal() +
scale_y_continuous(breaks = seq(0, 2000, 200))
Al analizar este grafico, se es evidente la relacion directamente proporcional entre el precio promedio de las viviendas y el estrato ya que, entre mayor sea el estrato mayor sera el precio de las viviendas, es de anotar que el precio no es un factor de decision de compra ya que se dijo anteriormente, que se venden mas viviendas en los estratos mas altos que en los mas bajos
mediana_por_estrato <- vivienda %>%
group_by(estrato) %>%
summarize(mediana_precio = median(preciom))
print(mediana_por_estrato)
## # A tibble: 5 × 2
## estrato mediana_precio
## <dbl> <dbl>
## 1 3 160
## 2 4 235
## 3 5 350
## 4 6 700
## 5 NA 330
se establece una lista de precios promedio segun el estrato y calculado en base a la mediana, esto para que la empresa lo tenga como referencia.
ggplot(vivienda, aes(x = as.factor(piso), y = preciom, fill = as.factor(piso))) +
geom_violin(trim = FALSE) +
scale_fill_brewer(palette = "Set3") +
labs(title = "Precio de la vivienda segun el piso en el que este ubicado",
x = "Numero de Pisos",
y = "Precio de la vivienda en millones ") +
theme_minimal() +
scale_y_continuous(breaks = seq(0, 2000, 200))
Segun el grafico anterior no se logra apreciar claramente una relacion entre el precio de la vivienda y el piso en el que esta se encuentre ubicada, por lo que carece de relevancia este analisis
#Analisis del precio de la vivienda segun el numero de baños
ggplot(vivienda, aes(x = as.factor(banios), y = preciom, fill = as.factor(banios))) +
geom_violin(trim = FALSE) +
scale_fill_brewer(palette = "Set3") +
labs(title = "Precio de la vivienda segun el numero de baños",
x = "baños",
y = "Precio de la vivienda en millones ") +
theme_minimal() +
scale_y_continuous(breaks = seq(0, 2000, 200))
Segun este tipo de graficos se logra apreciar una tendencia levemente exponencial entre el precio promedio de las viviendas y el numero de baños que esta tenga, es de resaltar que el precio promedio de las viviendas practicamente se vuelve constante apartir de 7 baños en adelante
ggplot(vivienda, aes(x = as.factor(habitac), y = preciom, fill = as.factor(habitac))) +
geom_violin(trim = FALSE) +
scale_fill_brewer(palette = "Set3") +
labs(title = "Precio de la vivienda segun el numero de habitaciones",
x = "Numero de habitaciones",
y = "Precio de la vivienda en millones ") +
theme_minimal() +
scale_y_continuous(breaks = seq(0, 2000, 200))
Al analizar la siguiente grafica se puede apreciar que no hay una clara relacion entre el precio de las viviendas y el numero de habitaciones que esta tenga, por tanto este analisis carece de relevancia
ggplot(vivienda, aes(x = as.factor(parquea), y = preciom, fill = as.factor(parquea))) +
geom_violin(trim = FALSE) +
scale_fill_brewer(palette = "Set3") +
labs(title = "Precio de la vivienda segun el numero de parqueaderos",
x = "Numero de parqueaderos",
y = "Precio de la vivienda en millones ") +
theme_minimal() +
scale_y_continuous(breaks = seq(0, 2000, 200))
Al igual que sucede con el numero de baños que tenga la vivienda se vuelve a repetir el mismo patron pero esta vez con el numero de parqueadero que hayan en el sector, ya que se logra ver una leve tendencia exponencial entre el numero de parqueaderos y el precio de las viviendas, pero su precio se vuelve practicamente constante a partir de 6 parqueaderos
ggplot(vivienda, aes(areaconst, preciom, color = tipo)) +
geom_point() +
labs(x = "Area Construida", y = "Precio de la vivienda") +
ggtitle("Precio de las viviendas vs Area Construida") +
scale_y_continuous(breaks = seq(0, 2000, 200)) +
scale_x_continuous(breaks = seq(0, 2000, 200)) +
scale_color_manual(values = c("#CD6090", "#6BAED6"))
En este grafico se puede apreciar que hay una leve tendencia positiva entre el area construida y el precio de los apartamentos, ya que ha mayor area construida se nota un aumento en el precio de estos, sin embargo con las casa no se logra apreciar dicha tendencia, puesto que la nube de puntos se ve bastante dispersa.
Con base a los analisis realizados anteriormente:
Se recomienda a la empresa que si va a tener en cuenta un precio de referencia sea por la zona geografica o por el estrato, que se tenga en cuenta el promedio en base a la mediana y no en base a la media, esto debido a la presencia de valores atipicos los cuales no se pudieron eliminar, debido a la gran cantidad de informacion que se perdia. Por otra parte es importante recalcar focalizar las estrategia de marketing en los estratos 5 y 6 ya que se pudo evidenciar que son los lugares donde los caleños compran mas vivienda sin importar que estos tengan un mayor precio, se infiere que por las condiciones de seguridad y comodidad que ofrecen estos sectores. Por ultimo es relevante destacar que, las casas y apartamentos en cuanto a los metros construidos no superen mas de los 300 metros ya que mas de alli nos es garantia de que la casa u apartamento vaya a costar mas, por lo que se pueden ahorrar costos al hacer viviendas mas pequeñas con precios mas altos maximizando la utilidad de la compañia.