1 Introduccion

El sector inmobilario juega un papel importante dentro de la economia de un pais, una region y una ciudad, puesto que se ocupa de satisfacer una de las 3 principales necesidades del ser humano las cuales son: Alimentacion, Vestimenta y Vivienda.Por otra parte la vivienda es, desde luego, un componente importante de la inversión. Y en muchos países la vivienda es el mayor componente de la riqueza. Por ejemplo, en Estados Unidos, las propiedades inmuebles representan aproximadamente la mitad de los activos totales en poder del sector privado no financiero. La mayoría de los hogares tiende a mantener su riqueza en su vivienda más que en activos financieros: en Francia, por ejemplo, menos de una cuarta parte de los hogares es propietaria de acciones, pero casi un 60% es propietaria de su vivienda. La vivienda también desempeña otras funciones clave; por ejemplo, los mercados hipotecarios son importantes para la transmisión de la política monetaria. Una vivienda adecuada también puede facilitar la movilidad dentro de una economía y ayudar a las economías a adaptarse a shocks adversos. En pocas palabras, para la salud general de la economía es vital que el sector inmobiliario funcione bien. Y se prevé que a medida que las economías se desarrollan, los mercados inmobiliarios crezcan y se vuelvan más profundos. Cali es una de las ciudades con mayor crecimiento economico del pais, por ende el sector inmboliario sera uno de los grandes beneficiados de dicho crecimiento, de alli la importancia de hacer un analisis exploratorio de como se encuentra este sector economico en la ciudad de cali, para descubrir algunas tendencias, de hacia donde se esta proyectando la ciudad y que lugares y que tipo de construccion, pueden generar una mayor rentabilidad para los inversionista, en este caso para la empresa B&C

2 Objetivos

Brindar un analisis estadistico descriptivo de como se encuentra el sector inmobilario en la ciudad de cali, para que la empresa B&C, quien es la que esta solicitando este informe, pueda mejorar la toma de decisiones de inversion y focalizar sus campañas de marketing, en lugares donde pueda obtener una mayor rentabilidad. Analizar el precio de las viviendas y los factores que mas influyen en estas, para que la empresa pueda ofertar un precio justo y atractivo en el mercado.

3 Metodos

La base de datos fue proveida por la misma empresa que esta solicitando el estudio, en metodos se empleara la tecnica EDA (Analisis exploratorio de datos), el cual consiste en, primero realizar una limpieza de los datos, en la que se revisara los datos faltantes y se analizara si es viable eliminarlos, imputarlos, o dejarlos tal cual como estan, segundo verificar inconsistencia de escritura de la informacion para que este consolidada en un solo formato, luego de esto se procedera hacer resumenes descriptivos de las variables de interes, asi como su visualizacion grafica de acuerdo al tipo de variable, si es cualitativa o cuantitativa con la respectiva interpretacion de los hallazgos que se vayan presentando.

# librerias a utilizar
#devtools::install_github("dgonxalex80/paqueteMETODOS")
library(paqueteMETODOS)
library(dplyr)
library(naniar)
library(plotly)
library(ggplot2)

4 Analisis Exploratorio inicial y Limpieza

knitr::opts_chunk$set(echo = TRUE)
# se carga la base de datos

data(vivienda_faltantes)
vivienda<-vivienda_faltantes # se guarda la base con un nombre mas corto
rm(vivienda_faltantes) # se elimina la primera base
str(vivienda)
## spc_tbl_ [8,330 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id       : num [1:8330] 8312 8311 8307 8296 8297 ...
##  $ zona     : chr [1:8330] "Zona Oeste" "Zona Oeste" "Zona Oeste" "Zona Sur" ...
##  $ piso     : num [1:8330] 4 1 NA 2 NA NA 2 NA NA 2 ...
##  $ estrato  : num [1:8330] 6 6 5 3 5 5 6 5 5 5 ...
##  $ preciom  : num [1:8330] 1300 480 1200 220 330 1350 305 480 275 285 ...
##  $ areaconst: num [1:8330] 318 300 800 150 112 390 125 280 74 120 ...
##  $ parquea  : num [1:8330] 2 1 4 1 2 8 2 4 1 2 ...
##  $ banios   : num [1:8330] 4 4 7 2 4 10 3 4 2 4 ...
##  $ habitac  : num [1:8330] 2 4 5 4 3 10 3 4 3 3 ...
##  $ tipo     : chr [1:8330] "Apartamento" "Casa" "Casa" "Casa" ...
##  $ barrio   : chr [1:8330] "arboleda" "normandía" "miraflores" "el guabal" ...
##  $ longitud : num [1:8330] -76576 -76571 -76568 -76565 -76565 ...
##  $ latitud  : num [1:8330] 3454 3454 3455 3417 3408 ...
##  - attr(*, "spec")=List of 3
##   ..$ cols   :List of 13
##   .. ..$ id       : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ zona     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ piso     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ estrato  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ preciom  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ areaconst: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ parquea  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ banios   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ habitac  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ tipo     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ barrio   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ longitud : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ latitud  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   ..$ default: list()
##   .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
##   ..$ delim  : chr ","
##   ..- attr(*, "class")= chr "col_spec"
##  - attr(*, "problems")=<externalptr>

La base de datos cuenta inicialmente con 8330 observaciones, con 13 variables, de las cuales 3 son de tipo caracter o cualitativo (zona de residencia, tipo de vivienda, y el barrio donde esta ubicada), el resto son de tipo cuantitativo el cual ofrece informacion del (numero de baños, habitaciones, parqueaderos, el precio en millones de la casa, el area en metros construida, el estrato, el piso donde esta ubicada la vivienda, un identificador de la casa y las coordenadas de longitud y latitud de la vivienda)

faltantes <- colSums(is.na(vivienda)) %>%
  as.data.frame()
faltantes
##              .
## id           3
## zona         3
## piso      2641
## estrato      3
## preciom      2
## areaconst    3
## parquea   1606
## banios       3
## habitac      3
## tipo         3
## barrio       3
## longitud     3
## latitud      3
gg_miss_var(vivienda) # grafico de datos faltantes

vivienda1 <- na.omit(vivienda)  # elimina todos los valores con  NA
rm(vivienda1)

Como se puede observar en la grafica, las variables piso y parqueadero son las que mas datos faltantes tienen, con 2641 y 1606 cada una respectivamente y al momento de crear una nueva base de datos, eliminando las filas que no contienen esa informacion pasa de 8330 a 4812 observaciones, por lo que que se esta perdiendo un 43% de la informacion, lo que hace que esta opcion no sea viable, una alternativa es la imputacion de datos pero tampoco se tiene la informacion necesaria para realizar dicho procedimiento, por tanto se procede a seguir analizando la base de datos en su forma original.

4.1 Analisis del tipo de vivienda que mas se vende

# tabla de frecuencias
table(vivienda$tipo)
## 
## Apartamento APARTAMENTO        apto        casa        Casa        CASA 
##        5032          61          13          14        3195          12

Al analizar esta variable se observa que hay problemas de sistematizacion de la informacion por lo que se procede a unificar los criterios

vivienda$tipo[vivienda$tipo=="APARTAMENTO"]= "Apartamento"
vivienda$tipo[vivienda$tipo=="apto"]= "Apartamento"
vivienda$tipo[vivienda$tipo=="casa"]= "Casa"
vivienda$tipo[vivienda$tipo=="CASA"]= "Casa"
table(vivienda$tipo)
## 
## Apartamento        Casa 
##        5106        3221
summarytools::freq(vivienda$tipo)
## Frequencies  
## vivienda$tipo  
## Type: Character  
## 
##                     Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------------- ------ --------- -------------- --------- --------------
##       Apartamento   5106    61.319         61.319    61.297         61.297
##              Casa   3221    38.681        100.000    38.667         99.964
##              <NA>      3                              0.036        100.000
##             Total   8330   100.000        100.000   100.000        100.000
# grafico de de tortas
# Datos
labels1 <- c("Apartamento","Casa")
values1 <- c(61.16,38.84)

# Crear el gráfico de torta 3D con porcentajes adentro
torta2_3d <- plot_ly(labels = labels1, values = values1, type = "pie",
                    textinfo = "percent+label",
                    insidetextfont = list(color = "#FFFFFF"),
                    hoverinfo = "label+percent",
                    hole = 0.3,
                    marker = list(colors = c("red", "green")))

# Crear la figura
figura2 <- subplot(torta2_3d, margin = 0.04)

# se le agrega un titulo al grafico

figura2 <- figura2 %>%
  add_annotations(
    text = "Porcentaje de casas y apartamentos vendidos",
    x = 0.5,
    y = 1.08,
    xref = "paper",
    yref = "paper",
    showarrow = FALSE,
    font = list(size = 15)
  )

# Mostrar el gráfico
figura2

Segun la informacion del grafico, lo que mas se vende en cali son los Apartamentos con un 61.2% luego las casas con un 38.8%

5 Analisis General de viviendas vendidas segun la zona

table(vivienda$zona)
## 
##  Zona Centro   Zona Norte   Zona Oeste Zona Oriente     Zona Sur 
##          124         1922         1204          351         4726
summarytools::freq(vivienda$zona)
## Frequencies  
## vivienda$zona  
## Type: Character  
## 
##                      Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ------------------ ------ --------- -------------- --------- --------------
##        Zona Centro    124     1.489          1.489     1.489          1.489
##         Zona Norte   1922    23.082         24.571    23.073         24.562
##         Zona Oeste   1204    14.459         39.030    14.454         39.016
##       Zona Oriente    351     4.215         43.245     4.214         43.229
##           Zona Sur   4726    56.755        100.000    56.735         99.964
##               <NA>      3                              0.036        100.000
##              Total   8330   100.000        100.000   100.000        100.000
# Datos
labels <- c("Zona Centro","Zona Norte","Zona Oeste","Zona Oriente","Zona Sur")
values <- c(1.49, 23.08, 14.46, 4.21, 56.76)

# Crear el gráfico de torta 3D con porcentajes adentro
torta_3d <- plot_ly(labels = labels, values = values, type = "pie",
                    textinfo = "percent+label",
                    insidetextfont = list(color = "#FFFFFF"),
                    hoverinfo = "label+percent",
                    hole = 0.3)

# Crear la figura
figura <- subplot(torta_3d, margin = 0.04) 

# se le coloca un titulo

figura <- figura %>%
  add_annotations(
    text = "Ventas de casas y apartamentos segun la zona",
    x = 0.5,
    y = 1.08,
    xref = "paper",
    yref = "paper",
    showarrow = FALSE,
    font = list(size = 15)
  )

# Mostrar el gráfico
figura

Del siguiente grafico se puede decir que entre la zona sur y la zona norte de la ciudad de cali, es donde hay mayor porcentaje de casas y aparatmentos vendidos con un 56.8% y un 23.1% respectivamente, el resto de zonas se reparten el 20.1% del mercado, destacando que el centro es el lugar donde menos se venden casas y apartamentos tan solo 1.49% del total de las ventas.

6 Analisis de Apartamentos y Casas Vendidos segun la zona

tabla_cruzada<-table(vivienda$zona, vivienda$tipo)
tabla_cruzada
##               
##                Apartamento Casa
##   Zona Centro           24  100
##   Zona Norte          1199  723
##   Zona Oeste          1035  169
##   Zona Oriente          62  289
##   Zona Sur            2786 1940
porcentaje<-round(prop.table(tabla_cruzada, margin = 1) * 100,2)
porcentaje
##               
##                Apartamento  Casa
##   Zona Centro        19.35 80.65
##   Zona Norte         62.38 37.62
##   Zona Oeste         85.96 14.04
##   Zona Oriente       17.66 82.34
##   Zona Sur           58.95 41.05
# cuenta el numero de casa y apartamentos segun la zona
conteo <- table(vivienda$tipo, vivienda$zona)
# Convertir la tabla en un data frame
df_conteo <- as.data.frame(conteo)
# Renombrar las columnas
colnames(df_conteo) <- c("Tipo", "Zona", "Conteo")
# Crear el gráfico con ggplot2
ggplot(df_conteo, aes(x = Zona, y = Conteo, fill = Tipo)) +
  geom_bar(stat = "identity", position = "dodge", width = 0.7) +
  labs(title = "Número de casas y apartamentos vendidos según la zona",
       x = "Zona Geográfica", y = "Numero de Unidades Vendidas") +
  scale_fill_manual(values = c("#0d3b66", "#f4d35e")) +
  theme_minimal() +
  theme(legend.position = "top") +
  scale_y_continuous(limits = c(0, 3000)) +
  scale_x_discrete(labels = c("Zona Centro", "Zona Norte", "Zona Oeste", "Zona Oriente", "Zona Sur"))

Del siguiente grafico se puede apreciar de manera en especifica como esta distribuida la venta de casas y apartamentos segun la zona, y se puede destacar en especial 2 zonas de la ciudad, donde el porcentaje de casas vendidas supera en mas de un 80% al porcentaje de apartamentos vendidos y es en la zona del centro, con un porcentaje de casas vendidas de 80.65% y en la zona oriente con un porcentaje de casas vendidas de 82.34$ en el resto de las otras zonas se venden mas los apartamentos que las casas.

7 Analisis de Casas y apartamentos vendidos segun el estrato

summarytools::freq(vivienda$estrato)
## Frequencies  
## vivienda$estrato  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           3   1453    17.449         17.449    17.443         17.443
##           4   2131    25.591         43.041    25.582         43.025
##           5   2751    33.037         76.078    33.025         76.050
##           6   1992    23.922        100.000    23.914         99.964
##        <NA>      3                              0.036        100.000
##       Total   8330   100.000        100.000   100.000        100.000
labels2 <- c("Estrato 3","Estrato 4","Estrato 5","Estrato 6")
values2 <- c(17.45, 25.59, 33.03, 23.93)

# Crear el gráfico de torta 3D con porcentajes adentro
torta3_3d <- plot_ly(labels = labels2, values = values2, type = "pie",
                    textinfo = "percent+label",
                    insidetextfont = list(color = "#FFFFFF"),
                    hoverinfo = "label+percent",
                    hole = 0.3)

# Crear la figura
figura3 <- subplot(torta3_3d, margin = 0.04) 

# se le coloca un titulo

figura3 <- figura3 %>%
  add_annotations(
    text = "Ventas de viviendas segun el estrato",
    x = 0.5,
    y = 1.08,
    xref = "paper",
    yref = "paper",
    showarrow = FALSE,
    font = list(size = 15)
  )

# Mostrar el gráfico
figura3

Como se puede observar en el grafico anterior el estrato en donde mas se venden casas y apartamentos es el estrato 5, esta informacion es util porque uno creeria que el estrato 3 por ser mas economico el precio de las viviendas, es donde mas ventas tendria y es todo lo contrario, por tanto nos da entender el nivel socioeconomico y el poder adquisitivo que tienen los habitantes de Cali

8 Analisis de Apartamentos y Casas Vendidos segun la zona

tabla_cruzada2<-table(vivienda$estrato, vivienda$tipo)
tabla_cruzada2
##    
##     Apartamento Casa
##   3         639  814
##   4        1404  727
##   5        1767  984
##   6        1296  696
porcentaje2<-round(prop.table(tabla_cruzada2, margin = 1) * 100,2)
porcentaje2
##    
##     Apartamento  Casa
##   3       43.98 56.02
##   4       65.88 34.12
##   5       64.23 35.77
##   6       65.06 34.94
conteo1 <- table(vivienda$tipo, vivienda$estrato)

# Convertir la tabla en un data frame
df_conteo1 <- as.data.frame(conteo1)

# Renombrar las columnas
colnames(df_conteo1) <- c("Tipo", "Estrato", "Count")

# Crear el gráfico con ggplot2
ggplot(df_conteo1, aes(x = Estrato, y = Count, fill = Tipo)) +
  geom_bar(stat = "identity", position = "dodge", width = 0.7) +
  labs(title = "Número de casas y apartamentos vendidos según el estrato",
       x = "Estrato", y = "Numero de Unidades Vendidas") +
  scale_fill_manual(values = c("#0d3b66", "#f4d35e")) +
  theme_minimal() +
  theme(legend.position = "top") +
  scale_y_continuous(limits = c(0, 3000)) +
  scale_x_discrete(labels = c("Estrato 3", "Estrato 4", "Estrato 5", "Estrato 6"))

Como se puede evidenciar en este siguiente grafico, el numero de apartamentos vendido siempre es mayor que el numero de casas vendidas en cada uno de los estratos excepto en el estrato 3 en donde el numero de casas vendidas supera al de los apartamentos

8.1 Analisis de Precios de la vivienda y factores que mas inciden

# Crear grafico de Boxplot de precios de vivienda por Zona
ggplot(vivienda, aes(x = zona, y = preciom, fill = zona)) +
  geom_boxplot(na.rm = TRUE) +
  labs(y = "Precio de la vivienda en millones") +
  scale_fill_manual(values = c("#FFF68F", "#C2F0C2", "#FFDAC1", "#B5EAD7", "#FFADAD")) +
  coord_cartesian(ylim = c(0, 2000)) +
  scale_y_continuous(breaks = seq(0, 2000, 200)) +
  ggtitle("Boxplot de precios de vivienda por Zona")

Al analizar el siguiente grafico se observa que las viviendas que tienen en promedio mayor precio son las que se encuentra en la zona Oeste, es de destacar que las viviendas que estan en la zona del centro por su importancia dentro de la economia,en promedio tienen uno de los precios mas bajos junto con la zona del oriente. Por otra parte se observa que todas las zonas tienen datos atipicos por lo que no es viable fijar el precio de las casa en base al promedio del precio segun la zona sino en base a la mediana que es una medida un poco mas robusta a los datos atipicos

mediana_por_zona <- tapply(vivienda$preciom, vivienda$zona, median)
mediana_por_zona
##  Zona Centro   Zona Norte   Zona Oeste Zona Oriente     Zona Sur 
##          297          300          580          210          320

9 Analisis de precios de casas y apartamentos segun la zona

ggplot(vivienda, aes(x = zona, y = preciom, fill = tipo)) +
  geom_boxplot(na.rm = TRUE, position = position_dodge(width = 0.8)) +
  labs(y = "Precio de la vivienda en millones") +
  scale_fill_brewer(palette = "Set3") +
  coord_cartesian(ylim = c(0, 2000)) +
  scale_y_continuous(breaks = seq(0, 2000, 200)) +
  ggtitle("Boxplot de precios de vivienda por Zona y Tipo")+
  scale_color_manual(values = c("#E41A1C", "#377EB8"))

Como se puede observar en todos las zonas geograficas, el precio promedio de las casas supera al de los apartamentos y es interesante analizar que precio promedio de los apartamentos en la zona sur supera al precio promedio de las casas en la zona oriente

mediana_por_tipo_y_zona <- vivienda %>%
  group_by(tipo, zona) %>%
  summarize(mediana_precio = median(preciom))
print(mediana_por_tipo_y_zona)
## # A tibble: 11 × 3
## # Groups:   tipo [3]
##    tipo        zona         mediana_precio
##    <chr>       <chr>                 <dbl>
##  1 Apartamento Zona Centro            152.
##  2 Apartamento Zona Norte             250 
##  3 Apartamento Zona Oeste             570 
##  4 Apartamento Zona Oriente           115 
##  5 Apartamento Zona Sur               245 
##  6 Casa        Zona Centro            310 
##  7 Casa        Zona Norte             390 
##  8 Casa        Zona Oeste             680 
##  9 Casa        Zona Oriente           235 
## 10 Casa        Zona Sur               480 
## 11 <NA>        <NA>                   330

y en la siguiente tabla se da el precio promedio de las casas y apartamentos segun la zona, esto como referencia, para que la empresa pueda fijar un precio de venta en segun el sector. nota: se realizo el calculo en base a la mediana para evitar el sesgo producido en el caluclo de la media por la presencia de valores atipicos.

10 Analisis de precios segun el estrato

# Grafico de Violinplot del precio de las viviendas segun el estrato
ggplot(vivienda, aes(x = as.factor(estrato), y = preciom, fill = as.factor(estrato))) +
  geom_violin(trim = FALSE) +
  scale_fill_brewer(palette = "Set3") +
  labs(title = "Precio de la vivienda segun el estrato",
       x = "Estrato",
       y = "Precio de la vivienda en millones ") +
  theme_minimal() +
  scale_y_continuous(breaks = seq(0, 2000, 200)) 

Al analizar este grafico, se es evidente la relacion directamente proporcional entre el precio promedio de las viviendas y el estrato ya que, entre mayor sea el estrato mayor sera el precio de las viviendas, es de anotar que el precio no es un factor de decision de compra ya que se dijo anteriormente, que se venden mas viviendas en los estratos mas altos que en los mas bajos

mediana_por_estrato <- vivienda %>%
  group_by(estrato) %>%
  summarize(mediana_precio = median(preciom))

print(mediana_por_estrato)
## # A tibble: 5 × 2
##   estrato mediana_precio
##     <dbl>          <dbl>
## 1       3            160
## 2       4            235
## 3       5            350
## 4       6            700
## 5      NA            330

se establece una lista de precios promedio segun el estrato y calculado en base a la mediana, esto para que la empresa lo tenga como referencia.

11 Analisis del precio de la vivienda segun el piso donde se encuentre ubicado

ggplot(vivienda, aes(x = as.factor(piso), y = preciom, fill = as.factor(piso))) +
  geom_violin(trim = FALSE) +
  scale_fill_brewer(palette = "Set3") +
  labs(title = "Precio de la vivienda segun el piso en el que este ubicado",
       x = "Numero de Pisos",
       y = "Precio de la vivienda en millones ") +
  theme_minimal() +
  scale_y_continuous(breaks = seq(0, 2000, 200)) 

Segun el grafico anterior no se logra apreciar claramente una relacion entre el precio de la vivienda y el piso en el que esta se encuentre ubicada, por lo que carece de relevancia este analisis

#Analisis del precio de la vivienda segun el numero de baños

ggplot(vivienda, aes(x = as.factor(banios), y = preciom, fill = as.factor(banios))) +
  geom_violin(trim = FALSE) +
  scale_fill_brewer(palette = "Set3") +
  labs(title = "Precio de la vivienda segun el numero de baños",
       x = "baños",
       y = "Precio de la vivienda en millones ") +
  theme_minimal() +
  scale_y_continuous(breaks = seq(0, 2000, 200)) 

Segun este tipo de graficos se logra apreciar una tendencia levemente exponencial entre el precio promedio de las viviendas y el numero de baños que esta tenga, es de resaltar que el precio promedio de las viviendas practicamente se vuelve constante apartir de 7 baños en adelante

12 Analisis del precio de las viviendas segun el numero de habitaciones

ggplot(vivienda, aes(x = as.factor(habitac), y = preciom, fill = as.factor(habitac))) +
  geom_violin(trim = FALSE) +
  scale_fill_brewer(palette = "Set3") +
  labs(title = "Precio de la vivienda segun el numero de habitaciones",
       x = "Numero de habitaciones",
       y = "Precio de la vivienda en millones ") +
  theme_minimal() +
  scale_y_continuous(breaks = seq(0, 2000, 200))

Al analizar la siguiente grafica se puede apreciar que no hay una clara relacion entre el precio de las viviendas y el numero de habitaciones que esta tenga, por tanto este analisis carece de relevancia

13 analisis del precio de las viviendas y el numero de parqueaderos en el sector

ggplot(vivienda, aes(x = as.factor(parquea), y = preciom, fill = as.factor(parquea))) +
  geom_violin(trim = FALSE) +
  scale_fill_brewer(palette = "Set3") +
  labs(title = "Precio de la vivienda segun el numero de parqueaderos",
       x = "Numero de parqueaderos",
       y = "Precio de la vivienda en millones ") +
  theme_minimal() +
  scale_y_continuous(breaks = seq(0, 2000, 200)) 

Al igual que sucede con el numero de baños que tenga la vivienda se vuelve a repetir el mismo patron pero esta vez con el numero de parqueadero que hayan en el sector, ya que se logra ver una leve tendencia exponencial entre el numero de parqueaderos y el precio de las viviendas, pero su precio se vuelve practicamente constante a partir de 6 parqueaderos

14 Analisis del precio de las casas y apartamentos segun los metros construidos

ggplot(vivienda, aes(areaconst, preciom, color = tipo)) +
  geom_point() +
  labs(x = "Area Construida", y = "Precio de la vivienda") +
  ggtitle("Precio de las viviendas vs Area Construida") +
  scale_y_continuous(breaks = seq(0, 2000, 200)) +
  scale_x_continuous(breaks = seq(0, 2000, 200)) +
  scale_color_manual(values = c("#CD6090", "#6BAED6")) 

En este grafico se puede apreciar que hay una leve tendencia positiva entre el area construida y el precio de los apartamentos, ya que ha mayor area construida se nota un aumento en el precio de estos, sin embargo con las casa no se logra apreciar dicha tendencia, puesto que la nube de puntos se ve bastante dispersa.

15 Conclusiones

Con base a los analisis realizados anteriormente:

Se recomienda a la empresa que si va a tener en cuenta un precio de referencia sea por la zona geografica o por el estrato, que se tenga en cuenta el promedio en base a la mediana y no en base a la media, esto debido a la presencia de valores atipicos los cuales no se pudieron eliminar, debido a la gran cantidad de informacion que se perdia. Por otra parte es importante recalcar focalizar las estrategia de marketing en los estratos 5 y 6 ya que se pudo evidenciar que son los lugares donde los caleños compran mas vivienda sin importar que estos tengan un mayor precio, se infiere que por las condiciones de seguridad y comodidad que ofrecen estos sectores. Por ultimo es relevante destacar que, las casas y apartamentos en cuanto a los metros construidos no superen mas de los 300 metros ya que mas de alli nos es garantia de que la casa u apartamento vaya a costar mas, por lo que se pueden ahorrar costos al hacer viviendas mas pequeñas con precios mas altos maximizando la utilidad de la compañia.