1.Introducción

El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2022, las ventas del sector en Cali llegaron a $6.700 millones y en 2023 a $6.100 millones. Se espera que este sector continue creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.

A partir del conjunto de datos params$data recolectado, con información sobre el precio, la ubicación, las características y la venta de viviendas en Cali, se realiza el presente reporte a solicitud de la empresa B&C (Bines y Casas), agencia de bienes raíces que opera en la ciudad de Cali, Colombia.

2. Objetivos

Este informe tiene los siguientes objetivos:

  1. Proporcionar información sobre el precio de las viviendas en diferentes zonas de Cali.

  2. Proporcionar información sobre el tipo de viviendas más ofertadas en Cali.

  3. Proporcionar información sobre las características más relevantes de la oferta de vivienda en Cali.

  4. Soportar la toma de decisiones en:

    • La definición del nicho de mercado.
    • Estrategias de marketing.
    • Establecer precios de venta.
    • Ofrecer servicios personalizados a los clientes.

3. Métodos

3.1 Características básicas de viviendas_faltantes

Antes de iniciar la presentación del análisis exploratorio de datos es clave conocer qué contiene el conjunto de datos. Esta exploración preliminar permite corroborar que los datos que tenemos sí son los que esperamos tener.

  • El conjunto de datos cuenta con la siguiente cantidad de observaciones y variables, respectivamente:
## [1] 8330   13
  • Se cuenta con las siguientes variables:
##  [1] "id"        "zona"      "piso"      "estrato"   "preciom"   "areaconst"
##  [7] "parquea"   "banios"    "habitac"   "tipo"      "barrio"    "longitud" 
## [13] "latitud"
  • A continuación se detallan las variables:

    • id: Identificador único de la vivienda
    • zona: Zona de la ciudad
    • piso: Piso en la que está ubicada la vivienda
    • estrato: Estrato
    • preciom: Precio en millones de pesos
    • areaconst: Área construida en metros cuadrados
    • parqueaderos: Número de parqueaderos
    • banios: Número de baños
    • habitaciones: Número de habitaciones
    • tipo: Tipo de vivienda
    • barrio: Barrio
    • longitud: Coordenada de longitud
    • latitud: Coordenada de latitud
  • De las variables mencionadas las siguientes son cuantitativas:

##  [1] "id"        "piso"      "estrato"   "preciom"   "areaconst" "parquea"  
##  [7] "banios"    "habitac"   "longitud"  "latitud"
  • De las variables mencionadas las siguientes son cualitativas:
## [1] "zona"   "tipo"   "barrio"
  • Dichas variables cualitativas tienen las siguientes categorías:
## [1] "Zona Oeste"   "Zona Sur"     "Zona Norte"   "Zona Oriente" "Zona Centro" 
## [6] NA
## [1] "Apartamento" "Casa"        "APARTAMENTO" "casa"        "CASA"       
## [6] "apto"        NA
##   [1] "arboleda"                      "normandía"                    
##   [3] "miraflores"                    "el guabal"                    
##   [5] "bella suiza alta"              "bella suiza"                  
##   [7] "valle del lili"                "el nacional"                  
##   [9] "santa teresita"                "aguacatal"                    
##  [11] "bellavista"                    "el peñon"                     
##  [13] "la riverita"                   "miradol del aguacatal"        
##  [15] "terrón colorado"               "mel√©ndez"                    
##  [17] "guadalupe"                     "cristales"                    
##  [19] "la arboleda"                   "brisas de guadalupe"          
##  [21] "el refugio"                    "altos de guadalupe"           
##  [23] "seminario"                     "guadalupe alto"               
##  [25] "pampalinda"                    "cuarto de legua"              
##  [27] "cerros de guadalupe"           "normandia"                    
##  [29] "normandía west point"          "el gran limonar"              
##  [31] "la cascada"                    "puente palma"                 
##  [33] "prados del sur"                "nueva tequendama"             
##  [35] "brisas de los"                 "urbanización las cascadas"    
##  [37] "sector cañaveralejo guadalupe" "santa rita"                   
##  [39] "san pedro"                     "santa isabel"                 
##  [41] "caney"                         "los cristales"                
##  [43] "los cristales club"            "cerro cristales"              
##  [45] "caldas"                        "alto jordán"                  
##  [47] "refugio"                       "napoles"                      
##  [49] "el lido"                       "colinas del sur"              
##  [51] "altos de santa"                "acopi"                        
##  [53] "san fernando"                  "el jordán"                    
##  [55] "pance"                         "centenario"                   
##  [57] "bosques de alboleda"           "bochalema"                    
##  [59] "tejares cristales"             "ciudad jardín"                
##  [61] "tequendama"                    "san joaquin"                  
##  [63] "urbanización tequendama"       "urbanizacion lili"            
##  [65] "tejares de san"                "san fernando viejo"           
##  [67] "mamellan"                      "san fernando nuevo"           
##  [69] "el limonar"                    "camino real"                  
##  [71] "tequendema"                    "mayapan las vegas"            
##  [73] "ciudad meléndez"              "alferez real"                 
##  [75] "el ingenio ii"                 "gran limonar"                 
##  [77] "francisco eladio ramirez"      "san cayetano"                 
##  [79] "ciudad real"                   "capri"                        
##  [81] "parcelaciones pance"           "villa del prado"              
##  [83] "ciudad capri"                  "el ingenio"                   
##  [85] "san antonio"                   "las vegas"                    
##  [87] "la campiña"                    "el bosque"                    
##  [89] "sierras de normandía"          "el ingenio i"                 
##  [91] "san vicente"                   "salomia"                      
##  [93] "eucarístico"                   "menga"                        
##  [95] "los cámbulos"                  "la floresta"                  
##  [97] "chipichape"                    "cambulos"                     
##  [99] "templete"                      "ciudad jardin"                
## [101] "multicentro"                   "melendez"                     
## [103] "juanamb√∫"                     "campestre"                    
## [105] "santa anita"                   "los libertadores"             
## [107] "los cambulos"                  "libertadores"                 
## [109] "departamental"                 "el cedro"                     
## [111] "calicanto"                     "quintas de don"               
## [113] "santa mónica residencial"      "san nicolas"                  
## [115] "primero de mayo"               "panamericano"                 
## [117] "junín"                         "la hacienda"                  
## [119] "champagnat"                    "benjamín herrera"             
## [121] "alameda"                       "el troncal"                   
## [123] "san bosco"                     "el prado"                     
## [125] "pacará"                        "ciudadela pasoancho"          
## [127] "nueva floresta"                "ingenio i"                    
## [129] "ciudadela paso ancho"          "ciudad córdoba"               
## [131] "la merced"                     "granada"                      
## [133] "colseguros"                    "las quintas de"               
## [135] "santa mónica"                  "santa mónica alta"            
## [137] "centro"                        "ed benjamin herrera"          
## [139] "santa monica residencial"      "san luís"                     
## [141] "unicentro cali"                "el ingenio iii"               
## [143] "prados del norte"              "pasoancho"                    
## [145] "bretaña"                       "villas de veracruz"           
## [147] "versalles"                     "flora industrial"             
## [149] "cañasgordas"                   "bosques del limonar"          
## [151] "vipasa"                        "urbanización la flora"        
## [153] "urbanización barranquilla"     "santo domingo"                
## [155] "santa monica"                  "santa mónica popular"         
## [157] "santa monica norte"            "los andes"                    
## [159] "jorge isaacs"                  "el jardín"                    
## [161] "guayaquil"                     "la flora"                     
## [163] "colinas del bosque"            "ciudad 2000"                  
## [165] "la buitrera"                   "berlin"                       
## [167] "alamos"                        "santa"                        
## [169] "santa monica popular"          "popular"                      
## [171] "flora"                         "ciudad bochalema"             
## [173] "urbanización colseguros"       "prados del limonar"           
## [175] "villa del lago"                "urbanización la nueva"        
## [177] "La Hacienda"                   "cataya real"                  
## [179] "villa del sur"                 "urbanización san joaquin"     
## [181] "el trébol"                    "Santo Domingo"                
## [183] "la portada al"                 "poblado campestre"            
## [185] "las delicias"                  "las ceibas"                   
## [187] "jamundi"                       "jamundi alfaguara"            
## [189] "colseguros andes"              "calipso"                      
## [191] "villa de veracruz"             "torres de comfandi"           
## [193] "puente del comercio"           "paso del comercio"            
## [195] "oasis de pasoancho"            "Los Guaduales"                
## [197] "los alcazares"                 "las vegas de"                 
## [199] "el dorado"                     "ciudadela melendez"           
## [201] "ciudad pacifica"               "Ciudad Pacifica"              
## [203] "Bueno Madrid"                  "alcazares"                    
## [205] "hacienda alferez real"         "ciudad antejardin"            
## [207] "las camelias"                  "colinas de menga"             
## [209] "altos de menga"                "las granjas"                  
## [211] "santa elena"                   "palmas del ingenio"           
## [213] "junin"                         "la independencia"             
## [215] "cristóbal colón"               "aranjuez"                     
## [217] "santa rosa"                    "samanes"                      
## [219] "samanes de guadalupe"          "los guaduales"                
## [221] "los alcázares"                 "laflora"                      
## [223] "ingenio"                       "cañaverales"                  
## [225] "Brisas De Los"                 "alborada"                     
## [227] "san judas"                     "cañaverales los samanes"      
## [229] "ciudadela comfandi"            "santa helena de"              
## [231] "caney especial"                "aguablanca"                   
## [233] "la alborada"                   "urbanización boyacá"          
## [235] "las américas"                 "la morada"                    
## [237] "urbanización la merced"        "simón bolivar"                
## [239] "porvenir"                      "calicanto viii"               
## [241] "Cali"                          "ciudad modelo"                
## [243] "valle de lili"                 "prados de oriente"            
## [245] "la fortaleza"                  "ciudad córdoba reservado"     
## [247] "rincon de la"                  "san carlos"                   
## [249] "rafael uribe uribe"            "ciudad los alamos"            
## [251] "centelsa"                      "manzanares"                   
## [253] "las acacias"                   "la esmeralda"                 
## [255] "Santa Anita"                   "unión de vivienda"            
## [257] "santa fe"                      "chapinero"                    
## [259] "belalcazar"                    "atanasio girardot"            
## [261] "rincón de salomia"             "riveras del valle"            
## [263] "ciudad del campo"              "alameda del rio"              
## [265] "ciudad cordoba"                "conjunto gibraltar"           
## [267] "la selva"                      "villa colombia"               
## [269] "los parques barranquilla"      "fuentes de la"                
## [271] "ciudad universitaria"          "portales de comfandi"         
## [273] "pacara"                        "metropolitano del norte"      
## [275] "villa del sol"                 "calima"                       
## [277] "los robles"                    "guaduales"                    
## [279] "floralia"                      "chiminangos"                  
## [281] "la base"                       "base aérea"                  
## [283] "oasis de comfandi"             "la villa del"                 
## [285] "portada de comfandi"           "urbanizacion el saman"        
## [287] "lares de comfenalco"           "chiminangos 2 etapa"          
## [289] "santa bárbara"                 "parque residencial el"        
## [291] "chiminangos 1 etapa"           "bloques del limonar"          
## [293] "siete de agosto"               "la nueva base"                
## [295] "la rivera ii"                  "la rivera"                    
## [297] "ceibas"                        "la rivera i"                  
## [299] "quintas de salomia"            "la ceibas"                    
## [301] "jorge eliecer gaitán"          "alfonso lópez i"              
## [303] "comfenalco"                    "ciudad country"               
## [305] "Colseguros Andes"              "marroquín iii"                
## [307] "ciudadela del río"             "zona oeste"                   
## [309] "ciudad talanga"                "zona sur"                     
## [311] "jose manuel marroquín"         "nápoles"                      
## [313] "alfonso lópez"                 "zona oriente"                 
## [315] "zona norte"                    "alfonso lopez"                
## [317] "gaitan"                        "calimio norte"                
## [319] "urbanización pacara"           "barrio 7de agosto"            
## [321] "calibella"                     "brisas del guabito"           
## [323] "el guabito"                    "arboledas"                    
## [325] "los guayacanes"                "ciudad los álamos"            
## [327] "primitivo crespo"              "fonaviemcali"                 
## [329] "Villa Del Prado"               "san luis"                     
## [331] "Prados Del Norte"              "la riviera"                   
## [333] "nueva base"                    "Chiminangos"                  
## [335] "norte"                         "paseo de los"                 
## [337] "barranquilla"                  "villa del parque"             
## [339] "zona residencial"              "La Flora"                     
## [341] "Villas De Veracruz"            "los alamos"                   
## [343] "la alianza"                    "pampa linda"                  
## [345] "zona norte los"                "alameda del río"              
## [347] "el vallado"                    "fenalco kennedy"              
## [349] "el paraíso"                    "evaristo garcía"              
## [351] "san juan bosco"                "el sena"                      
## [353] "cañaveralejo"                  "el caney"                     
## [355] "antonio nariño"                "Santafe"                      
## [357] "belisario caicedo"             "el diamante"                  
## [359] "morichal de comfandi"          "el rodeo"                     
## [361] "barrio tranquilo y"            "sameco"                       
## [363] "la gran colombia"              "municipal"                    
## [365] "primavera"                     "fepicol"                      
## [367] "la primavera"                  "20 de julio"                  
## [369] "santander"                     "saavedra galindo"             
## [371] "rep√∫blica de israel"          "cali bella"                   
## [373] "bolivariano"                   "urbanización río lili"        
## [375] "Valle Del Lili"                "brisas del limonar"           
## [377] "barrio el recuerdo"            "agua blanca"                  
## [379] "san joaquín"                   "boyacá"                       
## [381] "mariano ramos"                 "zona centro"                  
## [383] "cali canto"                    "Ciudad 2000"                  
## [385] "San Fernando"                  "arboleda campestre candelaria"
## [387] "barrio obrero"                 "Belalcazar"                   
## [389] "cristobal colón"               "la libertad"                  
## [391] "san judas tadeo"               "colon"                        
## [393] "El Caney"                      "valle grande"                 
## [395] "san nicolás"                   "el ingenio 3"                 
## [397] "norte la flora"                "ciudad jardin pance"          
## [399] "ponce"                         "Ciudad Jardín"                
## [401] "urbanizacion gratamira"        "Prados Del Limonar"           
## [403] "El Bosque"                     "ingenio ii"                   
## [405] "El Ingenio"                    "Santa Monica"                 
## [407] "buenos aires"                  "cascajal"                     
## [409] "Pance"                         "Quintas De Don"               
## [411] "la reforma"                    "compartir"                    
## [413] "autopista sur"                 "sector aguacatal"             
## [415] "el castillo"                   "occidente"                    
## [417] "juanambu"                      "santa anita sur"              
## [419] "alf√©rez real"                 "barrio eucarístico"           
## [421] "Centenario"                    "rozo la torre"                
## [423] "los jockeys"                   "3 de julio"                   
## [425] "farrallones de pance"          "Camino Real"                  
## [427] "la playa"                      "Miraflores"                   
## [429] "ciudad melendez"               "lourdes"                      
## [431] "urbanización nueva granada"    "Santa Isabel"                 
## [433] "los farallones"                "bajo aguacatal"               
## [435] "Santa Teresita"                "la luisa"                     
## [437] NA

Nota:Para continuar con el desarrollo de la visualización es necesario ejecutar los códigos que se incluyen en el anexo de este documento. Se incluyen los anexos a continuación para que la ejecución del documento funcione.

Anexos

Variables adicionales

Precio por metro cuadrado

Se agrega la variable mencionada

viviendas <- viviendas %>%   mutate(precio_m2 = preciom/areaconst)

Limpieza

A partir del conjunto de datos cargado, se procederá a realizar el proceso de limpieza. Como se observa en la ejecución de código anterior, la variable “zona” tiene consistencia en los valores únicos, mientras que las variables “tipo” y “barrio” no. En ese orden de ideas, modificarán ambas variables

Variable Tipo

La variable tipo será modificada iniciando con el cambio del texto a minúscula y posteriomente el reemplazo de valores en la categoría “apto”. El cambio se ve a continuación.

## # A tibble: 3 × 1
##   tipo       
##   <chr>      
## 1 apartamento
## 2 casa       
## 3 <NA>

Variable Barrio

La variable barrio será modificada iniciando con el cambio del texto a minúscula, remoción de tildes y posteriomente el reemplazo de valores en las categorías donde existan nombres similares. El cambio se ve a continuación, la cantidad de barrios pasa de 436 a 370

viviendas$barrio <- iconv(viviendas$barrio, to = "ASCII//TRANSLIT") 
viviendas$barrio <- ifelse(viviendas$barrio == "agua blanca", "aguablanca", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "alf?Crez real", "alferez real", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "alfonso lopez i", "alfonso lopez", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "base a?Crea", "base area", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "calibella", "cali bella", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "calicanto", "cali canto", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "ciudad mel?Cndez", "ciudad melendez", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "ciudadela pasoancho", "ciudadela paso ancho", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "el ingenio 3", "el ingenio iii", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "el tr?Cbol", "el trebol", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "ingenio", "el ingenio", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "ingenio i", "el ingenio i", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "ingenio ii", "el ingenio ii", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "juanamb??", "juanambu", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "laflora", "la flora", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "las am?Cricas", "las americas", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "las vegas de", "las vegas", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "mel?Cndez", "melendez", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "pampalinda", "pampa linda", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "rep??blica de israel", "republica de israel", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "tequendema", "tequendama", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "valle de lili", "valle del lili", viviendas$barrio) 
viviendas$barrio <- ifelse(viviendas$barrio == "zona norte los", "zona norte", viviendas$barrio) 
distinct(viviendas, pick("barrio"))
## # A tibble: 400 × 1
##    barrio          
##    <chr>           
##  1 arboleda        
##  2 normandia       
##  3 miraflores      
##  4 el guabal       
##  5 bella suiza alta
##  6 bella suiza     
##  7 valle del lili  
##  8 el nacional     
##  9 santa teresita  
## 10 aguacatal       
## # ℹ 390 more rows

Variables Latitud y Longitud

sin_decimales_long <- viviendas$longitud[!grepl("\\.", as.character(viviendas$longitud))]  
sin_decimales_long <- sin_decimales_long / 1000  
viviendas$longitud[!grepl("\\.", as.character(viviendas$longitud))] <- sin_decimales_long  
sin_decimales_lat <- viviendas$latitud[!grepl("\\.", as.character(viviendas$latitud))]  
sin_decimales_lat <- sin_decimales_lat / 1000  
viviendas$latitud[!grepl("\\.", as.character(viviendas$latitud))] <- sin_decimales_lat

Valores NA

El conjunto de datos contiene la siguiente frecuencia de valores NA por variable presentada como tabla.

faltantes <- colSums(is.na(viviendas)) %>% as.data.frame()  
faltantes
##              .
## id           3
## zona         3
## piso      2641
## estrato      3
## preciom      2
## areaconst    3
## parquea   1606
## banios       3
## habitac      3
## tipo         3
## barrio       3
## longitud     3
## latitud      3
## precio_m2    3

Remoción de valores NA

A partir de lo anterior se decide revisar los registros de id con valores NA.

id_na <- filter(viviendas, is.na(viviendas$id)) %>% 
  as.data.frame() 
id_na
##   id zona piso estrato preciom areaconst parquea banios habitac tipo barrio
## 1 NA <NA>   NA      NA      NA        NA      NA     NA      NA <NA>   <NA>
## 2 NA <NA>   NA      NA      NA        NA      NA     NA      NA <NA>   <NA>
## 3 NA <NA>   NA      NA     330        NA      NA     NA      NA <NA>   <NA>
##   longitud latitud precio_m2
## 1       NA      NA        NA
## 2       NA      NA        NA
## 3       NA      NA        NA
viviendas <- viviendas[complete.cases(viviendas[ , 1]),]

Se observa que los 3 registros no contienen información en ninguna de sus 13 variables por lo que serán retirados. A continuación, se muestra nuevamente la tabla de los valores NA.

faltantes <- colSums(is.na(viviendas)) %>% 
  as.data.frame()  
faltantes
##              .
## id           0
## zona         0
## piso      2638
## estrato      0
## preciom      0
## areaconst    0
## parquea   1603
## banios       0
## habitac      0
## tipo         0
## barrio       0
## longitud     0
## latitud      0
## precio_m2    0

Nota: las variables piso y número de parqueaderos no se imputaron debido a que, aunque se mencionan como característica, no fueron objeto de enfoque del presente documento. Sin embargo, los registros que sí contienen valores de dicha variable no se eliminarán para que pueda ser analizada.

3.2 Visualización

A continuación se responden los objetivos propuestos haciendo uso de gráficos que permitan visualizar la información

3.2.1 ¿Cuál es el precio de las viviendas en diferentes zonas?

En este caso se agregó la variable precio por metro cuadrado (precio_m2) a la base para usarla dentro del análisis. Adicionalmente, se dividirá la visualización en 3 secciones por la variable tipo: apartamento y casa, casa y apartamento.

3.2.1.1 Apartamento y casa

El mapa que se muestra a continuación permite observar la distribución del precio por zonas teniendo en cuenta casas y apartamentos.

## `summarise()` has grouped output by 'longitud'. You can override using the
## `.groups` argument.

La siguiente tabla muestra los valores del promedio y la mediana para las variables precio y precio por metro cuadrado de casas y apartamentos.

## # A tibble: 5 × 5
##   zona       precio_promedio precio_mediana precio_m2_promedio precio_m2_mediana
##   <chr>                <dbl>          <dbl>              <dbl>             <dbl>
## 1 Zona Cent…            310.            297               1.75              1.53
## 2 Zona Norte            346.            300               2.45              2.23
## 3 Zona Oeste            679.            580               3.65              3.71
## 4 Zona Orie…            229.            210               1.44              1.32
## 5 Zona Sur              427.            320               2.72              2.69

3.2.1.2 Apartamento

El mapa que se muestra a continuación permite observar la distribución del precio por zonas teniendo en cuenta solo los apartamentos.

## `summarise()` has grouped output by 'longitud'. You can override using the
## `.groups` argument.

La siguiente tabla muestra los valores del promedio y la mediana para las variables precio y precio por metro cuadrado de apartamentos.

## # A tibble: 5 × 5
##   zona       precio_promedio precio_mediana precio_m2_promedio precio_m2_mediana
##   <chr>                <dbl>          <dbl>              <dbl>             <dbl>
## 1 Zona Cent…            187.           152.               1.95              1.84
## 2 Zona Norte            285.           250                2.81              2.67
## 3 Zona Oeste            669.           570                3.85              3.84
## 4 Zona Orie…            153.           115                1.70              1.58
## 5 Zona Sur              297.           245                2.99              2.90

3.2.1.3 Casa

El mapa que se muestra a continuación permite observar la distribución del precio por zonas teniendo en cuenta solo las casas.

## `summarise()` has grouped output by 'longitud'. You can override using the
## `.groups` argument.

La siguiente tabla muestra los valores del promedio y la mediana para las variables precio y precio por metro cuadrado de casas.

## # A tibble: 5 × 5
##   zona       precio_promedio precio_mediana precio_m2_promedio precio_m2_mediana
##   <chr>                <dbl>          <dbl>              <dbl>             <dbl>
## 1 Zona Cent…            339.            310               1.70              1.49
## 2 Zona Norte            446.            390               1.85              1.67
## 3 Zona Oeste            736.            680               2.39              2.07
## 4 Zona Orie…            245.            235               1.39              1.26
## 5 Zona Sur              612.            480               2.34              2.17

3.2.2 ¿Cuál es el tipo de vivienda más ofertada?

A continuación, se usa un objeto visual tipo torta o pie que muestra la distribución del tipo de vivienda en Cali.

## >>> suggestions
## PieChart(tipo, hole=0)  # traditional pie chart
## PieChart(tipo, values="%")  # display %'s on the chart
## PieChart(tipo)  # bar chart
## Plot(tipo)  # bubble plot
## Plot(tipo, values="count")  # lollipop plot 
## 
## --- tipo --- 
## 
##                apartamento   casa      Total 
## Frequencies:          5106   3221       8327 
## Proportions:         0.613  0.387      1.000 
## 
## Chi-squared test of null hypothesis of equal probabilities 
##   Chisq = 426.711, df = 1, p-value = 0.000

3.2.3 ¿Cuáles son las características más relevantes?

3.2.3.1 Precio y precio por metro cuadrado

A continuación, se muestran las variables precio (preciom) y precio por metro cuadrado (precio_m2) usando el objeto visual tipo Boxplot

3.2.3.2 Zona

A continuación, se usa un objeto tipo barras para mostrar la información sobre la variable Zona

##              
##               Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
##   apartamento          24       1199       1035           62     2786
##   casa                100        723        169          289     1940

3.2.3.3 Piso

##              
##                 1   2   3   4   5   6   7   8   9  10  11  12
##   apartamento 431 512 573 545 564 243 203 211 146 128  84  83
##   casa        430 938 524  62   4   2   4   0   0   2   0   0

3.2.3.4 Área construida

A continuación, se presenta la variable área construida usando el objeto visual tipo histograma.

3.2.3.5 Habitaciones

A continuación, se usa un objeto tipo barras para mostrar la información sobre la variable Habitaciones

3.2.3.6 Estrato

A continuación, se usa un objeto tipo barras para mostrar la información sobre la variable estrato

##              
##                  3    4    5    6
##   apartamento  639 1404 1767 1296
##   casa         814  727  984  696

3.2.3.7 Número de parqueaderos

A continuación, se usa un objeto tipo barras para mostrar la información sobre la variable número de parqueaderos

##              
##                  1    2    3    4    5    6    7    8    9   10
##   apartamento 2299 1586  253   90    4    2    1    0    0    2
##   casa         857  892  268  296   64   66   17   17    4    6

3.2.3.8 Baños

A continuación, se usa un objeto tipo barras para mostrar la información sobre la variable baños

##              
##                  0    1    2    3    4    5    6    7    8    9   10
##   apartamento   14  400 2502 1201  639  301   40    8    1    0    0
##   casa          31   97  444  793  821  590  275   99   47   15    9

3.2.4 Nicho de mercado

Para apoyar la toma de decisiones para el nicho de mercado se realizará el análisis por tipo de vivienda de forma separada. Adicionalmente, el nicho de mercado se relaciona directamente con las ventas y, por tanto, el precio. En ese orden de ideas, las variables base de análisis serán el precio y el precio por metro cuadrado. Las variables adicionales a tener en cuenta serán aquellas inherentes a la venta o a características del inmueble que se relacionen con el cliente como zona y estrato. No se incluye la variable barrio teniendo en cuenta el alto número de valores únicos.

3.2.4.1 Apartamento

Precio
## # A tibble: 1 × 2
##   precio_mediana precio_m2_mediana
##            <dbl>             <dbl>
## 1            280                 3

Zona
## # A tibble: 5 × 3
##   zona         precio_mediana precio_m2_mediana
##   <chr>                 <dbl>             <dbl>
## 1 Zona Centro            152.              1.84
## 2 Zona Norte             250               2.67
## 3 Zona Oeste             570               3.84
## 4 Zona Oriente           115               1.58
## 5 Zona Sur               245               2.90

Estrato
## # A tibble: 4 × 3
##   estrato precio_mediana precio_m2_mediana
##     <dbl>          <dbl>             <dbl>
## 1       3           120               1.98
## 2       4           190.              2.68
## 3       5           300               3.2 
## 4       6           610               3.99

3.2.4.2 Casa

Precio
## # A tibble: 1 × 2
##   precio_mediana precio_m2_mediana
##            <dbl>             <dbl>
## 1            430              1.92

Zona
## # A tibble: 5 × 3
##   zona         precio_mediana precio_m2_mediana
##   <chr>                 <dbl>             <dbl>
## 1 Zona Centro             310              1.49
## 2 Zona Norte              390              1.67
## 3 Zona Oeste              680              2.07
## 4 Zona Oriente            235              1.26
## 5 Zona Sur                480              2.17

Estrato
## # A tibble: 4 × 3
##   estrato precio_mediana precio_m2_mediana
##     <dbl>          <dbl>             <dbl>
## 1       3            250              1.44
## 2       4            360              1.82
## 3       5            480              2   
## 4       6            890              2.81

4. Resultados

A continuación se listan los resultados basados en el ejercicio de visualización de la sección anterior:

4.1 Información sobre precio de viviendas

El precio promedio del costo total y costo por metro cuadrado de las viviendas en diferentes zonas de Cali, teniendo en cuenta ambos tipos de vivienda, es:

  • Zona Centro: 310 millones, 1,75 millones/m^2
  • Zona Norte: 346 millones, 2,45 millones/m^2
  • Zona Oeste: 679 millones, 3,65 millones/m^2
  • Zona Oriente: 229 millones, 1,44 millones/m^2
  • Zona Sur: 426 millones, 2,72 millones/m^2

El precio promedio del costo total y costo por metro cuadrado de las viviendas en diferentes zonas de Cali, teniendo en cuenta solo los apartamentos, es:

  • Zona Centro: 187 millones, 1,95 millones/m^2
  • Zona Norte: 285 millones, 2,81 millones/m^2
  • Zona Oeste: 669 millones, 3,85 millones/m^2
  • Zona Oriente: 153 millones, 1,69 millones/m^2
  • Zona Sur: 297 millones, 2,98 millones/m^2

El precio promedio del costo total y costo por metro cuadrado de las viviendas en diferentes zonas de Cali, teniendo en cuenta solo las casas, es:

  • Zona Centro: 339 millones, 1,69 millones/m^2
  • Zona Norte: 446 millones, 1,84 millones/m^2
  • Zona Oeste: 736 millones, 2,38 millones/m^2
  • Zona Oriente: 244 millones, 1,38 millones/m^2
  • Zona Sur: 612 millones, 2,33 millones/m^2

4.2 Tipo de vivienda más ofertada

El tipo de vivienda más ofertada en Cali es:

  • Aartamento: 61%
  • Casa: 39%

4.3 Caracteristicas relevantes

  • Precio: además de los resultados del precio mencionados anteriomente, la distribución del precio en millones de apartamentos se encuentra por encima cuando se evalua teniendo en cuenta el área construida.
  • Zona: la zona sur, norte y oeste tienen la mayor proporción de oferta de viviendas.
  • Piso: las casas y apartamentos tienen proporciones similares de piso 1-3. A partir de piso 4 la participación de los apartamentos se lleva la mayor proporción.
  • Área construida: la variable se distribuye principalmente entre 0 y 400 metros cuadrados, la mediana es 123 metros cuadrados.
  • Número de habitaciones: la variable tiene mayor participación de apartamentos entre 0-3 habitaciones, a partir de 4 la participación es mayor en casas.
  • Estrato: el estrato 5 se lleva la mayor proporción de oferta de vivienda teniendo más participación de apartamentos que de casas.
  • Número de parqueaderos: De 1 a 3 parqueaderos tiene la mayor proporción de oferta de vivienda teniendo más participación de apartamentos que de casas. A partir de 4 parqueaderos las casas tienen más participación.
  • Baños: De 1 a 3 baños tiene la mayor proporción de oferta de vivienda teniendo más participación de apartamentos que de casas. A partir de 4 baños las casas tienen más participación.

4.4 Nicho de mercado

4.4.1 Apartamento

  • Precio: el precio por metro cuadrado se podría ubicar entre 1 y 2 millones o entre 4 y 6 millones.
  • Zona: la zona podría estar en norte o en oeste/sur.
  • Estrato: el estrato podría estar en 3 o 5-6.

4.4.2 Casa

  • Precio: el precio por metro cuadrado se podría ubicar entre 0 y 1 millones o entre 3 y 5 millones.
  • Zona: la zona podría estar en oriente o en oeste/sur.
  • Estrato:el estrato podría estar en 3 o 5-6.

5. Discusión

5.1 Información de precio

La información del precio en las viviendas de Cali se puede interpretar teniendo en cuenta ambos tipos de vivienda, apartamento o casa. En el primer caso, la zona oeste y la zona sur tienen, promedio, los valores más altos con 3,65 y 2,72 millones por metro cuadrado. Para los apartamentos se mantiene la zona oeste y la zona sur con promedio de 3,85 y 2,98 millones por metro cuadrado, hay que resaltar que la zona norte está muy cerca con 2,81 millones por metro cuadrado. Finalmente, las casas mantienen el patrón en las zonas oeste y sur con 2,38 y 2,33 millones por metro cuadrado.

5.2 Tipo de vivivenda más ofertada

El tipo de vivienda que mayor participación tiene es el apartmento con 61% de la vivienda ofertada en Cali mientras que las casas representan el 39%

5.3 Características relevantes

El análisis del precio por metro cuadrado permite entender de mejor manera el costo de vivienda. Si bien las casas tienen un precio más alto sin tener en cuenta el área, al evaluar el precio por metro cuadrado hace que la distribución del 75% de los datos de apartamentos se sitúe cerca de 4 millones por metro cuadrado mientras que, el mismo % de casa, está cerca a 3 millones por metro cuadrado.

La zona sur, norte y oeste son las que tienen mayor proporción de oferta de vivienda con el 56%, 23% y 14% respectivamente. El patrón del piso concuerda con la forma de construcción usual de casa de 1-3 pisos, a partir de allí los apartamentos toman mayor participación indicando su ubicación en el edificio siendo un valor posicional y no de cantidad como en las casas.

Para el área construida se tuvo en cuenta la mediana debido a la presencia de valores extremos, su distribución está en tre 0 y 400 metros cuadrados, teniendo en cuenta que la proporción de apartamentos es mayor, es coherente que su mediana sea 123 metros cuadrados. El número de habitaciones, baños y parqueaderos tienen un comportamiento similar debido a la cantidad de apartamentos en la base, la tendencia es que ese tipo de vivienda posee mayor proporción de 1-3 habitaciones, de 1-3 baños y de 1-3 parqueaderos. Finalmente, el estrato 5 es el que tiene mayor participación, teniendo en cuenta que la variable se ubica entre el estrato 3 y el 6, no existen 1 y 2.

5.4 Nicho de mercado

Teniendo en cuenta la información de la base y el concepto de nicho de mercado de HubSpot, el nicho de mercado es aquella porción del segmente de mercado que no ha sido completamente explorado, pero que han comprado en el pasado. Así, pues, se sugiere a B&C (Bines y Casas) enfocarse en el nicho mercado que tiene las siguientes características:

Apartamento

Para los apartamentos se podría tener dos enfoques, un menor precio por metro cuadrado para nichos con menor capacidad de compra, incluso apuntando a programas de vivienda de interés social (VIS) teniendo en cuenta sus topes en salarios mínimos legales mensuales vigentes para la zona norte y el estrato 3. Por otra parte, apuntar a un nicho con mayor capacidad de compra que pueda pagar entr 4 y 6 millones por metro cuadrado en la zona oeste o sur para estratos 5 o 6.

  • Precio: el precio por metro cuadrado se podría ubicar entre 1 y 2 millones o entre 4 y 6 millones.
  • Zona: la zona podría estar en norte o en oeste/sur.
  • Estrato: el estrato podría estar en 3 o 5-6.

Casa

Para los apartamentos se podría tener dos enfoques, un menor precio por metro cuadrado para nichos con menor capacidad de compra para la zona oriente y el estrato 3. Por otra parte, apuntar a un nicho con mayor capacidad de compra que pueda pagar entr 3 y 5 millones por metro cuadrado en la zona oeste o sur para estratos 5 o 6.

  • Precio: el precio por metro cuadrado se podría ubicar entre 0 y 1 millones o entre 3 y 5 millones.
  • Zona: la zona podría estar en oriente o en oeste/sur.
  • Estrato:el estrato podría estar en 3 o 5-6.

5.5 Estrategias de marketing

La generación de estrategias de marketing se podrían abordar construyendo arquetipos o buyer persona de cliente. De esa manera, para los apartamentos se sugiere parejas sin hijos con capacidad conjunta de compra alta. Profesionales en edades de 28 a 40 años con mascotas en zonas cercanas a centros de comercio u oficinas.

Para las casas, se sugiere parejas con presencia de 1 o más hijos a partir de 30 años. Sería ideal contar con información financiera de clientes para crear audiencias personalizadas en plataformas de anuncios para, con base en ellas, buscar personas similares, por ejemplo con audiencias de eventos importantes de Google, que busquen bienes raíces.

5.6 Precios de venta

Los precios de venta se sugieren en las características del nicho de mercado. Es importante acotar que el segmento de mercado para apartamentos tiene una mediana de 3 millones por metro cuadrado y 280 millones por unidad. Para las casas el segmento es 1,92 millones por metro cuadrado y 430 millones por unidad.

5.7 Combinaciones para clientes

Las combinaciones deben enfocarse en el buyer persona, para ello sería necesario realizar su definición antes de proponerlas.

6. Conclusiones