El mercado inmobiliario es un sector en crecimiento constante con grandes oportunidades de inversión para empresas y particulares. La ciudad da Cali, la tercera más importante del país es un excelente lugar para las empresas de bienes raíces, según la Alcaldía de Cali [1] a diciembre de 2023 este sector presenta un avalúo total de 105 trillones de pesos y un área total construida de 8.078 hectáreas y se espera que continue creciendo en los próximos años.
Este informe presenta un resumen general del estado actual del mercado para la ciudad de Cali y se analizan algunas tendencias y posibilidades de inversión para que la empresa B&C (Bines y Casas) pueda tomar decisiones informadas.
El análisis de los datos se realizó en el software R, versión 4.3, donde se hizo un proceso de carga de la información procedente de un repositorio externo, una limpieza de los datos y se abordaron valores faltantes, Posteriormente se hizo un análisis de variables cualitativas y cuantitativas y se exploró de correlación para las cuantitativas.
Antes de realizar un proceso de limpieza de datos, se hizo una exploración preliminar de todas las variables para ver el algunas estadísticas generales y el número de valores faltantes.
Para las variables cualitativas, se realizó un proceso de revisión y estandarización, donde se homogenizaron los diferentes valores para evitar tener categorías diferentes.
Para las variables cuantitativas, se realizó un proceso de revisión para buscar números con un separador decimal distinto o mal ubicado.
Para abordar los datos faltantes, primer se eliminaron los registros que tenían la mayoría de las variables vacías y solo tenían un identificador. Luego se procedió a analizar las variables que tuvieran datos faltantes, revisando su distribución para detectar posibles patrones y explorar opciones de imputación.
Para el análisis de las variables cualitativas se realizó un análisis de frecuencias y para las variables cuantitativas se usaran histogramas para ver su distribución y también se realizó un análisis de correlación. Finalmente se hizo un análisis del precio frente a las variables cualitativas
str(vivienda_faltantes)
## spc_tbl_ [8,330 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8330] 8312 8311 8307 8296 8297 ...
## $ zona : chr [1:8330] "Zona Oeste" "Zona Oeste" "Zona Oeste" "Zona Sur" ...
## $ piso : num [1:8330] 4 1 NA 2 NA NA 2 NA NA 2 ...
## $ estrato : num [1:8330] 6 6 5 3 5 5 6 5 5 5 ...
## $ preciom : num [1:8330] 1300 480 1200 220 330 1350 305 480 275 285 ...
## $ areaconst: num [1:8330] 318 300 800 150 112 390 125 280 74 120 ...
## $ parquea : num [1:8330] 2 1 4 1 2 8 2 4 1 2 ...
## $ banios : num [1:8330] 4 4 7 2 4 10 3 4 2 4 ...
## $ habitac : num [1:8330] 2 4 5 4 3 10 3 4 3 3 ...
## $ tipo : chr [1:8330] "Apartamento" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8330] "arboleda" "normandía" "miraflores" "el guabal" ...
## $ longitud : num [1:8330] -76576 -76571 -76568 -76565 -76565 ...
## $ latitud : num [1:8330] 3454 3454 3455 3417 3408 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parquea : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitac : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ","
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
La base de datos contiene 8.330 registros y 13 variables, tres de tipo cualitativo, 9 de tipo cuantitativo y una variable identificadora ID.
summary(vivienda_faltantes)
## id zona piso estrato
## Min. : 1 Length:8330 Min. : 1.000 Min. :3.000
## 1st Qu.:2082 Class :character 1st Qu.: 2.000 1st Qu.:4.000
## Median :4164 Mode :character Median : 3.000 Median :5.000
## Mean :4164 Mean : 3.772 Mean :4.634
## 3rd Qu.:6246 3rd Qu.: 5.000 3rd Qu.:5.000
## Max. :8319 Max. :12.000 Max. :6.000
## NA's :3 NA's :2641 NA's :3
## preciom areaconst parquea banios
## Min. : 58.0 Min. : 30 Min. : 1.000 Min. : 0.000
## 1st Qu.: 220.0 1st Qu.: 80 1st Qu.: 1.000 1st Qu.: 2.000
## Median : 330.0 Median : 123 Median : 2.000 Median : 3.000
## Mean : 434.2 Mean : 175 Mean : 1.836 Mean : 3.112
## 3rd Qu.: 540.0 3rd Qu.: 229 3rd Qu.: 2.000 3rd Qu.: 4.000
## Max. :1999.0 Max. :1745 Max. :10.000 Max. :10.000
## NA's :2 NA's :3 NA's :1606 NA's :3
## habitac tipo barrio longitud
## Min. : 0.000 Length:8330 Length:8330 Min. :-76576.00
## 1st Qu.: 3.000 Class :character Class :character 1st Qu.:-76506.00
## Median : 3.000 Mode :character Mode :character Median : -76.54
## Mean : 3.605 Mean :-21845.13
## 3rd Qu.: 4.000 3rd Qu.: -76.52
## Max. :10.000 Max. : -76.46
## NA's :3 NA's :3
## latitud
## Min. : 3.333
## 1st Qu.: 3.390
## Median : 3.450
## Mean : 970.370
## 3rd Qu.:3367.000
## Max. :3497.000
## NA's :3
Un primer análisis exploratorio nos permite observar algunas cifras generales y tener una idea de la vivienda promedio en Cali, que cuesta 434 millones, está ubicada en un tercer piso, en estrato 5, con un área construida de 175 metros cuadrados, tiene 2 parqueaderos, 3 baños y 3 habitaciones. Antes de realizar un análisis más profundo, es necesario proceder con la limpieza de datos.
Luego de revisar los valores únicos de las variables cualitativas, se identificó que la variable ‘tipo’ tenía valores diferentes, por este motivo se homogenizaron los valores de la siguiente manera:
NombresUnicosTipo<- unique(vivienda_faltantes[,'tipo']); NombresUnicosTipo
## # A tibble: 7 × 1
## tipo
## <chr>
## 1 Apartamento
## 2 Casa
## 3 APARTAMENTO
## 4 casa
## 5 CASA
## 6 apto
## 7 <NA>
NombresUnicosZona<- unique(vivienda_faltantes[,'zona']); NombresUnicosZona
## # A tibble: 6 × 1
## zona
## <chr>
## 1 Zona Oeste
## 2 Zona Sur
## 3 Zona Norte
## 4 Zona Oriente
## 5 Zona Centro
## 6 <NA>
NombresUnicosBarrio<- unique(vivienda_faltantes[,'barrio']); NombresUnicosBarrio
## # A tibble: 437 × 1
## barrio
## <chr>
## 1 arboleda
## 2 normandía
## 3 miraflores
## 4 el guabal
## 5 bella suiza alta
## 6 bella suiza
## 7 valle del lili
## 8 el nacional
## 9 santa teresita
## 10 aguacatal
## # ℹ 427 more rows
vivienda_faltantes$tipo <- replace (vivienda_faltantes$tipo, vivienda_faltantes$tipo %in% c("casa","CASA","APARTAMENTO","apto"), c("Casa","Casa","Apartamento","Apartamento"))
NombresUnicosTipo<- unique(vivienda_faltantes[,'tipo']); NombresUnicosTipo
## # A tibble: 3 × 1
## tipo
## <chr>
## 1 Apartamento
## 2 Casa
## 3 <NA>
Para la variable ‘barrio’, se pusieron todos los valores en minúscula y se modificaron algunos caracteres especiales presentes como ‘√’
vivienda_faltantes$barrio <- tolower(vivienda_faltantes$barrio)
vivienda_faltantes$barrio <- replace (vivienda_faltantes$barrio, vivienda_faltantes$barrio %in% c("√©","√∫"), c("é","ú"))
NombresUnicosBarrio<- unique(vivienda_faltantes[,'barrio']); NombresUnicosBarrio
## # A tibble: 408 × 1
## barrio
## <chr>
## 1 arboleda
## 2 normandía
## 3 miraflores
## 4 el guabal
## 5 bella suiza alta
## 6 bella suiza
## 7 valle del lili
## 8 el nacional
## 9 santa teresita
## 10 aguacatal
## # ℹ 398 more rows
Para las variables cuantitativas, se observó que las únicas que tenían problemas eran las coordenadas que no tenían el separador decimal o lo tenían en el lugar incorrecto.
Luego del análisis preliminar donde se observó que todas las variables tenían 3 valores faltantes, se realizó la búsqueda de los registros y al comprobar que eran tres registros donde todas las variables faltaban, se procedió a eliminarlos:
VIM::aggr(vivienda_faltantes, cex.axis = 0.5, cex.lab= 0.8)
vivienda_faltantesSinNA <- vivienda_faltantes[-c(8320,8321,8322),]
VIM::aggr(vivienda_faltantesSinNA, cex.axis = 0.5, cex.lab= 0.8)
Para las variables piso y parqueadero que tienen valores faltantes, se creó un vector con los valores faltantes para esas variables, donde “TRUE” representa los datos faltantes. Estos valores faltantes se analizaron contra algunas variables como tipo de casa y estrato:
Para el caso de piso faltante, no se ve una distribución particular y los faltantes están homogéneamente distribuidos, entonces no es posible imputar esto valores con un 0 o el promedio dado que sería un error.
Para el caso de parqueadero faltante, se ve una distribución particular cuando se analiza contra estrato, teniendo en cuenta esta distribución es posible inferir que los datos faltantes representan un 0, donde las viviendas de estratos más bajos no tienen casi parqueaderos pero las de estratos altos sí.
## # A tibble: 11 × 1
## parquea
## <dbl>
## 1 2
## 2 1
## 3 4
## 4 8
## 5 0
## 6 3
## 7 6
## 8 5
## 9 10
## 10 7
## 11 9
El tipo de vivienda más frecuente es el apartamento, que presenta el 61% de la casa y las casas representan el 39% de las viviendas:
## Frequencies
## vivienda_faltantesSinNA$tipo
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------------- ------ --------- -------------- --------- --------------
## Apartamento 5082 61.03 61.03 61.03 61.03
## Casa 3245 38.97 100.00 38.97 100.00
## <NA> 0 0.00 100.00
## Total 8327 100.00 100.00 100.00 100.00
La zona con mayor cantidad de viviendas es la Zona Sur con el 56%, seguida de la zona norte con el 23%:
## Frequencies
## vivienda_faltantesSinNA$zona
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ------------------ ------ --------- -------------- --------- --------------
## Zona Centro 124 1.49 1.49 1.49 1.49
## Zona Norte 1922 23.08 24.57 23.08 24.57
## Zona Oeste 1204 14.46 39.03 14.46 39.03
## Zona Oriente 351 4.22 43.24 4.22 43.24
## Zona Sur 4726 56.76 100.00 56.76 100.00
## <NA> 0 0.00 100.00
## Total 8327 100.00 100.00 100.00 100.00
Dada la gran cantidad de barrios, solamente se va a destacar que Zona del Lili tiene un 12% de las viviendas y ciudad jardín un 6%:
## Frequencies
## vivienda_faltantesSinNA$barrio
## Type: Character
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------------------------------- ------ --------- -------------- --------- --------------
## 20 de julio 3 0.036 0.036 0.036 0.036
## 3 de julio 1 0.012 0.048 0.012 0.048
## acopi 158 1.897 1.945 1.897 1.945
## agua blanca 1 0.012 1.957 0.012 1.957
## aguablanca 2 0.024 1.982 0.024 1.982
## aguacatal 110 1.321 3.303 1.321 3.303
## alameda 16 0.192 3.495 0.192 3.495
## alameda del rio 1 0.012 3.507 0.012 3.507
## alameda del río 2 0.024 3.531 0.024 3.531
## alamos 14 0.168 3.699 0.168 3.699
## alborada 1 0.012 3.711 0.012 3.711
## alcazares 2 0.024 3.735 0.024 3.735
## alférez real 5 0.060 3.795 0.060 3.795
## alferez real 2 0.024 3.819 0.024 3.819
## alfonso lopez 1 0.012 3.831 0.012 3.831
## alfonso lópez 21 0.252 4.083 0.252 4.083
## alfonso lópez i 1 0.012 4.095 0.012 4.095
## alto jordán 1 0.012 4.107 0.012 4.107
## altos de guadalupe 4 0.048 4.155 0.048 4.155
## altos de menga 3 0.036 4.191 0.036 4.191
## altos de santa 1 0.012 4.203 0.012 4.203
## antonio nariño 2 0.024 4.227 0.024 4.227
## aranjuez 15 0.180 4.407 0.180 4.407
## arboleda 5 0.060 4.467 0.060 4.467
## arboleda campestre candelaria 1 0.012 4.479 0.012 4.479
## arboledas 38 0.456 4.936 0.456 4.936
## atanasio girardot 9 0.108 5.044 0.108 5.044
## autopista sur 1 0.012 5.056 0.012 5.056
## bajo aguacatal 1 0.012 5.068 0.012 5.068
## barranquilla 6 0.072 5.140 0.072 5.140
## barrio 7de agosto 1 0.012 5.152 0.012 5.152
## barrio el recuerdo 1 0.012 5.164 0.012 5.164
## barrio eucarístico 1 0.012 5.176 0.012 5.176
## barrio obrero 1 0.012 5.188 0.012 5.188
## barrio tranquilo y 1 0.012 5.200 0.012 5.200
## base aérea 2 0.024 5.224 0.024 5.224
## belalcazar 4 0.048 5.272 0.048 5.272
## belisario caicedo 2 0.024 5.296 0.024 5.296
## bella suiza 18 0.216 5.512 0.216 5.512
## bella suiza alta 4 0.048 5.560 0.048 5.560
## bellavista 43 0.516 6.077 0.516 6.077
## benjamín herrera 8 0.096 6.173 0.096 6.173
## berlin 1 0.012 6.185 0.012 6.185
## bloques del limonar 1 0.012 6.197 0.012 6.197
## bochalema 33 0.396 6.593 0.396 6.593
## bolivariano 1 0.012 6.605 0.012 6.605
## bosques de alboleda 1 0.012 6.617 0.012 6.617
## bosques del limonar 21 0.252 6.869 0.252 6.869
## boyacá 1 0.012 6.881 0.012 6.881
## bretaña 16 0.192 7.073 0.192 7.073
## brisas de guadalupe 1 0.012 7.085 0.012 7.085
## brisas de los 82 0.985 8.070 0.985 8.070
## brisas del guabito 1 0.012 8.082 0.012 8.082
## brisas del limonar 1 0.012 8.094 0.012 8.094
## bueno madrid 1 0.012 8.106 0.012 8.106
## buenos aires 7 0.084 8.190 0.084 8.190
## caldas 1 0.012 8.202 0.012 8.202
## cali 37 0.444 8.647 0.444 8.647
## cali bella 1 0.012 8.659 0.012 8.659
## cali canto 1 0.012 8.671 0.012 8.671
## calibella 1 0.012 8.683 0.012 8.683
## calicanto 8 0.096 8.779 0.096 8.779
## calicanto viii 1 0.012 8.791 0.012 8.791
## calima 6 0.072 8.863 0.072 8.863
## calimio norte 5 0.060 8.923 0.060 8.923
## calipso 11 0.132 9.055 0.132 9.055
## cambulos 3 0.036 9.091 0.036 9.091
## camino real 36 0.432 9.523 0.432 9.523
## campestre 1 0.012 9.535 0.012 9.535
## cañasgordas 7 0.084 9.619 0.084 9.619
## cañaveralejo 12 0.144 9.763 0.144 9.763
## cañaverales 21 0.252 10.016 0.252 10.016
## cañaverales los samanes 1 0.012 10.028 0.012 10.028
## caney 88 1.057 11.084 1.057 11.084
## caney especial 5 0.060 11.144 0.060 11.144
## capri 56 0.673 11.817 0.673 11.817
## cascajal 1 0.012 11.829 0.012 11.829
## cataya real 1 0.012 11.841 0.012 11.841
## ceibas 1 0.012 11.853 0.012 11.853
## centelsa 1 0.012 11.865 0.012 11.865
## centenario 16 0.192 12.057 0.192 12.057
## centro 4 0.048 12.105 0.048 12.105
## cerro cristales 22 0.264 12.369 0.264 12.369
## cerros de guadalupe 1 0.012 12.381 0.012 12.381
## champagnat 14 0.168 12.550 0.168 12.550
## chapinero 7 0.084 12.634 0.084 12.634
## chiminangos 18 0.216 12.850 0.216 12.850
## chiminangos 1 etapa 1 0.012 12.862 0.012 12.862
## chiminangos 2 etapa 2 0.024 12.886 0.024 12.886
## chipichape 30 0.360 13.246 0.360 13.246
## ciudad 2000 96 1.153 14.399 1.153 14.399
## ciudad antejardin 1 0.012 14.411 0.012 14.411
## ciudad bochalema 48 0.576 14.987 0.576 14.987
## ciudad capri 13 0.156 15.144 0.156 15.144
## ciudad cordoba 20 0.240 15.384 0.240 15.384
## ciudad córdoba 15 0.180 15.564 0.180 15.564
## ciudad córdoba reservado 1 0.012 15.576 0.012 15.576
## ciudad country 1 0.012 15.588 0.012 15.588
## ciudad del campo 1 0.012 15.600 0.012 15.600
## ciudad jardin 22 0.264 15.864 0.264 15.864
## ciudad jardín 518 6.221 22.085 6.221 22.085
## ciudad jardin pance 1 0.012 22.097 0.012 22.097
## ciudad los alamos 1 0.012 22.109 0.012 22.109
## ciudad los álamos 25 0.300 22.409 0.300 22.409
## ciudad meléndez 1 0.012 22.421 0.012 22.421
## ciudad melendez 1 0.012 22.433 0.012 22.433
## ciudad modelo 7 0.084 22.517 0.084 22.517
## ciudad pacifica 3 0.036 22.553 0.036 22.553
## ciudad real 3 0.036 22.589 0.036 22.589
## ciudad talanga 1 0.012 22.601 0.012 22.601
## ciudad universitaria 1 0.012 22.613 0.012 22.613
## ciudadela comfandi 17 0.204 22.817 0.204 22.817
## ciudadela del río 1 0.012 22.829 0.012 22.829
## ciudadela melendez 1 0.012 22.841 0.012 22.841
## ciudadela paso ancho 1 0.012 22.853 0.012 22.853
## ciudadela pasoancho 21 0.252 23.106 0.252 23.106
## colinas de menga 3 0.036 23.142 0.036 23.142
## colinas del bosque 1 0.012 23.154 0.012 23.154
## colinas del sur 8 0.096 23.250 0.096 23.250
## colon 1 0.012 23.262 0.012 23.262
## colseguros 44 0.528 23.790 0.528 23.790
## colseguros andes 5 0.060 23.850 0.060 23.850
## comfenalco 1 0.012 23.862 0.012 23.862
## compartir 1 0.012 23.874 0.012 23.874
## conjunto gibraltar 1 0.012 23.886 0.012 23.886
## cristales 83 0.997 24.883 0.997 24.883
## cristobal colón 14 0.168 25.051 0.168 25.051
## cristóbal colón 2 0.024 25.075 0.024 25.075
## cuarto de legua 44 0.528 25.603 0.528 25.603
## departamental 29 0.348 25.952 0.348 25.952
## ed benjamin herrera 1 0.012 25.964 0.012 25.964
## el bosque 50 0.600 26.564 0.600 26.564
## el caney 209 2.510 29.074 2.510 29.074
## el castillo 6 0.072 29.146 0.072 29.146
## el cedro 8 0.096 29.242 0.096 29.242
## el diamante 2 0.024 29.266 0.024 29.266
## el dorado 6 0.072 29.338 0.072 29.338
## el gran limonar 8 0.096 29.434 0.096 29.434
## el guabal 19 0.228 29.663 0.228 29.663
## el guabito 1 0.012 29.675 0.012 29.675
## el ingenio 203 2.438 32.112 2.438 32.112
## el ingenio 3 1 0.012 32.124 0.012 32.124
## el ingenio i 19 0.228 32.353 0.228 32.353
## el ingenio ii 21 0.252 32.605 0.252 32.605
## el ingenio iii 20 0.240 32.845 0.240 32.845
## el jardín 15 0.180 33.025 0.180 33.025
## el jordán 1 0.012 33.037 0.012 33.037
## el lido 59 0.709 33.746 0.709 33.746
## el limonar 135 1.621 35.367 1.621 35.367
## el nacional 1 0.012 35.379 0.012 35.379
## el paraíso 3 0.036 35.415 0.036 35.415
## el peñon 60 0.721 36.135 0.721 36.135
## el prado 2 0.024 36.159 0.024 36.159
## el refugio 120 1.441 37.601 1.441 37.601
## el rodeo 1 0.012 37.613 0.012 37.613
## el sena 1 0.012 37.625 0.012 37.625
## el trébol 5 0.060 37.685 0.060 37.685
## el troncal 19 0.228 37.913 0.228 37.913
## el vallado 1 0.012 37.925 0.012 37.925
## eucarístico 2 0.024 37.949 0.024 37.949
## evaristo garcía 2 0.024 37.973 0.024 37.973
## farrallones de pance 1 0.012 37.985 0.012 37.985
## fenalco kennedy 1 0.012 37.997 0.012 37.997
## fepicol 1 0.012 38.009 0.012 38.009
## flora 1 0.012 38.021 0.012 38.021
## flora industrial 16 0.192 38.213 0.192 38.213
## floralia 6 0.072 38.285 0.072 38.285
## fonaviemcali 1 0.012 38.297 0.012 38.297
## francisco eladio ramirez 1 0.012 38.309 0.012 38.309
## fuentes de la 1 0.012 38.321 0.012 38.321
## gaitan 1 0.012 38.333 0.012 38.333
## gran limonar 24 0.288 38.621 0.288 38.621
## granada 16 0.192 38.813 0.192 38.813
## guadalupe 21 0.252 39.066 0.252 39.066
## guadalupe alto 1 0.012 39.078 0.012 39.078
## guaduales 2 0.024 39.102 0.024 39.102
## guayaquil 16 0.192 39.294 0.192 39.294
## hacienda alferez real 1 0.012 39.306 0.012 39.306
## ingenio 1 0.012 39.318 0.012 39.318
## ingenio i 1 0.012 39.330 0.012 39.330
## ingenio ii 1 0.012 39.342 0.012 39.342
## jamundi 4 0.048 39.390 0.048 39.390
## jamundi alfaguara 1 0.012 39.402 0.012 39.402
## jorge eliecer gaitán 1 0.012 39.414 0.012 39.414
## jorge isaacs 1 0.012 39.426 0.012 39.426
## jose manuel marroquín 1 0.012 39.438 0.012 39.438
## juanamb√∫ 53 0.636 40.074 0.636 40.074
## juanambu 2 0.024 40.098 0.024 40.098
## junin 18 0.216 40.315 0.216 40.315
## junín 6 0.072 40.387 0.072 40.387
## la alborada 5 0.060 40.447 0.060 40.447
## la alianza 5 0.060 40.507 0.060 40.507
## la arboleda 18 0.216 40.723 0.216 40.723
## la base 15 0.180 40.903 0.180 40.903
## la buitrera 3 0.036 40.939 0.036 40.939
## la campiña 13 0.156 41.095 0.156 41.095
## la cascada 7 0.084 41.179 0.084 41.179
## la ceibas 1 0.012 41.191 0.012 41.191
## la esmeralda 1 0.012 41.203 0.012 41.203
## la flora 369 4.431 45.635 4.431 45.635
## la floresta 18 0.216 45.851 0.216 45.851
## la fortaleza 4 0.048 45.899 0.048 45.899
## la gran colombia 1 0.012 45.911 0.012 45.911
## la hacienda 166 1.994 47.904 1.994 47.904
## la independencia 12 0.144 48.049 0.144 48.049
## la libertad 2 0.024 48.073 0.024 48.073
## la luisa 1 0.012 48.085 0.012 48.085
## la merced 26 0.312 48.397 0.312 48.397
## la morada 1 0.012 48.409 0.012 48.409
## la nueva base 8 0.096 48.505 0.096 48.505
## la playa 1 0.012 48.517 0.012 48.517
## la portada al 1 0.012 48.529 0.012 48.529
## la primavera 1 0.012 48.541 0.012 48.541
## la reforma 1 0.012 48.553 0.012 48.553
## la rivera 11 0.132 48.685 0.132 48.685
## la rivera i 2 0.024 48.709 0.024 48.709
## la rivera ii 2 0.024 48.733 0.024 48.733
## la riverita 1 0.012 48.745 0.012 48.745
## la riviera 1 0.012 48.757 0.012 48.757
## la selva 11 0.132 48.889 0.132 48.889
## la villa del 1 0.012 48.901 0.012 48.901
## laflora 1 0.012 48.913 0.012 48.913
## lares de comfenalco 1 0.012 48.925 0.012 48.925
## las acacias 12 0.144 49.069 0.144 49.069
## las américas 3 0.036 49.105 0.036 49.105
## las camelias 1 0.012 49.117 0.012 49.117
## las ceibas 23 0.276 49.394 0.276 49.394
## las delicias 5 0.060 49.454 0.060 49.454
## las granjas 10 0.120 49.574 0.120 49.574
## las quintas de 1 0.012 49.586 0.012 49.586
## las vegas 1 0.012 49.598 0.012 49.598
## las vegas de 1 0.012 49.610 0.012 49.610
## libertadores 3 0.036 49.646 0.036 49.646
## los alamos 1 0.012 49.658 0.012 49.658
## los alcazares 17 0.204 49.862 0.204 49.862
## los alcázares 5 0.060 49.922 0.060 49.922
## los andes 21 0.252 50.174 0.252 50.174
## los cambulos 25 0.300 50.474 0.300 50.474
## los cámbulos 6 0.072 50.546 0.072 50.546
## los cristales 154 1.849 52.396 1.849 52.396
## los cristales club 1 0.012 52.408 0.012 52.408
## los farallones 4 0.048 52.456 0.048 52.456
## los guaduales 26 0.312 52.768 0.312 52.768
## los guayacanes 3 0.036 52.804 0.036 52.804
## los jockeys 1 0.012 52.816 0.012 52.816
## los libertadores 4 0.048 52.864 0.048 52.864
## los parques barranquilla 6 0.072 52.936 0.072 52.936
## los robles 1 0.012 52.948 0.012 52.948
## lourdes 2 0.024 52.972 0.024 52.972
## mamellan 1 0.012 52.984 0.012 52.984
## manzanares 5 0.060 53.044 0.060 53.044
## mariano ramos 1 0.012 53.056 0.012 53.056
## marroquín iii 1 0.012 53.068 0.012 53.068
## mayapan las vegas 46 0.552 53.621 0.552 53.621
## meléndez 23 0.276 53.897 0.276 53.897
## melendez 52 0.624 54.521 0.624 54.521
## menga 23 0.276 54.798 0.276 54.798
## metropolitano del norte 21 0.252 55.050 0.252 55.050
## miradol del aguacatal 1 0.012 55.062 0.012 55.062
## miraflores 26 0.312 55.374 0.312 55.374
## morichal de comfandi 3 0.036 55.410 0.036 55.410
## multicentro 27 0.324 55.734 0.324 55.734
## municipal 3 0.036 55.770 0.036 55.770
## napoles 2 0.024 55.794 0.024 55.794
## nápoles 29 0.348 56.143 0.348 56.143
## normandia 5 0.060 56.203 0.060 56.203
## normandía 158 1.897 58.100 1.897 58.100
## normandía west point 1 0.012 58.112 0.012 58.112
## norte 9 0.108 58.220 0.108 58.220
## norte la flora 1 0.012 58.232 0.012 58.232
## nueva base 1 0.012 58.244 0.012 58.244
## nueva floresta 15 0.180 58.424 0.180 58.424
## nueva tequendama 73 0.877 59.301 0.877 59.301
## oasis de comfandi 6 0.072 59.373 0.072 59.373
## oasis de pasoancho 1 0.012 59.385 0.012 59.385
## occidente 11 0.132 59.517 0.132 59.517
## pacara 19 0.228 59.745 0.228 59.745
## pacará 4 0.048 59.793 0.048 59.793
## palmas del ingenio 1 0.012 59.805 0.012 59.805
## pampa linda 26 0.312 60.118 0.312 60.118
## pampalinda 12 0.144 60.262 0.144 60.262
## panamericano 9 0.108 60.370 0.108 60.370
## pance 412 4.948 65.318 4.948 65.318
## parcelaciones pance 61 0.733 66.050 0.733 66.050
## parque residencial el 1 0.012 66.062 0.012 66.062
## paseo de los 2 0.024 66.086 0.024 66.086
## paso del comercio 6 0.072 66.158 0.072 66.158
## pasoancho 6 0.072 66.230 0.072 66.230
## poblado campestre 2 0.024 66.254 0.024 66.254
## ponce 1 0.012 66.266 0.012 66.266
## popular 6 0.072 66.338 0.072 66.338
## portada de comfandi 2 0.024 66.362 0.024 66.362
## portales de comfandi 1 0.012 66.374 0.012 66.374
## porvenir 3 0.036 66.410 0.036 66.410
## prados de oriente 6 0.072 66.483 0.072 66.483
## prados del limonar 21 0.252 66.735 0.252 66.735
## prados del norte 127 1.525 68.260 1.525 68.260
## prados del sur 2 0.024 68.284 0.024 68.284
## primavera 2 0.024 68.308 0.024 68.308
## primero de mayo 37 0.444 68.752 0.444 68.752
## primitivo crespo 3 0.036 68.788 0.036 68.788
## puente del comercio 6 0.072 68.860 0.072 68.860
## puente palma 1 0.012 68.872 0.012 68.872
## quintas de don 73 0.877 69.749 0.877 69.749
## quintas de salomia 4 0.048 69.797 0.048 69.797
## rafael uribe uribe 1 0.012 69.809 0.012 69.809
## refugio 2 0.024 69.833 0.024 69.833
## rep√∫blica de israel 1 0.012 69.845 0.012 69.845
## rincon de la 1 0.012 69.857 0.012 69.857
## rincón de salomia 1 0.012 69.869 0.012 69.869
## riveras del valle 1 0.012 69.881 0.012 69.881
## rozo la torre 1 0.012 69.893 0.012 69.893
## saavedra galindo 4 0.048 69.941 0.048 69.941
## salomia 40 0.480 70.422 0.480 70.422
## samanes 1 0.012 70.434 0.012 70.434
## samanes de guadalupe 1 0.012 70.446 0.012 70.446
## sameco 1 0.012 70.458 0.012 70.458
## san antonio 24 0.288 70.746 0.288 70.746
## san bosco 8 0.096 70.842 0.096 70.842
## san carlos 4 0.048 70.890 0.048 70.890
## san cayetano 9 0.108 70.998 0.108 70.998
## san fernando 55 0.661 71.658 0.661 71.658
## san fernando nuevo 10 0.120 71.779 0.120 71.779
## san fernando viejo 18 0.216 71.995 0.216 71.995
## san joaquin 4 0.048 72.043 0.048 72.043
## san joaquín 16 0.192 72.235 0.192 72.235
## san juan bosco 7 0.084 72.319 0.084 72.319
## san judas 1 0.012 72.331 0.012 72.331
## san judas tadeo 2 0.024 72.355 0.024 72.355
## san luis 2 0.024 72.379 0.024 72.379
## san luís 1 0.012 72.391 0.012 72.391
## san nicolas 1 0.012 72.403 0.012 72.403
## san nicolás 1 0.012 72.415 0.012 72.415
## san pedro 3 0.036 72.451 0.036 72.451
## san vicente 48 0.576 73.028 0.576 73.028
## santa 1 0.012 73.040 0.012 73.040
## santa anita 50 0.600 73.640 0.600 73.640
## santa anita sur 1 0.012 73.652 0.012 73.652
## santa bárbara 3 0.036 73.688 0.036 73.688
## santa elena 10 0.120 73.808 0.120 73.808
## santa fe 8 0.096 73.904 0.096 73.904
## santa helena de 1 0.012 73.916 0.012 73.916
## santa isabel 64 0.769 74.685 0.769 74.685
## santa monica 52 0.624 75.309 0.624 75.309
## santa mónica 3 0.036 75.345 0.036 75.345
## santa mónica alta 1 0.012 75.357 0.012 75.357
## santa monica norte 2 0.024 75.381 0.024 75.381
## santa monica popular 2 0.024 75.405 0.024 75.405
## santa mónica popular 7 0.084 75.489 0.084 75.489
## santa monica residencial 5 0.060 75.549 0.060 75.549
## santa mónica residencial 39 0.468 76.018 0.468 76.018
## santa rita 46 0.552 76.570 0.552 76.570
## santa rosa 1 0.012 76.582 0.012 76.582
## santa teresita 263 3.158 79.741 3.158 79.741
## santafe 1 0.012 79.753 0.012 79.753
## santander 1 0.012 79.765 0.012 79.765
## santo domingo 6 0.072 79.837 0.072 79.837
## sector aguacatal 1 0.012 79.849 0.012 79.849
## sector cañaveralejo guadalupe 2 0.024 79.873 0.024 79.873
## seminario 32 0.384 80.257 0.384 80.257
## sierras de normandía 1 0.012 80.269 0.012 80.269
## siete de agosto 8 0.096 80.365 0.096 80.365
## simón bolivar 1 0.012 80.377 0.012 80.377
## tejares cristales 4 0.048 80.425 0.048 80.425
## tejares de san 14 0.168 80.593 0.168 80.593
## templete 4 0.048 80.641 0.048 80.641
## tequendama 44 0.528 81.170 0.528 81.170
## tequendema 1 0.012 81.182 0.012 81.182
## terrón colorado 1 0.012 81.194 0.012 81.194
## torres de comfandi 57 0.685 81.878 0.685 81.878
## unicentro cali 1 0.012 81.890 0.012 81.890
## unión de vivienda 3 0.036 81.926 0.036 81.926
## urbanización barranquilla 4 0.048 81.974 0.048 81.974
## urbanización boyacá 1 0.012 81.986 0.012 81.986
## urbanización colseguros 3 0.036 82.022 0.036 82.022
## urbanizacion el saman 1 0.012 82.034 0.012 82.034
## urbanizacion gratamira 1 0.012 82.046 0.012 82.046
## urbanización la flora 83 0.997 83.043 0.997 83.043
## urbanización la merced 4 0.048 83.091 0.048 83.091
## urbanización la nueva 4 0.048 83.139 0.048 83.139
## urbanización las cascadas 1 0.012 83.151 0.012 83.151
## urbanizacion lili 2 0.024 83.175 0.024 83.175
## urbanización nueva granada 3 0.036 83.211 0.036 83.211
## urbanización pacara 1 0.012 83.223 0.012 83.223
## urbanización río lili 5 0.060 83.283 0.060 83.283
## urbanización san joaquin 4 0.048 83.331 0.048 83.331
## urbanización tequendama 7 0.084 83.415 0.084 83.415
## valle de lili 1 0.012 83.427 0.012 83.427
## valle del lili 1009 12.117 95.545 12.117 95.545
## valle grande 1 0.012 95.557 0.012 95.557
## versalles 71 0.853 96.409 0.853 96.409
## villa colombia 6 0.072 96.481 0.072 96.481
## villa de veracruz 6 0.072 96.553 0.072 96.553
## villa del lago 10 0.120 96.673 0.120 96.673
## villa del parque 1 0.012 96.685 0.012 96.685
## villa del prado 52 0.624 97.310 0.624 97.310
## villa del sol 25 0.300 97.610 0.300 97.610
## villa del sur 5 0.060 97.670 0.060 97.670
## villas de veracruz 9 0.108 97.778 0.108 97.778
## vipasa 32 0.384 98.163 0.384 98.163
## zona centro 1 0.012 98.175 0.012 98.175
## zona norte 32 0.384 98.559 0.384 98.559
## zona norte los 1 0.012 98.571 0.012 98.571
## zona oeste 26 0.312 98.883 0.312 98.883
## zona oriente 18 0.216 99.099 0.216 99.099
## zona residencial 1 0.012 99.111 0.012 99.111
## zona sur 74 0.889 100.000 0.889 100.000
## <NA> 0 0.000 100.000
## Total 8327 100.000 100.000 100.000 100.000
El precio promedio de las viviendas es 434.24 millones, sin embargo tienen una gran varianza de 329.02 millones y tienen un sesgo a la derecha, donde el 75% de las viviendas cuestan menos de 540 millones, pero hay una gran cantidad de valores extremos de viviendas muy costosas que llegan hasta 1.999 millones.
El área promedio de las viviendas es 174.99 metros cuadrados, sin embargo tienen una gran varianza de 142.95 metros cuadrados y tiene un sesgo a la derecha muy pronunciado, donde el 75% de las viviendas tiene menos de 249 metros cuadrados y los datos están muy agrupados en esa región, hay algunos valores extremos de hasta 1.745 metros cuadrados pero son outliers.
Para el número de pisos, un 40% de viviendas tiene menos de 3 pisos, con el número más frecuente siendo 2 pisos con 1.450 viviendas:
## Frequencies
## vivienda_faltantesSinNA$piso
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 1 861 15.13 15.13 10.34 10.34
## 2 1450 25.49 40.62 17.41 27.75
## 3 1097 19.28 59.91 13.17 40.93
## 4 607 10.67 70.57 7.29 48.22
## 5 568 9.98 80.56 6.82 55.04
## 6 245 4.31 84.87 2.94 57.98
## 7 207 3.64 88.50 2.49 60.47
## 8 211 3.71 92.21 2.53 63.00
## 9 146 2.57 94.78 1.75 64.75
## 10 130 2.29 97.06 1.56 66.31
## 11 84 1.48 98.54 1.01 67.32
## 12 83 1.46 100.00 1.00 68.32
## <NA> 2638 31.68 100.00
## Total 8327 100.00 100.00 100.00 100.00
Para el estrato de las viviendas, el más frecuente es el 5, que representa un 33% del total de viviendas:
## Frequencies
## vivienda_faltantesSinNA$estrato
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 3 1453 17.45 17.45 17.45 17.45
## 4 2131 25.59 43.04 25.59 43.04
## 5 2751 33.04 76.08 33.04 76.08
## 6 1992 23.92 100.00 23.92 100.00
## <NA> 0 0.00 100.00
## Total 8327 100.00 100.00 100.00 100.00
Para el número de parqueaderos en las viviendas, un 37% tiene un solo parqueadero y un 29% tiene dos y el número de reduce de forma drástica luego de 4 parqueaderos:
## Frequencies
## vivienda_faltantesSinNA$parquea
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 1603 19.251 19.251 19.251 19.251
## 1 3156 37.901 57.151 37.901 57.151
## 2 2478 29.759 86.910 29.759 86.910
## 3 521 6.257 93.167 6.257 93.167
## 4 386 4.636 97.802 4.636 97.802
## 5 68 0.817 98.619 0.817 98.619
## 6 68 0.817 99.436 0.817 99.436
## 7 18 0.216 99.652 0.216 99.652
## 8 17 0.204 99.856 0.204 99.856
## 9 4 0.048 99.904 0.048 99.904
## 10 8 0.096 100.000 0.096 100.000
## <NA> 0 0.000 100.000
## Total 8327 100.000 100.000 100.000 100.000
Para el número de baños en las viviendas, un 35% tiene dos baños, y el número se reduce paulatinamente hasta 5 donde solamente un 3% tiene más baños:
## Frequencies
## vivienda_faltantesSinNA$banios
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 45 0.54 0.54 0.54 0.54
## 1 497 5.97 6.51 5.97 6.51
## 2 2946 35.38 41.89 35.38 41.89
## 3 1994 23.95 65.83 23.95 65.83
## 4 1460 17.53 83.37 17.53 83.37
## 5 891 10.70 94.07 10.70 94.07
## 6 315 3.78 97.85 3.78 97.85
## 7 107 1.28 99.14 1.28 99.14
## 8 48 0.58 99.71 0.58 99.71
## 9 15 0.18 99.89 0.18 99.89
## 10 9 0.11 100.00 0.11 100.00
## <NA> 0 0.00 100.00
## Total 8327 100.00 100.00 100.00 100.00
Para el número de habitaciones en las viviendas, casi un 50% tiene 3 habitaciones, siendo este el número más común:
## Frequencies
## vivienda_faltantesSinNA$habitac
## Type: Numeric
##
## Freq % Valid % Valid Cum. % Total % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
## 0 66 0.79 0.79 0.79 0.79
## 1 59 0.71 1.50 0.71 1.50
## 2 927 11.13 12.63 11.13 12.63
## 3 4101 49.25 61.88 49.25 61.88
## 4 1731 20.79 82.67 20.79 82.67
## 5 680 8.17 90.84 8.17 90.84
## 6 318 3.82 94.66 3.82 94.66
## 7 173 2.08 96.73 2.08 96.73
## 8 138 1.66 98.39 1.66 98.39
## 9 83 1.00 99.39 1.00 99.39
## 10 51 0.61 100.00 0.61 100.00
## <NA> 0 0.00 100.00
## Total 8327 100.00 100.00 100.00 100.00
El precio promedio de las viviendas es muy similar para la zona Centro, Norte y Oriente, con una distribución muy similar. Sin embargo, la zona Sur y Oeste presentan un precio promedio más elevado, siendo la zona Oeste la que tiene el mayor precio promedio con 426.52 millones:
El precio promedio para las casas es mayor que para los apartamentos, ubicandose en 537.72 millones, muy cerca al tercer cuartil del precio de los apartamentos:
Finalmente, al comprar el precio con el estrato, sigue un patrón esperable donde el precio aumenta con cada estrato, siendo el estrato 6 el que presenta el mayor salto con respecto al precio promedio que en este caso es 800.91 millones. Es de resaltar que el valor mínimo para todos los estratos es bastante similar y que hay valores extremos elevados en cada caso:
El análisis de correlación muestra que la variable con un mayor poder explicativo del precio es el área, con un coeficiente r de 0.69, seguida del número de baños con 0.67 y el número de parqueaderos con 0.64:
Adicionalmente, es posible ver que a pesar de tener una alta correlación, el precio tiene una alta dispersión en todas las variables, implicando que el precio es multifactorial y no se puede explicar con una sola variable.
La variedad de viviendas en cali es bastante grande y hay una dispersión en todas las variables, sin embargo es posible encontrar algunas características en común que le permitan a B&C generar estrategias de marketing valiosas para mejorar sus ventas, por ejemplo es posible utilizar el hecho de que viviendas con similares carcterísticas tengan precios variables como una oportunidad de que cualquier persona pueda acceder a viviendas de calidad sin importar su presupuesto. Adicionalmente, las viviendas menos frecuentes como las casas grandes en estrato 6, pueden ser ofrecidas a personas de altos ingresos usando su exclusividad como un punto de venta estratégico.
Finalmente, para futuros análisis sería útil explorar algunos valores extremos que presentan comportamientos particulares, por ejemplos viviendas muy costosas que tienen un área pequeña, que podrían estar ubicadas en sectores exclusivos de la ciudad y podrían ser un nicho de mercado útil.
Dada la amplia variedad de vivienda ofertada en Cali, la empresa B&C puede enfocarse en las viviendas con una menor área, que aunque tienen un menor precio ofrecen un gran volumen, en especial los apartamentos que a día de hoy son más del 60% de las viviendas. Adicionalmente, el esfuerzo debería concentrarse en la zona Oeste, que tiene un precio promedio mayor y un volumen considerable y puede generar más réditos en el largo plazo.
Finalmente, estos resultados le van a permitir a la empresa ofrecer servicios personalizados a sus clientes, preguntando algunas variables de interés es posible ubicar una vivienda en el rango del precio del comprador o darle estimaciones generales a los clientes del estado del mercado para que puedan tomar una decisión informada.