Informe descriptivo
Introducción
El presente trabajo tiene como objetivo desarrollar un estudio descriptivo de las estadísticas del sector inmobiliario de Cali con el objetivo de ofrecer una visión clara y profunda de las principales tendencias que tiene este nicho de mercado y a partir de ello facilitar a la inmobiliaria B&C tomar decisiones que le permitan posicionar las estrategias de marketing y de negocio. A partir de ello, se pretende mostrar la importancia de las estadística en los modelos de negocio y cómo se puede aprovechar esta ciencia para aplicaciones de la vida real
Objetivos
Objetivo General
Realizar un estudio descriptivo del mercado inmobiliario en la ciudad de Cali para ayudar a la toma decisiones de la empresa B&C
Objetivos Específicos
1. Realizar una limpieza de la base datos
2. Realizar un análisis descriptivo de las variables de interés
3. Desarrollar algunos análisis bivariados
Métodos
Para la realización del presente estudio, se procede a analizar la base de datos “PaqueteMET” suministrado por el curso de la maestría. A partir de ello, se utilizó el programa R para la limpieza, análisis e imputación de datos. Para ello, se empieza a desarrollar un proceso analítico que permita analizar la naturaleza de los datos para identificar datos fsaltantes, variables de interés, comportamiento de las principales estadísticas descriptivas. Posterior a ello, se procedió a determinar qué variables se van a realizar para el análisis univariado considerando los procedimientos previos de imputación de datos y los objetivos de la empresa B&C. Finalmente, se realiza un análisis bivariado de los principales datos
Resultados y discusión
En la primera parte del estudio estadístico, se procede a realizar el análisis inicial de la base de datos. Para ello, se procede a un reconocimiento previo de la base de datos y a partir de ello, se identifica los datos faltantes dentro de la base de datos. Para ello, se utilizaron las herramientas del paquete “dplyr” que permite eliminar los datos faltantes. En ese orden de ideas, se procedió a eliminar las variables parqueadero y piso porque existen una gran cantidad de registros faltantes en dichas variables, a partir de ello, no es factibe realizar una imputación de datos de las mismas porque al tratar de reemplazar los datos faltantes con la media o con cero se genera una variación importante en los estadísticos que no permite ofrecer una fiabilidad de los datos. De igual manera, se realizó el procedimiento para limpiar base de datos y reemplazar los encabezados que estaban repetidos para tener una base de datos limpia.
Así, el procedimiento utilizado para limpiar la base de datos y realizar el análisis descriptivo fue el siguiente:
## id zona piso estrato
## Min. : 1 Length:8330 Min. : 1.000 Min. :3.000
## 1st Qu.:2082 Class :character 1st Qu.: 2.000 1st Qu.:4.000
## Median :4164 Mode :character Median : 3.000 Median :5.000
## Mean :4164 Mean : 3.772 Mean :4.634
## 3rd Qu.:6246 3rd Qu.: 5.000 3rd Qu.:5.000
## Max. :8319 Max. :12.000 Max. :6.000
## NA's :3 NA's :2641 NA's :3
## preciom areaconst parquea banios
## Min. : 58.0 Min. : 30 Min. : 1.000 Min. : 0.000
## 1st Qu.: 220.0 1st Qu.: 80 1st Qu.: 1.000 1st Qu.: 2.000
## Median : 330.0 Median : 123 Median : 2.000 Median : 3.000
## Mean : 434.2 Mean : 175 Mean : 1.836 Mean : 3.112
## 3rd Qu.: 540.0 3rd Qu.: 229 3rd Qu.: 2.000 3rd Qu.: 4.000
## Max. :1999.0 Max. :1745 Max. :10.000 Max. :10.000
## NA's :2 NA's :3 NA's :1606 NA's :3
## habitac tipo barrio longitud
## Min. : 0.000 Length:8330 Length:8330 Min. :-76576.00
## 1st Qu.: 3.000 Class :character Class :character 1st Qu.:-76506.00
## Median : 3.000 Mode :character Mode :character Median : -76.54
## Mean : 3.605 Mean :-21845.13
## 3rd Qu.: 4.000 3rd Qu.: -76.52
## Max. :10.000 Max. : -76.46
## NA's :3 NA's :3
## latitud
## Min. : 3.333
## 1st Qu.: 3.390
## Median : 3.450
## Mean : 970.370
## 3rd Qu.:3367.000
## Max. :3497.000
## NA's :3
## spc_tbl_ [8,330 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8330] 122 190 880 1663 1401 ...
## $ zona : chr [1:8330] "Zona Norte" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ piso : num [1:8330] 1 4 1 NA NA 1 7 NA 2 4 ...
## $ estrato : num [1:8330] 3 3 3 4 4 5 5 3 5 3 ...
## $ preciom : num [1:8330] 150 360 250 375 150 270 290 235 450 125 ...
## $ areaconst: num [1:8330] 93 420 210 74 57 75 93 122 252 72 ...
## $ parquea : num [1:8330] NA 1 NA 1 NA 1 1 1 2 NA ...
## $ banios : num [1:8330] 1 6 4 5 2 2 3 2 2 2 ...
## $ habitac : num [1:8330] 4 9 4 5 3 3 3 5 7 3 ...
## $ tipo : chr [1:8330] "Casa" "Casa" "Apartamento" "Casa" ...
## $ barrio : chr [1:8330] "la rivera" "las ceibas" "morichal de comfandi" "calicanto viii" ...
## $ longitud : num [1:8330] -76.5 -76.5 -76.5 -76517 -76.5 ...
## $ latitud : num [1:8330] 3.48 3.46 3.4 3373 3.38 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parquea : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitac : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ","
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
## id zona piso estrato preciom areaconst parquea banios
## 3 3 2641 3 2 3 1606 3
## habitac tipo barrio longitud latitud
## 3 3 3 3 3

## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'

##
## apartamento casa
## 3186 1626
##
## 3 4 5 6
## 434 1213 1860 1305
##
## 0 1 2 3 4 5 6 7 8 9 10
## 17 35 477 2461 1092 372 163 81 45 44 25
##
## 100 1000 1015 105 1050 1051 106 1077 1078 108 1080 109 1090 110 1100 1103
## 3 15 1 5 10 1 1 1 1 2 1 1 2 9 32 1
## 1106 111 112 1125 113 1130 1133 114 1149 115 1150 1160 1170 118 1180 119
## 1 1 1 1 7 1 1 1 1 16 18 2 1 4 2 1
## 1190 1195 120 1200 121 122 1220 1226 123 124 1240 125 1250 126 127 1270
## 1 2 24 46 1 4 2 1 1 1 1 24 25 2 1 2
## 128 1280 129 130 1300 132 1320 133 1330 135 1350 136 1360 137 1370 138
## 6 5 1 21 24 4 1 2 1 27 13 2 1 1 2 5
## 1380 1385 139 1390 1398 140 1400 142 1440 145 1450 147 148 1480 149 150
## 2 1 2 1 1 32 29 2 1 23 9 2 6 2 1 41
## 1500 151 152 153 1530 155 1550 156 1561 157 158 1580 1584 159 1590 160
## 15 2 9 1 1 27 8 1 1 4 6 1 1 4 1 35
## 1600 161 162 163 164 165 1650 167 168 1680 169 170 1700 171 173 175
## 20 1 2 4 2 32 3 1 7 2 1 25 15 1 2 29
## 1750 177 178 179 180 1800 182 183 1830 184 185 1850 188 189 190 1900
## 4 1 7 2 38 13 2 1 1 1 28 7 3 1 38 4
## 192 193 195 1950 196 197 198 199 1999 200 201 202 203 204 205 206
## 3 1 26 1 2 2 6 3 1 47 2 1 1 2 8 2
## 208 209 210 211 213 214 215 216 218 219 220 221 222 223 224 225
## 4 1 47 1 1 1 39 1 2 1 78 1 6 1 2 44
## 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 242
## 3 2 4 4 73 1 1 1 1 48 5 2 5 1 81 3
## 243 245 246 248 249 250 251 252 253 255 256 257 258 259 260 262
## 2 42 1 4 2 102 1 1 3 29 1 1 4 5 83 1
## 265 266 267 268 269 270 272 275 276 277 278 279 280 283 285 286
## 18 1 1 5 1 62 1 31 2 1 1 4 62 2 38 1
## 287 288 289 290 295 296 297 298 299 300 304 305 306 307 308 309
## 1 3 1 76 41 1 1 9 6 98 1 13 2 1 2 2
## 310 314 315 318 319 320 321 325 327 328 329 330 332 334 335 337
## 52 1 32 4 1 81 2 22 1 3 1 65 1 2 19 1
## 338 340 341 342 344 345 347 349 350 352 353 354 355 356 357 358
## 3 57 1 1 2 13 2 1 124 1 1 1 21 1 1 2
## 360 362 365 367 368 369 370 371 372 375 377 378 380 383 385 387
## 73 2 18 1 1 1 52 1 1 13 2 1 53 1 18 2
## 388 390 392 393 395 397 398 400 403 404 405 410 415 416 419 420
## 3 42 1 2 20 2 3 61 1 1 7 31 13 1 1 60
## 423 424 425 428 429 430 432 433 435 438 439 440 445 449 450 455
## 1 1 14 1 1 59 1 1 7 2 1 26 5 3 109 3
## 460 461 465 468 470 475 480 485 488 490 494 495 496 498 499 500
## 19 1 6 2 28 13 43 7 1 15 2 9 1 1 1 45
## 505 508 510 513 515 520 525 530 535 540 545 548 550 555 560 565
## 5 1 9 1 6 32 8 37 3 11 2 2 70 1 20 4
## 569 570 575 58 580 585 590 591 594 595 598 599 600 603 605 610
## 1 19 3 1 35 3 22 1 1 6 1 3 58 1 1 7
## 615 620 621 625 630 635 640 643 645 648 650 651 655 660 667 670
## 1 21 3 1 21 2 11 1 2 1 75 1 3 16 1 6
## 673 677 679 680 685 690 695 697 699 700 701 704 710 720 725 730
## 2 1 1 30 1 26 6 2 1 40 1 1 3 17 2 9
## 732 735 736 740 745 75 750 754 760 765 767 770 775 78 780 785
## 1 1 1 2 1 1 43 1 7 1 1 4 1 2 29 1
## 790 792 795 800 810 820 825 830 832 833 835 836 840 845 849 85
## 9 1 4 20 3 5 2 5 1 1 1 1 4 1 1 2
## 850 852 860 865 870 88 880 887 89 890 895 90 900 910 920 923
## 58 1 2 1 9 1 11 1 1 6 2 3 27 6 4 1
## 930 938 940 95 950 96 960 97 970 975 98 980 985 99 990 998
## 6 1 2 4 31 2 5 1 1 2 4 16 1 1 6 2
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 36 887 756 97 3036






Al observar las gráficas anteriores podemos encontrar que los apartamentos son los tipos de vivienda más demandados por las personas en el sector inmobiliario de Cali. De igual manera, se debe reconocer que las casas tienen una participación de cerca de 1.500 unidades en la base de datos.
Por otro lado, se debe reconocer que al indagar sobre los principales estratos donde se comercializan las principales viviendas en el sector inmobiliario de Cali, se evidenció que el estrato 5 era el principal sector. En efecto, es importante reconocer que la mayor parte de los datos están en los estratos altos, es decir de 4 a 6, razón por la cual una estrategia efectiva por parte de la inmobiliaria B&C sería enfocar sus estrategias de marketing en los sectores más altos donde la empresa puede tener un mercado potencial muy grande al considerar los resultados del presente análisis descriptivo.
De igual manera, al realizar un análisis sobre datos atipicos de algunas de las variables de interés se logró evidenciar que en al realizar el diagrama de cajas comparando la zona con el área se evidencia que la zona centro no presenta datos atipicos, mientras que en la zona sur y norte es donde se presenta mayor varianza de los datos en referencia con el área construida. De igual manera, al realizar un análisis sobre el área construida y el estrato se evidencian datos atipicos en todos el estratos, sin embargo, se evidencia una mayor varianza de los datos. La naturaleza de estos datos, implica que se debe realizar un análisis con mayor profunidad para comprender cuál es el origen de dichos datos
Análisis bivariado
Al realizar el análisis de las gráficas bivariadas se logró evidenciar que el tipo de vivienda más demandado en el sector inmobiliario de Cali son los apartamentos. Esta tendencia se logra evidenciar en todos los estratos analizados (del 3 al 6). Por otro lado, al realizar un análisis por el tipo de hogar en relación con las zonas de Cali, se evidencia nuevamente una tendencia al uso de los apartamentos. Sin embargo, se debe reconocer que en la zona oriente se evidencia que la población prefiere las casas y el la zona sur de evidencia un mayor preferencia a casas en comparación con otras zonas. Los resultados de estas relaciones bivariadas permiten dar una idea para que la empresa B&C realice estrategia para le venta de inmuebles de acuerdo a las preferencia de los hogares por zona y estrato.
Finalmente, en la gráfica de dispersión se compara el precio en relación con el área construida donde se evidencia que a mayor área construida se incrementa el precio, este dato permit establecer estrategias de nmarketing y ventas
Conclusiones
El análisis descriptivo permitió establecer que la empresa B&C debe enfocar las estrategias de marketing principalmente en los estratos más altos de la ciudad de Cali (5 y 6). Así mismo, se logra evidenciar que en la ciudad existe una preferencia mayoritaria por el uso de los apartamentos, sin embargo, las preferencias para la compra de los bienes inmuebles de la ciudad varían de acuerdo a la zona de la ciudad, es decir, que en la zona oriente y sur se logra evidenciar una preferencia por casas. Finalmente, se debe reconocer que el precio de venta de los inmuebles varian de acuerdo al área construida