Informe descriptivo

Introducción

El presente trabajo tiene como objetivo desarrollar un estudio descriptivo de las estadísticas del sector inmobiliario de Cali con el objetivo de ofrecer una visión clara y profunda de las principales tendencias que tiene este nicho de mercado y a partir de ello facilitar a la inmobiliaria B&C tomar decisiones que le permitan posicionar las estrategias de marketing y de negocio. A partir de ello, se pretende mostrar la importancia de las estadística en los modelos de negocio y cómo se puede aprovechar esta ciencia para aplicaciones de la vida real

Objetivos

Objetivo General

Realizar un estudio descriptivo del mercado inmobiliario en la ciudad de Cali para ayudar a la toma decisiones de la empresa B&C

Objetivos Específicos

1. Realizar una limpieza de la base datos

2. Realizar un análisis descriptivo de las variables de interés

3. Desarrollar algunos análisis bivariados

Métodos

Para la realización del presente estudio, se procede a analizar la base de datos “PaqueteMET” suministrado por el curso de la maestría. A partir de ello, se utilizó el programa R para la limpieza, análisis e imputación de datos. Para ello, se empieza a desarrollar un proceso analítico que permita analizar la naturaleza de los datos para identificar datos fsaltantes, variables de interés, comportamiento de las principales estadísticas descriptivas. Posterior a ello, se procedió a determinar qué variables se van a realizar para el análisis univariado considerando los procedimientos previos de imputación de datos y los objetivos de la empresa B&C. Finalmente, se realiza un análisis bivariado de los principales datos

Resultados y discusión

En la primera parte del estudio estadístico, se procede a realizar el análisis inicial de la base de datos. Para ello, se procede a un reconocimiento previo de la base de datos y a partir de ello, se identifica los datos faltantes dentro de la base de datos. Para ello, se utilizaron las herramientas del paquete “dplyr” que permite eliminar los datos faltantes. En ese orden de ideas, se procedió a eliminar las variables parqueadero y piso porque existen una gran cantidad de registros faltantes en dichas variables, a partir de ello, no es factibe realizar una imputación de datos de las mismas porque al tratar de reemplazar los datos faltantes con la media o con cero se genera una variación importante en los estadísticos que no permite ofrecer una fiabilidad de los datos. De igual manera, se realizó el procedimiento para limpiar base de datos y reemplazar los encabezados que estaban repetidos para tener una base de datos limpia.

Así, el procedimiento utilizado para limpiar la base de datos y realizar el análisis descriptivo fue el siguiente:

##        id           zona                piso           estrato     
##  Min.   :   1   Length:8330        Min.   : 1.000   Min.   :3.000  
##  1st Qu.:2082   Class :character   1st Qu.: 2.000   1st Qu.:4.000  
##  Median :4164   Mode  :character   Median : 3.000   Median :5.000  
##  Mean   :4164                      Mean   : 3.772   Mean   :4.634  
##  3rd Qu.:6246                      3rd Qu.: 5.000   3rd Qu.:5.000  
##  Max.   :8319                      Max.   :12.000   Max.   :6.000  
##  NA's   :3                         NA's   :2641     NA's   :3      
##     preciom         areaconst       parquea           banios      
##  Min.   :  58.0   Min.   :  30   Min.   : 1.000   Min.   : 0.000  
##  1st Qu.: 220.0   1st Qu.:  80   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median : 330.0   Median : 123   Median : 2.000   Median : 3.000  
##  Mean   : 434.2   Mean   : 175   Mean   : 1.836   Mean   : 3.112  
##  3rd Qu.: 540.0   3rd Qu.: 229   3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :1999.0   Max.   :1745   Max.   :10.000   Max.   :10.000  
##  NA's   :2        NA's   :3      NA's   :1606     NA's   :3       
##     habitac           tipo              barrio             longitud        
##  Min.   : 0.000   Length:8330        Length:8330        Min.   :-76576.00  
##  1st Qu.: 3.000   Class :character   Class :character   1st Qu.:-76506.00  
##  Median : 3.000   Mode  :character   Mode  :character   Median :   -76.54  
##  Mean   : 3.605                                         Mean   :-21845.13  
##  3rd Qu.: 4.000                                         3rd Qu.:   -76.52  
##  Max.   :10.000                                         Max.   :   -76.46  
##  NA's   :3                                              NA's   :3          
##     latitud        
##  Min.   :   3.333  
##  1st Qu.:   3.390  
##  Median :   3.450  
##  Mean   : 970.370  
##  3rd Qu.:3367.000  
##  Max.   :3497.000  
##  NA's   :3
## spc_tbl_ [8,330 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id       : num [1:8330] 122 190 880 1663 1401 ...
##  $ zona     : chr [1:8330] "Zona Norte" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
##  $ piso     : num [1:8330] 1 4 1 NA NA 1 7 NA 2 4 ...
##  $ estrato  : num [1:8330] 3 3 3 4 4 5 5 3 5 3 ...
##  $ preciom  : num [1:8330] 150 360 250 375 150 270 290 235 450 125 ...
##  $ areaconst: num [1:8330] 93 420 210 74 57 75 93 122 252 72 ...
##  $ parquea  : num [1:8330] NA 1 NA 1 NA 1 1 1 2 NA ...
##  $ banios   : num [1:8330] 1 6 4 5 2 2 3 2 2 2 ...
##  $ habitac  : num [1:8330] 4 9 4 5 3 3 3 5 7 3 ...
##  $ tipo     : chr [1:8330] "Casa" "Casa" "Apartamento" "Casa" ...
##  $ barrio   : chr [1:8330] "la rivera" "las ceibas" "morichal de comfandi" "calicanto viii" ...
##  $ longitud : num [1:8330] -76.5 -76.5 -76.5 -76517 -76.5 ...
##  $ latitud  : num [1:8330] 3.48 3.46 3.4 3373 3.38 ...
##  - attr(*, "spec")=List of 3
##   ..$ cols   :List of 13
##   .. ..$ id       : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ zona     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ piso     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ estrato  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ preciom  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ areaconst: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ parquea  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ banios   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ habitac  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ tipo     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ barrio   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ longitud : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ latitud  : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   ..$ default: list()
##   .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
##   ..$ delim  : chr ","
##   ..- attr(*, "class")= chr "col_spec"
##  - attr(*, "problems")=<externalptr>
##        id      zona      piso   estrato   preciom areaconst   parquea    banios 
##         3         3      2641         3         2         3      1606         3 
##   habitac      tipo    barrio  longitud   latitud 
##         3         3         3         3         3

##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

## 
## apartamento        casa 
##        3186        1626
## 
##    3    4    5    6 
##  434 1213 1860 1305
## 
##    0    1    2    3    4    5    6    7    8    9   10 
##   17   35  477 2461 1092  372  163   81   45   44   25
## 
##  100 1000 1015  105 1050 1051  106 1077 1078  108 1080  109 1090  110 1100 1103 
##    3   15    1    5   10    1    1    1    1    2    1    1    2    9   32    1 
## 1106  111  112 1125  113 1130 1133  114 1149  115 1150 1160 1170  118 1180  119 
##    1    1    1    1    7    1    1    1    1   16   18    2    1    4    2    1 
## 1190 1195  120 1200  121  122 1220 1226  123  124 1240  125 1250  126  127 1270 
##    1    2   24   46    1    4    2    1    1    1    1   24   25    2    1    2 
##  128 1280  129  130 1300  132 1320  133 1330  135 1350  136 1360  137 1370  138 
##    6    5    1   21   24    4    1    2    1   27   13    2    1    1    2    5 
## 1380 1385  139 1390 1398  140 1400  142 1440  145 1450  147  148 1480  149  150 
##    2    1    2    1    1   32   29    2    1   23    9    2    6    2    1   41 
## 1500  151  152  153 1530  155 1550  156 1561  157  158 1580 1584  159 1590  160 
##   15    2    9    1    1   27    8    1    1    4    6    1    1    4    1   35 
## 1600  161  162  163  164  165 1650  167  168 1680  169  170 1700  171  173  175 
##   20    1    2    4    2   32    3    1    7    2    1   25   15    1    2   29 
## 1750  177  178  179  180 1800  182  183 1830  184  185 1850  188  189  190 1900 
##    4    1    7    2   38   13    2    1    1    1   28    7    3    1   38    4 
##  192  193  195 1950  196  197  198  199 1999  200  201  202  203  204  205  206 
##    3    1   26    1    2    2    6    3    1   47    2    1    1    2    8    2 
##  208  209  210  211  213  214  215  216  218  219  220  221  222  223  224  225 
##    4    1   47    1    1    1   39    1    2    1   78    1    6    1    2   44 
##  226  227  228  229  230  231  232  233  234  235  236  237  238  239  240  242 
##    3    2    4    4   73    1    1    1    1   48    5    2    5    1   81    3 
##  243  245  246  248  249  250  251  252  253  255  256  257  258  259  260  262 
##    2   42    1    4    2  102    1    1    3   29    1    1    4    5   83    1 
##  265  266  267  268  269  270  272  275  276  277  278  279  280  283  285  286 
##   18    1    1    5    1   62    1   31    2    1    1    4   62    2   38    1 
##  287  288  289  290  295  296  297  298  299  300  304  305  306  307  308  309 
##    1    3    1   76   41    1    1    9    6   98    1   13    2    1    2    2 
##  310  314  315  318  319  320  321  325  327  328  329  330  332  334  335  337 
##   52    1   32    4    1   81    2   22    1    3    1   65    1    2   19    1 
##  338  340  341  342  344  345  347  349  350  352  353  354  355  356  357  358 
##    3   57    1    1    2   13    2    1  124    1    1    1   21    1    1    2 
##  360  362  365  367  368  369  370  371  372  375  377  378  380  383  385  387 
##   73    2   18    1    1    1   52    1    1   13    2    1   53    1   18    2 
##  388  390  392  393  395  397  398  400  403  404  405  410  415  416  419  420 
##    3   42    1    2   20    2    3   61    1    1    7   31   13    1    1   60 
##  423  424  425  428  429  430  432  433  435  438  439  440  445  449  450  455 
##    1    1   14    1    1   59    1    1    7    2    1   26    5    3  109    3 
##  460  461  465  468  470  475  480  485  488  490  494  495  496  498  499  500 
##   19    1    6    2   28   13   43    7    1   15    2    9    1    1    1   45 
##  505  508  510  513  515  520  525  530  535  540  545  548  550  555  560  565 
##    5    1    9    1    6   32    8   37    3   11    2    2   70    1   20    4 
##  569  570  575   58  580  585  590  591  594  595  598  599  600  603  605  610 
##    1   19    3    1   35    3   22    1    1    6    1    3   58    1    1    7 
##  615  620  621  625  630  635  640  643  645  648  650  651  655  660  667  670 
##    1   21    3    1   21    2   11    1    2    1   75    1    3   16    1    6 
##  673  677  679  680  685  690  695  697  699  700  701  704  710  720  725  730 
##    2    1    1   30    1   26    6    2    1   40    1    1    3   17    2    9 
##  732  735  736  740  745   75  750  754  760  765  767  770  775   78  780  785 
##    1    1    1    2    1    1   43    1    7    1    1    4    1    2   29    1 
##  790  792  795  800  810  820  825  830  832  833  835  836  840  845  849   85 
##    9    1    4   20    3    5    2    5    1    1    1    1    4    1    1    2 
##  850  852  860  865  870   88  880  887   89  890  895   90  900  910  920  923 
##   58    1    2    1    9    1   11    1    1    6    2    3   27    6    4    1 
##  930  938  940   95  950   96  960   97  970  975   98  980  985   99  990  998 
##    6    1    2    4   31    2    5    1    1    2    4   16    1    1    6    2
## 
##  Zona Centro   Zona Norte   Zona Oeste Zona Oriente     Zona Sur 
##           36          887          756           97         3036

Al observar las gráficas anteriores podemos encontrar que los apartamentos son los tipos de vivienda más demandados por las personas en el sector inmobiliario de Cali. De igual manera, se debe reconocer que las casas tienen una participación de cerca de 1.500 unidades en la base de datos.

Por otro lado, se debe reconocer que al indagar sobre los principales estratos donde se comercializan las principales viviendas en el sector inmobiliario de Cali, se evidenció que el estrato 5 era el principal sector. En efecto, es importante reconocer que la mayor parte de los datos están en los estratos altos, es decir de 4 a 6, razón por la cual una estrategia efectiva por parte de la inmobiliaria B&C sería enfocar sus estrategias de marketing en los sectores más altos donde la empresa puede tener un mercado potencial muy grande al considerar los resultados del presente análisis descriptivo.

De igual manera, al realizar un análisis sobre datos atipicos de algunas de las variables de interés se logró evidenciar que en al realizar el diagrama de cajas comparando la zona con el área se evidencia que la zona centro no presenta datos atipicos, mientras que en la zona sur y norte es donde se presenta mayor varianza de los datos en referencia con el área construida. De igual manera, al realizar un análisis sobre el área construida y el estrato se evidencian datos atipicos en todos el estratos, sin embargo, se evidencia una mayor varianza de los datos. La naturaleza de estos datos, implica que se debe realizar un análisis con mayor profunidad para comprender cuál es el origen de dichos datos

Análisis bivariado

Luego de realizar el análisis descriptivo, se procedió a realizar un análisis bivariado para identificar algunas relaciones entre las principales variables de análisis con el objetivo de encontrar algunas relaciones importantes que permitan identificar algunas correlaciones importantes. A partir de ello, se pretende apoyar el análisis exploratorio descrito previamente

Al realizar el análisis de las gráficas bivariadas se logró evidenciar que el tipo de vivienda más demandado en el sector inmobiliario de Cali son los apartamentos. Esta tendencia se logra evidenciar en todos los estratos analizados (del 3 al 6). Por otro lado, al realizar un análisis por el tipo de hogar en relación con las zonas de Cali, se evidencia nuevamente una tendencia al uso de los apartamentos. Sin embargo, se debe reconocer que en la zona oriente se evidencia que la población prefiere las casas y el la zona sur de evidencia un mayor preferencia a casas en comparación con otras zonas. Los resultados de estas relaciones bivariadas permiten dar una idea para que la empresa B&C realice estrategia para le venta de inmuebles de acuerdo a las preferencia de los hogares por zona y estrato.

Finalmente, en la gráfica de dispersión se compara el precio en relación con el área construida donde se evidencia que a mayor área construida se incrementa el precio, este dato permit establecer estrategias de nmarketing y ventas

Conclusiones

El análisis descriptivo permitió establecer que la empresa B&C debe enfocar las estrategias de marketing principalmente en los estratos más altos de la ciudad de Cali (5 y 6). Así mismo, se logra evidenciar que en la ciudad existe una preferencia mayoritaria por el uso de los apartamentos, sin embargo, las preferencias para la compra de los bienes inmuebles de la ciudad varían de acuerdo a la zona de la ciudad, es decir, que en la zona oriente y sur se logra evidenciar una preferencia por casas. Finalmente, se debe reconocer que el precio de venta de los inmuebles varian de acuerdo al área construida