En este informe, analizo el mercado inmobiliario en Cali, Colombia, basándome en los datos proporcionados por la empresa B&C (Bines y Casas). Cali ha experimentado un notable crecimiento en bienes raíces debido al aumento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. Fundada por Sandra Milena hace una década, B&C, compuesta por ocho agentes de bienes raíces, está estratégicamente posicionada para aprovechar las oportunidades de este mercado en constante evolución.
Enfoqué el informe en el análisis descriptivo de datos sobre precios, ubicaciones, características y ventas de viviendas en Cali. El propósito es identificar tendencias y patrones para proporcionar a la empresa B&C una base sólida en la toma de decisiones estratégicas. Espero que este análisis estadístico brinde información valiosa sobre el mercado inmobiliario en Cali, incluyendo precios en diversas zonas, tipos de viviendas más demandadas y características relevantes de la oferta.
Este informe proporciona a la empresa B&C una visión clara y objetiva del mercado inmobiliario en Cali. Esto le permitirá posteriormente definir su nicho de mercado, desarrollar estrategias de marketing efectivas, establecer precios de venta competitivos y ofrecer servicios personalizados que satisfagan las necesidades de sus clientes.
El informe está estructurado siguiendo los siguientes elementos: introducción, objetivos, métodos, resultados, discusión, conclusiones y anexos. Cada sección del informe estará numerada y contendrá un encabezado descriptivo, con el fin de facilitar la comprensión y navegación del documento.
Describir los diferentes tipos de viviendas disponibles en el mercado de Cali, destacando sus principales características como área construida, número de habitaciones, estrato y disponibilidad de parqueaderos.
Categorizar las viviendas según sus características comunes para luego discriminarlas según su precio y seleccionar las mejores ofertas disponibles en el mercado.
Proporcionar a la empresa B&C una visión clara y objetiva del mercado inmobiliario en Cali, con el objetivo de permitir la toma de decisiones estratégicas fundamentadas en una base sólida de información.
## [1] "id" "zona" "piso" "estrato" "preciom" "areaconst"
## [7] "parquea" "banios" "habitac" "tipo" "barrio" "longitud"
## [13] "latitud"
# Calculo el número de variables en el dataframe
num_variables <- ncol(datos)
# Calculo la proporción de variables vavías en cada fila
prop_na_por_fila <- rowSums(is.na(datos)) / num_variables
# Las filas que contienen valores en más de la mitad de variables las conservo
datos_filtrados <- datos[prop_na_por_fila <= 0.5, ]
# Imprimo las dimensiones del dataframe resultante
dim(datos_filtrados)## [1] 8327 13
## [1] "Zona Oeste" "Zona Sur" "Zona Norte" "Zona Oriente" "Zona Centro"
## [1] "Apartamento" "Casa" "APARTAMENTO" "casa" "CASA"
## [6] "apto"
## [1] "arboleda" "normandía"
## [3] "miraflores" "el guabal"
## [5] "bella suiza alta" "bella suiza"
## [7] "valle del lili" "el nacional"
## [9] "santa teresita" "aguacatal"
## [11] "bellavista" "el peñon"
## [13] "la riverita" "miradol del aguacatal"
## [15] "terrón colorado" "mel√©ndez"
## [17] "guadalupe" "cristales"
## [19] "la arboleda" "brisas de guadalupe"
## [21] "el refugio" "altos de guadalupe"
## [23] "seminario" "guadalupe alto"
## [25] "pampalinda" "cuarto de legua"
## [27] "cerros de guadalupe" "normandia"
## [29] "normandía west point" "el gran limonar"
## [31] "la cascada" "puente palma"
## [33] "prados del sur" "nueva tequendama"
## [35] "brisas de los" "urbanización las cascadas"
## [37] "sector cañaveralejo guadalupe" "santa rita"
## [39] "san pedro" "santa isabel"
## [41] "caney" "los cristales"
## [43] "los cristales club" "cerro cristales"
## [45] "caldas" "alto jordán"
## [47] "refugio" "napoles"
## [49] "el lido" "colinas del sur"
## [51] "altos de santa" "acopi"
## [53] "san fernando" "el jordán"
## [55] "pance" "centenario"
## [57] "bosques de alboleda" "bochalema"
## [59] "tejares cristales" "ciudad jardín"
## [61] "tequendama" "san joaquin"
## [63] "urbanización tequendama" "urbanizacion lili"
## [65] "tejares de san" "san fernando viejo"
## [67] "mamellan" "san fernando nuevo"
## [69] "el limonar" "camino real"
## [71] "tequendema" "mayapan las vegas"
## [73] "ciudad meléndez" "alferez real"
## [75] "el ingenio ii" "gran limonar"
## [77] "francisco eladio ramirez" "san cayetano"
## [79] "ciudad real" "capri"
## [81] "parcelaciones pance" "villa del prado"
## [83] "ciudad capri" "el ingenio"
## [85] "san antonio" "las vegas"
## [87] "la campiña" "el bosque"
## [89] "sierras de normandía" "el ingenio i"
## [91] "san vicente" "salomia"
## [93] "eucarístico" "menga"
## [95] "los cámbulos" "la floresta"
## [97] "chipichape" "cambulos"
## [99] "templete" "ciudad jardin"
## [101] "multicentro" "melendez"
## [103] "juanamb√∫" "campestre"
## [105] "santa anita" "los libertadores"
## [107] "los cambulos" "libertadores"
## [109] "departamental" "el cedro"
## [111] "calicanto" "quintas de don"
## [113] "santa mónica residencial" "san nicolas"
## [115] "primero de mayo" "panamericano"
## [117] "junín" "la hacienda"
## [119] "champagnat" "benjamín herrera"
## [121] "alameda" "el troncal"
## [123] "san bosco" "el prado"
## [125] "pacará" "ciudadela pasoancho"
## [127] "nueva floresta" "ingenio i"
## [129] "ciudadela paso ancho" "ciudad córdoba"
## [131] "la merced" "granada"
## [133] "colseguros" "las quintas de"
## [135] "santa mónica" "santa mónica alta"
## [137] "centro" "ed benjamin herrera"
## [139] "santa monica residencial" "san luís"
## [141] "unicentro cali" "el ingenio iii"
## [143] "prados del norte" "pasoancho"
## [145] "bretaña" "villas de veracruz"
## [147] "versalles" "flora industrial"
## [149] "cañasgordas" "bosques del limonar"
## [151] "vipasa" "urbanización la flora"
## [153] "urbanización barranquilla" "santo domingo"
## [155] "santa monica" "santa mónica popular"
## [157] "santa monica norte" "los andes"
## [159] "jorge isaacs" "el jardín"
## [161] "guayaquil" "la flora"
## [163] "colinas del bosque" "ciudad 2000"
## [165] "la buitrera" "berlin"
## [167] "alamos" "santa"
## [169] "santa monica popular" "popular"
## [171] "flora" "ciudad bochalema"
## [173] "urbanización colseguros" "prados del limonar"
## [175] "villa del lago" "urbanización la nueva"
## [177] "La Hacienda" "cataya real"
## [179] "villa del sur" "urbanización san joaquin"
## [181] "el trébol" "Santo Domingo"
## [183] "la portada al" "poblado campestre"
## [185] "las delicias" "las ceibas"
## [187] "jamundi" "jamundi alfaguara"
## [189] "colseguros andes" "calipso"
## [191] "villa de veracruz" "torres de comfandi"
## [193] "puente del comercio" "paso del comercio"
## [195] "oasis de pasoancho" "Los Guaduales"
## [197] "los alcazares" "las vegas de"
## [199] "el dorado" "ciudadela melendez"
## [201] "ciudad pacifica" "Ciudad Pacifica"
## [203] "Bueno Madrid" "alcazares"
## [205] "hacienda alferez real" "ciudad antejardin"
## [207] "las camelias" "colinas de menga"
## [209] "altos de menga" "las granjas"
## [211] "santa elena" "palmas del ingenio"
## [213] "junin" "la independencia"
## [215] "cristóbal colón" "aranjuez"
## [217] "santa rosa" "samanes"
## [219] "samanes de guadalupe" "los guaduales"
## [221] "los alcázares" "laflora"
## [223] "ingenio" "cañaverales"
## [225] "Brisas De Los" "alborada"
## [227] "san judas" "cañaverales los samanes"
## [229] "ciudadela comfandi" "santa helena de"
## [231] "caney especial" "aguablanca"
## [233] "la alborada" "urbanización boyacá"
## [235] "las américas" "la morada"
## [237] "urbanización la merced" "simón bolivar"
## [239] "porvenir" "calicanto viii"
## [241] "Cali" "ciudad modelo"
## [243] "valle de lili" "prados de oriente"
## [245] "la fortaleza" "ciudad córdoba reservado"
## [247] "rincon de la" "san carlos"
## [249] "rafael uribe uribe" "ciudad los alamos"
## [251] "centelsa" "manzanares"
## [253] "las acacias" "la esmeralda"
## [255] "Santa Anita" "unión de vivienda"
## [257] "santa fe" "chapinero"
## [259] "belalcazar" "atanasio girardot"
## [261] "rincón de salomia" "riveras del valle"
## [263] "ciudad del campo" "alameda del rio"
## [265] "ciudad cordoba" "conjunto gibraltar"
## [267] "la selva" "villa colombia"
## [269] "los parques barranquilla" "fuentes de la"
## [271] "ciudad universitaria" "portales de comfandi"
## [273] "pacara" "metropolitano del norte"
## [275] "villa del sol" "calima"
## [277] "los robles" "guaduales"
## [279] "floralia" "chiminangos"
## [281] "la base" "base aérea"
## [283] "oasis de comfandi" "la villa del"
## [285] "portada de comfandi" "urbanizacion el saman"
## [287] "lares de comfenalco" "chiminangos 2 etapa"
## [289] "santa bárbara" "parque residencial el"
## [291] "chiminangos 1 etapa" "bloques del limonar"
## [293] "siete de agosto" "la nueva base"
## [295] "la rivera ii" "la rivera"
## [297] "ceibas" "la rivera i"
## [299] "quintas de salomia" "la ceibas"
## [301] "jorge eliecer gaitán" "alfonso lópez i"
## [303] "comfenalco" "ciudad country"
## [305] "Colseguros Andes" "marroquín iii"
## [307] "ciudadela del río" "zona oeste"
## [309] "ciudad talanga" "zona sur"
## [311] "jose manuel marroquín" "nápoles"
## [313] "alfonso lópez" "zona oriente"
## [315] "zona norte" "alfonso lopez"
## [317] "gaitan" "calimio norte"
## [319] "urbanización pacara" "barrio 7de agosto"
## [321] "calibella" "brisas del guabito"
## [323] "el guabito" "arboledas"
## [325] "los guayacanes" "ciudad los álamos"
## [327] "primitivo crespo" "fonaviemcali"
## [329] "Villa Del Prado" "san luis"
## [331] "Prados Del Norte" "la riviera"
## [333] "nueva base" "Chiminangos"
## [335] "norte" "paseo de los"
## [337] "barranquilla" "villa del parque"
## [339] "zona residencial" "La Flora"
## [341] "Villas De Veracruz" "los alamos"
## [343] "la alianza" "pampa linda"
## [345] "zona norte los" "alameda del río"
## [347] "el vallado" "fenalco kennedy"
## [349] "el paraíso" "evaristo garcía"
## [351] "san juan bosco" "el sena"
## [353] "cañaveralejo" "el caney"
## [355] "antonio nariño" "Santafe"
## [357] "belisario caicedo" "el diamante"
## [359] "morichal de comfandi" "el rodeo"
## [361] "barrio tranquilo y" "sameco"
## [363] "la gran colombia" "municipal"
## [365] "primavera" "fepicol"
## [367] "la primavera" "20 de julio"
## [369] "santander" "saavedra galindo"
## [371] "rep√∫blica de israel" "cali bella"
## [373] "bolivariano" "urbanización río lili"
## [375] "Valle Del Lili" "brisas del limonar"
## [377] "barrio el recuerdo" "agua blanca"
## [379] "san joaquín" "boyacá"
## [381] "mariano ramos" "zona centro"
## [383] "cali canto" "Ciudad 2000"
## [385] "San Fernando" "arboleda campestre candelaria"
## [387] "barrio obrero" "Belalcazar"
## [389] "cristobal colón" "la libertad"
## [391] "san judas tadeo" "colon"
## [393] "El Caney" "valle grande"
## [395] "san nicolás" "el ingenio 3"
## [397] "norte la flora" "ciudad jardin pance"
## [399] "ponce" "Ciudad Jardín"
## [401] "urbanizacion gratamira" "Prados Del Limonar"
## [403] "El Bosque" "ingenio ii"
## [405] "El Ingenio" "Santa Monica"
## [407] "buenos aires" "cascajal"
## [409] "Pance" "Quintas De Don"
## [411] "la reforma" "compartir"
## [413] "autopista sur" "sector aguacatal"
## [415] "el castillo" "occidente"
## [417] "juanambu" "santa anita sur"
## [419] "alf√©rez real" "barrio eucarístico"
## [421] "Centenario" "rozo la torre"
## [423] "los jockeys" "3 de julio"
## [425] "farrallones de pance" "Camino Real"
## [427] "la playa" "Miraflores"
## [429] "ciudad melendez" "lourdes"
## [431] "urbanización nueva granada" "Santa Isabel"
## [433] "los farallones" "bajo aguacatal"
## [435] "Santa Teresita" "la luisa"
# Convierto todas las entradas de la variable 'tipo' a minúsculas
datos$tipo <- tolower(datos$tipo)
# Reemplazo "casa" y "CASA" por "Casa"
datos$tipo <- gsub("\\b(casa)\\b", "Casa", datos$tipo)
# Reemplazo "apto" y "APARTAMENTO" por "Apartamento"
datos$tipo <- gsub("\\b(apto|apartamento)\\b", "Apartamento", datos$tipo)## [1] "Apartamento" "Casa"
# Calculo el número de valores NA por columna
valores_na_por_columna <- colSums(is.na(datos))
# Obtengo el nombre de las columnas con valores NA
columnas_con_na <- names(valores_na_por_columna[valores_na_por_columna > 0])
# Imprimo las columnas con valores NA
print(columnas_con_na)## [1] "piso" "parquea"
# Filtro datos por tipo de vivienda
casas <- datos %>% filter(tipo == "Casa")
apartamentos <- datos %>% filter(tipo == "Apartamento")
# Calculo estadísticas descriptivas para casas
summary_casas <- summary(casas[c("areaconst", "habitac", "estrato", "parquea")])
median_casas <- sapply(casas[c("areaconst", "habitac", "estrato", "parquea")], median)
# Calculo estadísticas descriptivas para apartamentos
summary_apartamentos <- summary(apartamentos[c("areaconst", "habitac", "estrato", "parquea")])
median_apartamentos <- sapply(apartamentos[c("areaconst", "habitac", "estrato", "parquea")], median)## areaconst habitac estrato parquea
## Min. : 30.0 Min. : 0.000 Min. :3.000 Min. : 0.000
## 1st Qu.: 154.0 1st Qu.: 3.000 1st Qu.:3.000 1st Qu.: 1.000
## Median : 240.0 Median : 4.000 Median :5.000 Median : 2.000
## Mean : 273.3 Mean : 4.609 Mean :4.485 Mean : 1.768
## 3rd Qu.: 350.0 3rd Qu.: 5.000 3rd Qu.:5.000 3rd Qu.: 2.000
## Max. :1745.0 Max. :10.000 Max. :6.000 Max. :10.000
## areaconst habitac estrato parquea
## Min. : 35.0 Min. :0.000 Min. :3.000 Min. : 0.000
## 1st Qu.: 68.0 1st Qu.:3.000 1st Qu.:4.000 1st Qu.: 1.000
## Median : 90.0 Median :3.000 Median :5.000 Median : 1.000
## Mean :112.9 Mean :2.972 Mean :4.729 Mean : 1.302
## 3rd Qu.:130.0 3rd Qu.:3.000 3rd Qu.:6.000 3rd Qu.: 2.000
## Max. :932.0 Max. :9.000 Max. :6.000 Max. :10.000
# Creo la variable Vmcuadrado
datos$Vmcuadrado <- datos$preciom / datos$areaconst
# Imprimo las primeras filas de la base de datos para verificar que se haya creado correctamente la nueva variable
head(datos)library(ggplot2)
ggplot(ordenVmcuadrado, aes(x = factor(estrato), fill = factor(zona))) +
geom_bar(position = "dodge", color = "black") +
labs(title = "Histograma de Estratos por Zona",
x = "Estrato",
y = "Frecuencia") +
theme_minimal()En el histograma de estratos por zona, observamos que la mayoría de las viviendas se encuentran ubicadas en la zona sur. Además, en esta área, la mayoría de las viviendas corresponden a los estratos 4 y 5, aunque también se encuentran viviendas de todos los estratos.
En la zona norte, las viviendas se distribuyen principalmente entre los estratos 3 y 5, con escasa presencia de viviendas de estrato 6.
Por otro lado, en la zona Oeste predominan las viviendas de estrato 5 y 6.
En cuanto a la zona oriente, únicamente se encuentran viviendas de estrato 3, con muy pocas de estrato 4, mientras que no se registran viviendas de otros estratos.
library(ggplot2)
# Defino los rangos para el histograma
min_Vmcuadrado <- min(ordenVmcuadrado$Vmcuadrado)
max_Vmcuadrado <- max(ordenVmcuadrado$Vmcuadrado)
num_bins <- 20 # Número de intervalos/rangos para el histograma
# Calculo el ancho de los intervalos
interval_width <- (max_Vmcuadrado - min_Vmcuadrado) / num_bins
# Creo los límites de los intervalos
bins <- seq(min_Vmcuadrado, max_Vmcuadrado, by = interval_width)
# Creo el histograma de frecuencia
ggplot(datos, aes(x = Vmcuadrado, fill = zona)) +
geom_histogram(breaks = bins, color = "black", alpha = 0.5) +
labs(title = "Histograma de Frecuencia de Vmcuadrado",
x = "Vmcuadrado",
y = "Frecuencia") +
theme_minimal()En el histograma del valor del metro cuadrado por zona, se observa que en la zona sur la distribución es normal, mientras que en la zona norte se presenta una opción interesante para la compra, ya que su distribución muestra una cola derecha, lo que implica que hay una concentración de menores precios por metro cuadrado. Como hemos visto en el gráfico anterior, en esta zona los estratos predominantes están entre 3 y 5.
library(ggplot2)
# Creo el gráfico de dispersión
ggplot(ordenVmcuadrado, aes(x = Vmcuadrado, y = estrato)) +
geom_point() +
labs(title = "Vmcuadrado vs Estrato",
x = "Vmcuadrado",
y = "Estrato") +
theme_minimal()En el gráfico de dispersión del valor del metro cuadrado vs el estrato, podemos observar que a medida que el estrato disminuye, el valor del metro cuadrado tiende a tener una dispersión menor. Sin embargo, en el estrato 6 encontramos una distribución en la que el valor del metro cuadrado abarca “todos” los precios posibles.
El análisis del mercado inmobiliario en Cali, con el enfoque en la distribución de viviendas por zona y estrato, así como en el valor del metro cuadrado, proporciona información crucial para la empresa B&C en su toma de decisiones estratégicas. Al comprender dónde se concentran las viviendas y cómo varían los precios por metro cuadrado en diferentes áreas de la ciudad, B&C puede identificar oportunidades de mercado, determinar la demanda y la competencia en cada segmento, y desarrollar estrategias para maximizar su rentabilidad. Por ejemplo, al saber que la zona norte presenta precios más bajos por metro cuadrado, la empresa podría enfocarse en esa área para ofrecer propiedades a precios competitivos y atractivos para los clientes. Del mismo modo, al comprender la distribución de estratos en cada zona, B&C puede adaptar su cartera de productos para satisfacer las necesidades y preferencias de los diferentes segmentos del mercado. En resumen, el análisis del mercado inmobiliario proporciona una base sólida de información para que B&C tome decisiones estratégicas informadas y aproveche las oportunidades en el mercado de Cali.
Se observa una amplia variedad de tipos de vivienda disponibles en el mercado de Cali, que van desde apartamentos pequeños hasta casas grandes, lo que sugiere una diversidad de opciones para los compradores potenciales.
Al categorizar las viviendas según características comunes como tamaño, número de habitaciones y estrato, se identificaron las mejores ofertas, esto puede aydar a B&C a invertir en las mejores opciones.
La zona sur concentra la mayoría de las viviendas, principalmente en los estratos 4 y 5, aunque también hay presencia de otros estratos. En la zona norte, las viviendas se distribuyen entre los estratos 3 y 5, con escasa presencia de estrato 6. En el Oeste predominan los estratos 5 y 6, mientras que en el Este solo se encuentran viviendas de estrato 3, con muy pocas de estrato 4 y ninguna de otros estratos.
En la zona sur, el valor del metro cuadrado sigue una distribución normal. Sin embargo, en la zona norte, se observa una concentración de precios más bajos por metro cuadrado, lo que podría indicar una oportunidad interesante para la compra, especialmente considerando los estratos predominantes en esta zona.
En general, a medida que el estrato disminuye, el valor del metro cuadrado tiende a tener una dispersión menor, indicando una mayor homogeneidad en los precios en estratos más bajos. No obstante, en el estrato 6, se observa una mayor variabilidad en los precios del metro cuadrado, lo que sugiere una diversidad en las características de las propiedades dentro de este estrato.