1. Introducción

En la sociedad actual, el uso continuo de datos en todos los ámbitos es evidentes y para poder utilizarlos de manera eficaz nos encaminamos al uso de herramientas estadísticas y tecnológicas, para poder descubrir tendencias y comportamientos que pueden tener un impacto significativo en diversos sectores de la sociedad.
En este informe analizaremos diferentes variables las cuales tienen un impacto al momento de detallar características relevantes de la oferta de vivienda todo esto para determinar servicios para los clientes que están buscando una opción que se ajuste a su vivienda soñada.
Para cada gráfica propuesta, identificaremos a los involucrados, los impacto generado para dar solución a los los objetivos establecidos. Todo esto con el fin de evaluar con la información analizada los puntos clave que debe tener en cuenta la empresa B&C para tomar decisiones sobre su negocio mediante el análisis descriptivo que dará como resultado este reporte, esperamos obtener información.

2. Objetivos

El objetivo de este informe es realizar una investigación exhaustiva que permita profundizar en el las viviendas estudiadas en Cali para poder analizar y encontrar un nicho, costos, márquetin para una empresa del sector inmobiliario:

3. Métodos

De acuerdo a la base de datos suministrada “vivienda_faltantes” convirtiendo la en “viviendas_f”, se realizó una identificación de variables con sus respectivos gráficos, se realizó una limpieza de datos eliminando registros vacíos, estandarizando resultados de variables y reemplazando valores “NA” por ‘0’ ya que para las variables piso y parqueadero llegábamos a omitir o eliminar estos valores generaría una perdida de mas del 50% de la información:

library(ggplot2) # Cargar la librería para graficos
library(paqueteMETODOS)# Cargar la librería con informacion a tratar
library(dplyr) # Cargar la librería de manipulación de dataframes "dplyr"
data(vivienda_faltantes) #Data a analisar 
viviendas_f <- (vivienda_faltantes) #Renombrar tabla para modificar
##Limpieza de Variable TIPO
      viviendas_f$tipo[viviendas_f$tipo=='casa']<-'Casa'
      viviendas_f$tipo[viviendas_f$tipo=='CASA']<-'Casa'
      viviendas_f$tipo[viviendas_f$tipo=='APARTAMENTO']<-'Apartamento'
      viviendas_f$tipo[viviendas_f$tipo=='apto']<-'Apartamento'
##Limpieza de Variable latitud
      sin_decimales <- viviendas_f$latitud[!grepl("\\.", as.character(viviendas_f$latitud))] 
      sin_decimales_divididos <- sin_decimales / 1000 
      viviendas_f$latitud[!grepl("\\.", as.character(viviendas_f$latitud))] <- sin_decimales_divididos
##Limpieza de Variable longitud
      sin_decimales <- viviendas_f$longitud[!grepl("\\.", as.character(viviendas_f$longitud))] 
      sin_decimales_divididos <- sin_decimales / 1000 
      viviendas_f$longitud[!grepl("\\.", as.character(viviendas_f$longitud))] <- sin_decimales_divididos
##Limpieza de Variable areaconst
      viviendas_f$areaconst <- trunc(viviendas_f$areaconst)
##Limpieza de Variable parquea por nulos
      viviendas_f$parquea [is.na(viviendas_f$parquea ) ] <-0
##Limpieza de Variable piso por nulos
      viviendas_f$piso [is.na(viviendas_f$piso ) ] <-0
#Eliminar duplicados
      viviendas_f<-distinct(viviendas_f,zona,piso,estrato,preciom,areaconst,parquea,banios,habitac,tipo,longitud,latitud)
#Borrar datos nulos 
      viviendas_f<-na.omit(viviendas_f)


4. Resultados

Grafica de Zonas


En el siguiente grafico tiene la representación de la importancia en porcentajes de cada zona de Cali en las viviendas analizados teniendo en cuenta que predomina la Zona Sur

Grafica de Precios

En este caso el histograma nos representa la distribución de precios sobre el mercado, lo cual nos da el indicio que el mayor rango esta entre 0 a 500 millones por propiedad.

En el gráfico se uso una limpieza para retirar los valores outliers con un total de 27.65% con un filtro para poder realizar el histograma así solo usando para este gráfico el 72.35% de la información.

Grafica de Area (m2)

En esta gráfica de densidad nos representa la distribución del area por m2 sobre el mercado lo cual nos da el indicio que el mayor rango esta entre 30 a 250 m2.

En gráfico se uso una limpieza para retirar los valores outliers con un total de 15.82% con un filtro para poder realizar la gráfica de densidad así solo usando para este gráfico el 84.18% de la información.

Precio por Area (m2)

Se realizo la comparacion del precio por cada metro cuadrado lo cual nos indica un precio promedio de $2.700.000 COP.


Grafica de torta por tipos de vivienda

En esta gráfica se evidencian los porcentajes de inmuebles que predominan en la diferentes áreas de Cali.

Caracteristicas

El cuadro representa las variables con su respectiva media agrupando por zona de residencia y tipo de vivienda para categorizar las características de los inmuebles analizados.
zona tipo meanbanios meanparquea meanhabitac meanarea
Zona Centro Apartamento 2 0 3 95
Zona Centro Casa 3 1 5 218
Zona Norte Apartamento 2 1 3 99
Zona Norte Casa 4 1 5 265
Zona Oeste Apartamento 3 2 3 172
Zona Oeste Casa 4 2 5 343
Zona Oriente Apartamento 2 0 3 95
Zona Oriente Casa 3 1 5 213
Zona Sur Apartamento 2 1 3 98
Zona Sur Casa 4 2 5 282

Grafica de Mapa

De acuerdo a las variables longitud y latitud se promedio las zonas y tipo de vivienda de predominancia en cada sector de cali asi atribuyendo valores promediados para conocer sectores claves, estratos clave, tipos de vivienda, precio promedio por vivienda.

Graficas de promedios de caracteristicas.

En estas tres gráficas se encuentran los promedios según el mapa para características de las viviendas en esas zonas mencionadas.

Promedio Baños
library(sparkline)
sparkline(PromedioCAR$meanbanios, type = "line", barColor = "green")

Promedio Parqueadero
library(sparkline)
sparkline(PromedioCAR$meanparquea, type = "line", barColor = "green")

Promedio Habitaciones
library(sparkline)
sparkline(PromedioCAR$meanhabitac, type = "line", barColor = "green")

5. Discusión

  1. Análisis Geoespacial:
    • Estudios inmobiliarios futuros se deben enfocar en el uso de variables de longitud y latitud para promediar zonas y tipos de vivienda en Cali es una estrategia adecuada para el negocio. Proporciona una comprensión más profunda de la distribución geográfica de los inmuebles.
    • La identificación de sectores clave como se visualiza en el mapa y estratos predominantes como son el estrato 5 y 6 es esencial para enfocar los esfuerzos de la empresa inmobiliaria de manera efectiva.
  2. Zonas Predominantes:
    • El hecho de que la zona sur sea la de mayor predominancia en términos de viviendas sugiere oportunidades y desafíos específicos para la empresa. Puede considerar estrategias de marketing y desarrollo inmobiliario específicas para esta área.
  3. Características de los Inmuebles:
    • La tabla que muestra las características con su media agrupada por zona y tipo de vivienda es esencial para entender las preferencias y demandas de diferentes segmentos de la población.
    • Esto permite a la empresa adaptar sus servicios y ofertas según las necesidades específicas de cada zona y tipo de vivienda.
  4. Distribución de Tipos de Vivienda:
    • La gráfica de torta que muestra los porcentajes de diferentes tipos de vivienda en Cali proporciona información valiosa sobre las preferencias del mercado. El hecho de que los apartamentos tengan un mayor porcentaje indica una demanda.
    • La inmobiliaria podría ajustar su cartera de propiedades para alinearse con esta demanda, centrándose en el desarrollo de apartamentos.
  5. Distribución del Área (m2):
    • La gráfica de densidad del área por m2 es crucial para comprender la distribución del tamaño de las propiedades en el mercado.
    • La eliminación de outliers y el enfoque en el 84.18% de la información garantizan que la representación sea más precisa. El rango de 30 a 250 m2 como el de mayor prevalencia sugiere un mercado concentrado en tamaños específicos.
  6. Implicaciones y Estrategias para la Inmobiliaria:
    • La inmobiliaria puede enfocar sus esfuerzos de desarrollo en la zona sur y adaptar sus estrategias de marketing para destacar propiedades que se alineen con las preferencias identificadas.
    • Dada la alta demanda de apartamentos, la empresa podría considerar la expansión en este segmento, ya sea mediante nuevos desarrollos o adquisiciones.
    • La comprensión de las características específicas valoradas por los residentes en cada zona puede influir en la toma de decisiones sobre el diseño y las características de las propiedades. En resumen, el informe proporciona una base sólida para que la empresa inmobiliaria tome decisiones estratégicas informadas y se adapte eficazmente a las dinámicas del mercado en Cali.

6. Conclusiones

En grandes rasgos fueron clasificados en diferentes puntos a tener en cuenta:
  • Identificación de Sectores Estratégicos: El análisis estadístico basado en la ubicación geográfica y tipo de vivienda en Cali ha permitido identificar sectores clave para la empresa inmobiliaria. La zona sur se destaca como un área de predominancia, lo que sugiere una oportunidad para focalizar esfuerzos y recursos en esta región.
  • Segmentación por Estratos y Precios: La categorización por estratos y el cálculo del precio promedio por vivienda en diferentes zonas proporciona información valiosa para la toma de decisiones estratégicas. Se pueden identificar segmentos de mercado con mayor potencial y adaptar la oferta inmobiliaria de acuerdo con las preferencias y capacidades económicas de cada sector.
  • Caracterización de Inmuebles: La tabla de características con su respectiva media, agrupada por zona de residencia y tipo de vivienda, brinda una comprensión detallada de las propiedades analizadas. Esto facilita la identificación de patrones y la adaptación de la oferta inmobiliaria a las preferencias específicas de cada segmento de mercado.
  • Predominio de Apartamentos: La gráfica de torta destaca que los apartamentos son la tipología de vivienda predominante en Cali. Esta información es crucial para ajustar estrategias de desarrollo inmobiliario y orientar la inversión hacia el tipo de propiedad más demandado en la región.
  • Distribución del Área por m2: La gráfica de densidad del área por metro cuadrado revela que la mayoría de las propiedades se encuentran en el rango de 30 a 250 m2. La identificación de este intervalo dominante permite a la empresa inmobiliaria enfocar sus esfuerzos en el desarrollo de propiedades que se alineen con las preferencias del mercado.
  • Filtración de Outliers y Limpieza de Datos: La limpieza de datos para eliminar valores atípicos garantiza una representación más precisa de la realidad del mercado. Sin embargo, es necesario considerar la posibilidad de utilizar modelos predictivos para identificar patrones más complejos y mejorar aún más la precisión de las predicciones.
  • Oportunidades para Modelos Predictivos: La implementación de modelos predictivos puede potenciar el análisis actual, permitiendo una anticipación más precisa de las tendencias del mercado inmobiliario. Estos modelos pueden utilizar variables adicionales y complejas para prever cambios en la demanda, los precios y las preferencias de los clientes.

En resumen, este informe proporciona una base sólida para la toma de decisiones estratégicas, pero sugiere la posibilidad de mejorar aún más mediante la implementación de modelos predictivos avanzados. La combinación de datos estadísticos actuales y la capacidad de anticipar futuras tendencias puede posicionar a la empresa inmobiliaria de manera más competitiva en el dinámico mercado de Cali.

7. Anexos

Grafica de Zonas

t1Zona <- viviendas_f %>% group_by(viviendas_f$zona) %>% 
  count(viviendas_f$zona)
porcZona <- round((t1Zona$n/8260) * 100,1)
ggplot(t1Zona, aes(x="", y= n, fill=t1Zona$`viviendas_f$zona`)) +
  geom_bar( stat = "identity",colour="black",pallet="Blues")+
  coord_polar("y", start=0) +
  scale_fill_brewer(palette = "PuBu")+
  geom_text(aes(label = paste0(porcZona, "% \n",t1Zona$`viviendas_f$zona`,'\n' )),position = position_stack(vjust = 0.5),size=3) +
  labs(title = "    Diagrama de tortas por zonas en Cali", fill = NULL, x = NULL, y= NULL) +
  theme_void()

Grafica de Precios

#Para filtrar el gráfico
Precio_n <- filter(viviendas_f, preciom >= 0, preciom <= 1000)
#

#Para filtrar el gráfico
Precio_c <- filter(viviendas_f, preciom >1000, preciom <= 2000)
ggplot(Precio_n, aes(x=Precio_n$preciom)) + 
  geom_histogram(color="black", fill="#1d3c90") +
   labs(x="Precio", y="Conteo")

Grafica de Area (m2)

par(mar = c(5, 4, 4, 1)+0.5)  # margenes de la gráfica

area_n <- filter(viviendas_f, areaconst >= 0, areaconst <= 300)

plot(density(area_n$areaconst), lwd=3, col="#0d3b66",
     main = "Distribución de area contruida en propiedades de cali",
     xlab="Area (m2)",
     ylab = "densidad", las=1,
     cex.lab=1,  # tamaño de etiqueta ejes
     cex.axis=.8, # tamaño escalas de los ejes 
     cex.main=1, # tamaño del titulo
     cex.sub=1) 

Precio por Area (m2)


#Para filtrar el grafico

ggplot(viviendas_f, aes(x=viviendas_f$PrecioXArea)) + 
  geom_histogram(color="black", fill="#1d3c90") +
  labs(x="Precio X (m2)", y="Conteo")

Grafica de torta por tipos de vivienda

library(dplyr)

Freq <- viviendas_f %>% group_by(viviendas_f$tipo) %>% 
   count(viviendas_f$tipo)

porcentaje <- round((Freq$n/8260) * 100,1)

ggplot(Freq, aes(x="", y= n, fill=n)) +
  geom_bar(stat = "identity", colour="black")+
  coord_polar("y", start=0) +
  geom_text(aes(label = paste0(porcentaje, "% ",Freq$`viviendas_f$tipo` )),position = position_stack(vjust = 0.5)) +
  labs(title = "    Tipos de Vivienda en Cali", fill = NULL, x = NULL, y= NULL) +
  theme_void() 

Caracteristicas

PromedioCAR<- viviendas_f %>%
  group_by(zona,tipo) %>%
  summarise(meanbanios = round(mean(banios)),
            meanparquea = round(mean(parquea)),
            meanhabitac = round(mean(habitac)),
            meanarea = round(mean(areaconst))
            )

library(formattable)


formattable(PromedioCAR, 
            align = c("l",rep("r", NCOL(PromedioCAR) - 1)),
            list(`Indicator Name` = formatter("span", style = ~ style(color = "grey", font.weight = "bold"))
               ))

Grafica de Mapa

install.packages("formattable")
library(formattable)
library(dplyr)
library(leaflet)
library(ggplot2)
PromedioPer<- viviendas_f %>%
   group_by(zona,tipo) %>%
   summarise(meanprecio = mean(preciom*1000000),
             meanlongitud = mean(longitud),
             meanlatitud = mean(latitud),
             meanestrato = mean(estrato))
 
 PromedioPer$meanprecio <- format( PromedioPer$meanprecio , big.mark = ".")

MapaPuntos <- leaflet(PromedioPer) %>%
  addTiles() %>%
  addCircles(
    ~meanlongitud, ~meanlatitud,
    radius = 600,
    color = "#1d3c90",
    fill =  TRUE,
    fillOpacity = 0.1,
    popup = ~paste("<b>Tipo de inmueble:</b>", tipo,
                   "<b><br>     Precio Promedio: $</b>", meanprecio,
                   "<b><br>     Estrato Promedio: </b>", trunc(meanestrato)
                                      )
  )

MapaPuntos