En la sociedad actual, el uso continuo de datos en todos los ámbitos
es evidentes y para poder utilizarlos de manera eficaz nos encaminamos
al uso de herramientas estadísticas y tecnológicas, para poder descubrir
tendencias y comportamientos que pueden tener un impacto significativo
en diversos sectores de la sociedad.
En este informe analizaremos
diferentes variables las cuales tienen un impacto al momento de detallar
características relevantes de la oferta de vivienda todo esto para
determinar servicios para los clientes que están buscando una opción que
se ajuste a su vivienda soñada.
Para cada gráfica propuesta,
identificaremos a los involucrados, los impacto generado para dar
solución a los los objetivos establecidos. Todo esto con el fin de
evaluar con la información analizada los puntos clave que debe tener en
cuenta la empresa B&C para tomar decisiones sobre su negocio
mediante el análisis descriptivo que dará como resultado este reporte,
esperamos obtener información.
De acuerdo a la base de datos suministrada “vivienda_faltantes”
convirtiendo la en “viviendas_f”, se realizó una identificación de
variables con sus respectivos gráficos, se realizó una limpieza de datos
eliminando registros vacíos, estandarizando resultados de variables y
reemplazando valores “NA” por ‘0’ ya que para las variables piso y
parqueadero llegábamos a omitir o eliminar estos valores generaría una
perdida de mas del 50% de la información:
library(ggplot2) # Cargar la librería para graficos
library(paqueteMETODOS)# Cargar la librería con informacion a tratar
library(dplyr) # Cargar la librería de manipulación de dataframes "dplyr"
data(vivienda_faltantes) #Data a analisar
viviendas_f <- (vivienda_faltantes) #Renombrar tabla para modificar
##Limpieza de Variable TIPO
viviendas_f$tipo[viviendas_f$tipo=='casa']<-'Casa'
viviendas_f$tipo[viviendas_f$tipo=='CASA']<-'Casa'
viviendas_f$tipo[viviendas_f$tipo=='APARTAMENTO']<-'Apartamento'
viviendas_f$tipo[viviendas_f$tipo=='apto']<-'Apartamento'
##Limpieza de Variable latitud
sin_decimales <- viviendas_f$latitud[!grepl("\\.", as.character(viviendas_f$latitud))]
sin_decimales_divididos <- sin_decimales / 1000
viviendas_f$latitud[!grepl("\\.", as.character(viviendas_f$latitud))] <- sin_decimales_divididos
##Limpieza de Variable longitud
sin_decimales <- viviendas_f$longitud[!grepl("\\.", as.character(viviendas_f$longitud))]
sin_decimales_divididos <- sin_decimales / 1000
viviendas_f$longitud[!grepl("\\.", as.character(viviendas_f$longitud))] <- sin_decimales_divididos
##Limpieza de Variable areaconst
viviendas_f$areaconst <- trunc(viviendas_f$areaconst)
##Limpieza de Variable parquea por nulos
viviendas_f$parquea [is.na(viviendas_f$parquea ) ] <-0
##Limpieza de Variable piso por nulos
viviendas_f$piso [is.na(viviendas_f$piso ) ] <-0
#Eliminar duplicados
viviendas_f<-distinct(viviendas_f,zona,piso,estrato,preciom,areaconst,parquea,banios,habitac,tipo,longitud,latitud)
#Borrar datos nulos
viviendas_f<-na.omit(viviendas_f)
En el siguiente grafico tiene la representación de la importancia en porcentajes de cada zona de Cali en las viviendas analizados teniendo en cuenta que predomina la Zona Sur
En este caso el histograma nos representa la distribución de precios sobre el mercado, lo cual nos da el indicio que el mayor rango esta entre 0 a 500 millones por propiedad.
En el gráfico se uso una limpieza para retirar los valores outliers con un total de 27.65% con un filtro para poder realizar el histograma así solo usando para este gráfico el 72.35% de la información.
En esta gráfica de densidad nos representa la distribución del area por m2 sobre el mercado lo cual nos da el indicio que el mayor rango esta entre 30 a 250 m2.
En gráfico se uso una limpieza para retirar los valores outliers con un total de 15.82% con un filtro para poder realizar la gráfica de densidad así solo usando para este gráfico el 84.18% de la información.
Se realizo la comparacion del precio por cada metro cuadrado lo cual nos indica un precio promedio de $2.700.000 COP.
En esta gráfica se evidencian los porcentajes de inmuebles que
predominan en la diferentes áreas de Cali.
| zona | tipo | meanbanios | meanparquea | meanhabitac | meanarea |
|---|---|---|---|---|---|
| Zona Centro | Apartamento | 2 | 0 | 3 | 95 |
| Zona Centro | Casa | 3 | 1 | 5 | 218 |
| Zona Norte | Apartamento | 2 | 1 | 3 | 99 |
| Zona Norte | Casa | 4 | 1 | 5 | 265 |
| Zona Oeste | Apartamento | 3 | 2 | 3 | 172 |
| Zona Oeste | Casa | 4 | 2 | 5 | 343 |
| Zona Oriente | Apartamento | 2 | 0 | 3 | 95 |
| Zona Oriente | Casa | 3 | 1 | 5 | 213 |
| Zona Sur | Apartamento | 2 | 1 | 3 | 98 |
| Zona Sur | Casa | 4 | 2 | 5 | 282 |
En estas tres gráficas se encuentran los promedios según el mapa para características de las viviendas en esas zonas mencionadas.
Promedio Baños
|
Promedio Parqueadero
|
Promedio Habitaciones
|
En resumen, este informe proporciona una base sólida para la toma de decisiones estratégicas, pero sugiere la posibilidad de mejorar aún más mediante la implementación de modelos predictivos avanzados. La combinación de datos estadísticos actuales y la capacidad de anticipar futuras tendencias puede posicionar a la empresa inmobiliaria de manera más competitiva en el dinámico mercado de Cali.
t1Zona <- viviendas_f %>% group_by(viviendas_f$zona) %>%
count(viviendas_f$zona)
porcZona <- round((t1Zona$n/8260) * 100,1)
ggplot(t1Zona, aes(x="", y= n, fill=t1Zona$`viviendas_f$zona`)) +
geom_bar( stat = "identity",colour="black",pallet="Blues")+
coord_polar("y", start=0) +
scale_fill_brewer(palette = "PuBu")+
geom_text(aes(label = paste0(porcZona, "% \n",t1Zona$`viviendas_f$zona`,'\n' )),position = position_stack(vjust = 0.5),size=3) +
labs(title = " Diagrama de tortas por zonas en Cali", fill = NULL, x = NULL, y= NULL) +
theme_void()
#Para filtrar el gráfico
Precio_n <- filter(viviendas_f, preciom >= 0, preciom <= 1000)
#
#Para filtrar el gráfico
Precio_c <- filter(viviendas_f, preciom >1000, preciom <= 2000)
ggplot(Precio_n, aes(x=Precio_n$preciom)) +
geom_histogram(color="black", fill="#1d3c90") +
labs(x="Precio", y="Conteo")
par(mar = c(5, 4, 4, 1)+0.5) # margenes de la gráfica
area_n <- filter(viviendas_f, areaconst >= 0, areaconst <= 300)
plot(density(area_n$areaconst), lwd=3, col="#0d3b66",
main = "Distribución de area contruida en propiedades de cali",
xlab="Area (m2)",
ylab = "densidad", las=1,
cex.lab=1, # tamaño de etiqueta ejes
cex.axis=.8, # tamaño escalas de los ejes
cex.main=1, # tamaño del titulo
cex.sub=1)
#Para filtrar el grafico
ggplot(viviendas_f, aes(x=viviendas_f$PrecioXArea)) +
geom_histogram(color="black", fill="#1d3c90") +
labs(x="Precio X (m2)", y="Conteo")
library(dplyr)
Freq <- viviendas_f %>% group_by(viviendas_f$tipo) %>%
count(viviendas_f$tipo)
porcentaje <- round((Freq$n/8260) * 100,1)
ggplot(Freq, aes(x="", y= n, fill=n)) +
geom_bar(stat = "identity", colour="black")+
coord_polar("y", start=0) +
geom_text(aes(label = paste0(porcentaje, "% ",Freq$`viviendas_f$tipo` )),position = position_stack(vjust = 0.5)) +
labs(title = " Tipos de Vivienda en Cali", fill = NULL, x = NULL, y= NULL) +
theme_void()
PromedioCAR<- viviendas_f %>%
group_by(zona,tipo) %>%
summarise(meanbanios = round(mean(banios)),
meanparquea = round(mean(parquea)),
meanhabitac = round(mean(habitac)),
meanarea = round(mean(areaconst))
)
library(formattable)
formattable(PromedioCAR,
align = c("l",rep("r", NCOL(PromedioCAR) - 1)),
list(`Indicator Name` = formatter("span", style = ~ style(color = "grey", font.weight = "bold"))
))
install.packages("formattable")
library(formattable)
library(dplyr)
library(leaflet)
library(ggplot2)
PromedioPer<- viviendas_f %>%
group_by(zona,tipo) %>%
summarise(meanprecio = mean(preciom*1000000),
meanlongitud = mean(longitud),
meanlatitud = mean(latitud),
meanestrato = mean(estrato))
PromedioPer$meanprecio <- format( PromedioPer$meanprecio , big.mark = ".")
MapaPuntos <- leaflet(PromedioPer) %>%
addTiles() %>%
addCircles(
~meanlongitud, ~meanlatitud,
radius = 600,
color = "#1d3c90",
fill = TRUE,
fillOpacity = 0.1,
popup = ~paste("<b>Tipo de inmueble:</b>", tipo,
"<b><br> Precio Promedio: $</b>", meanprecio,
"<b><br> Estrato Promedio: </b>", trunc(meanestrato)
)
)
MapaPuntos