El mercado inmobiliario es uno de los sectores económicos más dinámicos del país, por eso es importante el análisis de lo que ocurre con este mercado a lo largo del territorio colombiano, sobre todo en las grandes ciudades donde el número de habitantes viene experimentando un crecimiento acelerado, y poder determinar cómo es el comportamiento entre la oferta y la demanda de vivienda en lugares con dicha problemática. Y es precisamente en la ciudad de Santiago de Cali donde se centra este análisis teniendo en cuenta que es una de las grandes ciudades del país, en donde el mercado inmobiliario ha tenido un crecimiento considerable y se espera que siga creciendo durante los próximos años.
Este trabajo se centra en realizar análisis exploratorio y descriptivo a la base de datos llamada “viviendas_faltantes” que contiene 8,330 observaciones y 13 variables relevante sobre el mercado de viviendas en Cali. Esta información fue recogida por la empresa Bienes y Casas (B&C) de Cali y tiene datos sobre viviendas, sus precios, localización y características.
El objetivo principal de este análisis exploratorio es tener una visión detallada el comportamiento de este mercado, teniendo en cuenta variables como precios, zona donde se encuentran ubicadas, características de las propiedades, a través de este análisis descriptivo se apoyará a los tomadores de decisiones a desarrollar estrategias de marketing eficaces y fijar precios de venta competitivos, se realizó la revisión, sistematización, eliminación de duplicados e imputación de valores faltantes, se garantizó la integridad y calidad de la información analizada.
Además, se realiza la visualización a través de histogramas, gráficos de barras, gráficos de densidad múltiple, mapas y tablas con valores promedio por zona para tener una visión gráfica de las tendencias y características del mercado inmobiliario, permitiendo a identificar oportunidades de inversión, entender la demanda del mercado y tomar decisiones estratégicas, analizar la distribución de precios en diferentes zonas de Cali, determinar los tipos de viviendas más ofertadas y evaluar las características más relevantes de la oferta de vivienda en la ciudad.
#1.1 Objetivo General
Realizar un análisis exploratorio del mercado inmobiliario en Cali, Colombia con el fin de proporcionar herramientas a los tomadores de decisiones para realizar estrategias de marketing y fijación adecuada de precios de vivienda.
#1.2 Objetivos específicos
1.2.1 Ordenar y limpiar los datos para mejorar la calidad de la información de la base de datos mediante el tratamiento de datos faltantes, imputación o eliminación de datos repetidos y normalización de variables para garantizar una comparación adecuada.
1.2.2 Realizar el análisis de la distribución de precios de vivienda por zonas en la ciudad de Cali identificando las zonas con los precios más altos y más bajos.
1.2.3 Determinar la proporción entre los tipos de vivienda en el mercado inmobiliario de Cali .
1.2.4 Determinar las características más comunes de las viviendas en Cali haciendo referencia al estrato, número baños y área construida.
#2.1 Importar datos
Se realizar el proceso de configuración e instalación de paquetes para poder descargar la base de datos.
2.1.1 Instalación de paquetes Se instala el paquete devtools que facilita instalar y manejar otros paquetes 2.1.2 Descarga de la data: Teniendo en cuenta que la base de datos se encuentra en un paquete de R instalado, para trabajar con el dataset se utiliza la función data()
## descarga de data
devtools::install_github("dgonxalex80/paqueteMETODOS")
## Skipping install of 'paqueteMETODOS' from a github remote, the SHA1 (341036c5) has not changed since last install.
## Use `force = TRUE` to force installation
library(paqueteMETODOS)
## Loading required package: cubature
## Loading required package: dplyr
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Loading required package: flextable
## Loading required package: ggplot2
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: MASS
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
## Loading required package: psych
##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
## Loading required package: summarytools
## Loading required package: randtests
## Loading required package: rapportools
##
## Attaching package: 'rapportools'
## The following objects are masked from 'package:summarytools':
##
## label, label<-
## The following object is masked from 'package:dplyr':
##
## n
## The following objects are masked from 'package:stats':
##
## IQR, median, sd, var
## The following objects are masked from 'package:base':
##
## max, mean, min, range, sum
data(vivienda_faltantes)
Por precaución antes de realizar cualquier tipo de operación con el dataset se realiza un backup.
## backupp
vivienda <- vivienda_faltantes
Para conocer la cantidad de observaciones y variables se utiliza la función dim
## conocer el número de observaciones y variables
dim(vivienda)
## [1] 8330 13
Lo que indica que la base de datos contiene 8330 observaciones con 17 variables
2.2 Ordenar y limpiar datos
Teniendo en cuenta que una de las tareas más importantes en un proyecto de ciencia de datos, a continuación, se van a presentar cada una de las acciones necesarias para tratar y dejar lista la base de datos “datos_faltantes” para iniciar el análisis.
2.2.1 Tratamiento de datos faltantes Para tratar de eliminar situaciones que afecten la calidad de los datos y la validez del análisis es importante usar diferentes estrategias para abordar los datos faltantes.
Eliminación de los registros o filas
##
library(mice)
##
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
##
## filter
## The following objects are masked from 'package:base':
##
## cbind, rbind
md.pattern(vivienda, rotate.names = TRUE)
## preciom id zona estrato areaconst banios habitac tipo barrio longitud
## 4812 1 1 1 1 1 1 1 1 1 1
## 1912 1 1 1 1 1 1 1 1 1 1
## 877 1 1 1 1 1 1 1 1 1 1
## 726 1 1 1 1 1 1 1 1 1 1
## 1 1 0 0 0 0 0 0 0 0 0
## 2 0 0 0 0 0 0 0 0 0 0
## 2 3 3 3 3 3 3 3 3 3
## latitud parquea piso
## 4812 1 1 1 0
## 1912 1 1 0 1
## 877 1 0 1 1
## 726 1 0 0 2
## 1 0 0 0 12
## 2 0 0 0 13
## 3 1606 2641 4279
La anterior figura indica que hay dos observaciones que tienen las 13 variables vacías y 1 observación que tiene 12 variables vacías, teniendo en cuenta que representa sólo el 0,03% de las observaciones, se decide eliminar esas tres observaciones.
Primero se eliminan las observaciones que tienen las 13 variables vacías
vivienda <- vivienda[rowSums(is.na(vivienda)) != ncol(vivienda),]
Posteriormente, se elimina la observación que tiene las 12 variables vacías
vivienda <- vivienda[complete.cases(vivienda$id),]
Se realiza la validación gráfica de los resultados
md.pattern(vivienda, rotate.names = TRUE)
## id zona estrato preciom areaconst banios habitac tipo barrio longitud
## 4812 1 1 1 1 1 1 1 1 1 1
## 1912 1 1 1 1 1 1 1 1 1 1
## 877 1 1 1 1 1 1 1 1 1 1
## 726 1 1 1 1 1 1 1 1 1 1
## 0 0 0 0 0 0 0 0 0 0
## latitud parquea piso
## 4812 1 1 1 0
## 1912 1 1 0 1
## 877 1 0 1 1
## 726 1 0 0 2
## 0 1603 2638 4241
2.2.2 Eliminación de registros duplicados
Validamos si hay registros duplicados
repetidos <- duplicated(vivienda)
sum(repetidos)
## [1] 8
Se eliminan los registros que se encuentran repetidos.
vivienda <- distinct(vivienda)
repetidos <- duplicated(vivienda)
sum(repetidos)
## [1] 0
2.2.3 Estandarización y normalización
Revisando la base datos se encontró que los datos no están estandarizados. Por ejemplo la variable tipo los datos se encuentran en mayúsculas y en minúsculas.
table(vivienda$tipo)
##
## Apartamento APARTAMENTO apto casa Casa CASA
## 5025 61 13 14 3194 12
Se procede entonces a hacer la normalización de la variable tipo.
## normalizar tipo en minusculas
tipo=table(vivienda$tipo) %>% data.frame()
vivienda$tipo <- tolower(vivienda$tipo)
#Cambiar apto por apartamento
vivienda <- vivienda %>%
mutate(tipo = ifelse(tipo == "apto", "apartamento", tipo))
Comprobamos los registros normalizados
##comprobamos los registros normalizados
table(vivienda$tipo)
##
## apartamento casa
## 5099 3220
Se revisaron otras variables como barrio y se identificó que tambièn es necesario normalizarla
table(vivienda$barrio)
##
## 20 de julio 3 de julio
## 3 1
## acopi agua blanca
## 158 1
## aguablanca aguacatal
## 2 109
## alameda alameda del rio
## 16 1
## alameda del río alamos
## 2 14
## alborada alcazares
## 1 2
## alférez real alferez real
## 5 2
## alfonso lopez alfonso lópez
## 1 21
## alfonso lópez i alto jordán
## 1 1
## altos de guadalupe altos de menga
## 4 3
## altos de santa antonio nariño
## 1 2
## aranjuez arboleda
## 15 5
## arboleda campestre candelaria arboledas
## 1 38
## atanasio girardot autopista sur
## 9 1
## bajo aguacatal barranquilla
## 1 6
## barrio 7de agosto barrio el recuerdo
## 1 1
## barrio eucarístico barrio obrero
## 1 1
## barrio tranquilo y base aérea
## 1 2
## belalcazar Belalcazar
## 3 1
## belisario caicedo bella suiza
## 2 18
## bella suiza alta bellavista
## 4 43
## benjamín herrera berlin
## 8 1
## bloques del limonar bochalema
## 1 33
## bolivariano bosques de alboleda
## 1 1
## bosques del limonar boyacá
## 21 1
## bretaña brisas de guadalupe
## 16 1
## brisas de los Brisas De Los
## 81 1
## brisas del guabito brisas del limonar
## 1 1
## Bueno Madrid buenos aires
## 1 7
## caldas Cali
## 1 37
## cali bella cali canto
## 1 1
## calibella calicanto
## 1 8
## calicanto viii calima
## 1 6
## calimio norte calipso
## 5 11
## cambulos camino real
## 3 35
## Camino Real campestre
## 1 1
## caney caney especial
## 88 5
## cañasgordas cañaveralejo
## 7 12
## cañaverales cañaverales los samanes
## 21 1
## capri cascajal
## 56 1
## cataya real ceibas
## 1 1
## centelsa centenario
## 1 15
## Centenario centro
## 1 4
## cerro cristales cerros de guadalupe
## 22 1
## champagnat chapinero
## 14 7
## chiminangos Chiminangos
## 17 1
## chiminangos 1 etapa chiminangos 2 etapa
## 1 2
## chipichape ciudad 2000
## 30 95
## Ciudad 2000 ciudad antejardin
## 1 1
## ciudad bochalema ciudad capri
## 48 13
## ciudad cordoba ciudad córdoba
## 20 15
## ciudad córdoba reservado ciudad country
## 1 1
## ciudad del campo ciudad jardin
## 1 22
## ciudad jardín Ciudad Jardín
## 516 2
## ciudad jardin pance ciudad los alamos
## 1 1
## ciudad los álamos ciudad mel√©ndez
## 25 1
## ciudad melendez ciudad modelo
## 1 7
## ciudad pacifica Ciudad Pacifica
## 2 1
## ciudad real ciudad talanga
## 3 1
## ciudad universitaria ciudadela comfandi
## 1 17
## ciudadela del río ciudadela melendez
## 1 1
## ciudadela paso ancho ciudadela pasoancho
## 1 21
## colinas de menga colinas del bosque
## 3 1
## colinas del sur colon
## 8 1
## colseguros colseguros andes
## 44 4
## Colseguros Andes comfenalco
## 1 1
## compartir conjunto gibraltar
## 1 1
## cristales cristobal colón
## 83 14
## cristóbal colón cuarto de legua
## 2 44
## departamental ed benjamin herrera
## 29 1
## el bosque El Bosque
## 49 1
## el caney El Caney
## 208 1
## el castillo el cedro
## 6 8
## el diamante el dorado
## 2 6
## el gran limonar el guabal
## 8 19
## el guabito el ingenio
## 1 202
## El Ingenio el ingenio 3
## 1 1
## el ingenio i el ingenio ii
## 19 21
## el ingenio iii el jardín
## 20 15
## el jordán el lido
## 1 59
## el limonar el nacional
## 135 1
## el paraíso el peñon
## 3 60
## el prado el refugio
## 2 120
## el rodeo el sena
## 1 1
## el trébol el troncal
## 5 19
## el vallado eucarístico
## 1 2
## evaristo garcía farrallones de pance
## 2 1
## fenalco kennedy fepicol
## 1 1
## flora flora industrial
## 1 16
## floralia fonaviemcali
## 6 1
## francisco eladio ramirez fuentes de la
## 1 1
## gaitan gran limonar
## 1 24
## granada guadalupe
## 15 21
## guadalupe alto guaduales
## 1 2
## guayaquil hacienda alferez real
## 16 1
## ingenio ingenio i
## 1 1
## ingenio ii jamundi
## 1 4
## jamundi alfaguara jorge eliecer gaitán
## 1 1
## jorge isaacs jose manuel marroquín
## 1 1
## juanamb√∫ juanambu
## 53 2
## junin junín
## 18 6
## la alborada la alianza
## 5 5
## la arboleda la base
## 18 15
## la buitrera la campiña
## 3 13
## la cascada la ceibas
## 7 1
## la esmeralda la flora
## 1 366
## La Flora la floresta
## 2 18
## la fortaleza la gran colombia
## 4 1
## la hacienda La Hacienda
## 164 2
## la independencia la libertad
## 12 2
## la luisa la merced
## 1 26
## la morada la nueva base
## 1 8
## la playa la portada al
## 1 1
## la primavera la reforma
## 1 1
## la rivera la rivera i
## 11 2
## la rivera ii la riverita
## 2 1
## la riviera la selva
## 1 11
## la villa del laflora
## 1 1
## lares de comfenalco las acacias
## 1 12
## las américas las camelias
## 3 1
## las ceibas las delicias
## 23 5
## las granjas las quintas de
## 10 1
## las vegas las vegas de
## 1 1
## libertadores los alamos
## 3 1
## los alcazares los alcázares
## 17 5
## los andes los cambulos
## 21 25
## los cámbulos los cristales
## 6 154
## los cristales club los farallones
## 1 4
## los guaduales Los Guaduales
## 25 1
## los guayacanes los jockeys
## 3 1
## los libertadores los parques barranquilla
## 4 6
## los robles lourdes
## 1 2
## mamellan manzanares
## 1 5
## mariano ramos marroquín iii
## 1 1
## mayapan las vegas meléndez
## 46 23
## melendez menga
## 52 23
## metropolitano del norte miradol del aguacatal
## 21 1
## miraflores Miraflores
## 25 1
## morichal de comfandi multicentro
## 3 27
## municipal napoles
## 3 2
## nápoles normandia
## 29 5
## normandía normandía west point
## 154 1
## norte norte la flora
## 9 1
## nueva base nueva floresta
## 1 15
## nueva tequendama oasis de comfandi
## 73 6
## oasis de pasoancho occidente
## 1 11
## pacara pacará
## 19 4
## palmas del ingenio pampa linda
## 1 26
## pampalinda panamericano
## 12 9
## pance Pance
## 409 3
## parcelaciones pance parque residencial el
## 61 1
## paseo de los paso del comercio
## 2 6
## pasoancho poblado campestre
## 6 2
## ponce popular
## 1 6
## portada de comfandi portales de comfandi
## 2 1
## porvenir prados de oriente
## 3 6
## prados del limonar Prados Del Limonar
## 20 1
## prados del norte Prados Del Norte
## 126 1
## prados del sur primavera
## 2 2
## primero de mayo primitivo crespo
## 37 3
## puente del comercio puente palma
## 6 1
## quintas de don Quintas De Don
## 72 1
## quintas de salomia rafael uribe uribe
## 4 1
## refugio rep√∫blica de israel
## 2 1
## rincon de la rincón de salomia
## 1 1
## riveras del valle rozo la torre
## 1 1
## saavedra galindo salomia
## 4 40
## samanes samanes de guadalupe
## 1 1
## sameco san antonio
## 1 24
## san bosco san carlos
## 8 4
## san cayetano san fernando
## 9 54
## San Fernando san fernando nuevo
## 1 10
## san fernando viejo san joaquin
## 18 4
## san joaquín san juan bosco
## 16 7
## san judas san judas tadeo
## 1 2
## san luis san luís
## 2 1
## san nicolas san nicolás
## 1 1
## san pedro san vicente
## 3 48
## santa santa anita
## 1 48
## Santa Anita santa anita sur
## 2 1
## santa bárbara santa elena
## 3 10
## santa fe santa helena de
## 8 1
## santa isabel Santa Isabel
## 63 1
## santa monica Santa Monica
## 51 1
## santa mónica santa mónica alta
## 3 1
## santa monica norte santa monica popular
## 2 2
## santa mónica popular santa monica residencial
## 7 5
## santa mónica residencial santa rita
## 39 45
## santa rosa santa teresita
## 1 262
## Santa Teresita Santafe
## 1 1
## santander santo domingo
## 1 5
## Santo Domingo sector aguacatal
## 1 1
## sector cañaveralejo guadalupe seminario
## 2 32
## sierras de normandía siete de agosto
## 1 8
## simón bolivar tejares cristales
## 1 4
## tejares de san templete
## 14 4
## tequendama tequendema
## 44 1
## terrón colorado torres de comfandi
## 1 57
## unicentro cali unión de vivienda
## 1 3
## urbanización barranquilla urbanización boyacá
## 4 1
## urbanización colseguros urbanizacion el saman
## 3 1
## urbanizacion gratamira urbanización la flora
## 1 83
## urbanización la merced urbanización la nueva
## 4 4
## urbanización las cascadas urbanizacion lili
## 1 2
## urbanización nueva granada urbanización pacara
## 3 1
## urbanización río lili urbanización san joaquin
## 5 4
## urbanización tequendama valle de lili
## 7 1
## valle del lili Valle Del Lili
## 1008 1
## valle grande versalles
## 1 71
## villa colombia villa de veracruz
## 6 6
## villa del lago villa del parque
## 10 1
## villa del prado Villa Del Prado
## 51 1
## villa del sol villa del sur
## 25 5
## villas de veracruz Villas De Veracruz
## 8 1
## vipasa zona centro
## 32 1
## zona norte zona norte los
## 32 1
## zona oeste zona oriente
## 26 18
## zona residencial zona sur
## 1 74
Se realiza correcciòn de tildes, caracteres especiales y normalización de mayúsculas y minúsculas.
vivienda <- vivienda %>%
mutate(barrio = gsub("é", "e", barrio))%>%
mutate(barrio = gsub("√∫", "u", barrio)) %>%
mutate(barrio = tolower(barrio))%>%
mutate(barrio = iconv(barrio, to = "ASCII//TRANSLIT"))
table(vivienda$barrio)
##
## 20 de julio 3 de julio
## 3 1
## acopi agua blanca
## 158 1
## aguablanca aguacatal
## 2 109
## alameda alameda del rio
## 16 3
## alamos alborada
## 14 1
## alcazares alferez real
## 2 7
## alfonso lopez alfonso lopez i
## 22 1
## alto jordan altos de guadalupe
## 1 4
## altos de menga altos de santa
## 3 1
## antonio narino aranjuez
## 2 15
## arboleda arboleda campestre candelaria
## 5 1
## arboledas atanasio girardot
## 38 9
## autopista sur bajo aguacatal
## 1 1
## barranquilla barrio 7de agosto
## 6 1
## barrio el recuerdo barrio eucaristico
## 1 1
## barrio obrero barrio tranquilo y
## 1 1
## base aerea belalcazar
## 2 4
## belisario caicedo bella suiza
## 2 18
## bella suiza alta bellavista
## 4 43
## benjamin herrera berlin
## 8 1
## bloques del limonar bochalema
## 1 33
## bolivariano bosques de alboleda
## 1 1
## bosques del limonar boyaca
## 21 1
## bretana brisas de guadalupe
## 16 1
## brisas de los brisas del guabito
## 82 1
## brisas del limonar bueno madrid
## 1 1
## buenos aires caldas
## 7 1
## cali cali bella
## 37 1
## cali canto calibella
## 1 1
## calicanto calicanto viii
## 8 1
## calima calimio norte
## 6 5
## calipso cambulos
## 11 3
## camino real campestre
## 36 1
## canasgordas canaveralejo
## 7 12
## canaverales canaverales los samanes
## 21 1
## caney caney especial
## 88 5
## capri cascajal
## 56 1
## cataya real ceibas
## 1 1
## centelsa centenario
## 1 16
## centro cerro cristales
## 4 22
## cerros de guadalupe champagnat
## 1 14
## chapinero chiminangos
## 7 18
## chiminangos 1 etapa chiminangos 2 etapa
## 1 2
## chipichape ciudad 2000
## 30 96
## ciudad antejardin ciudad bochalema
## 1 48
## ciudad capri ciudad cordoba
## 13 35
## ciudad cordoba reservado ciudad country
## 1 1
## ciudad del campo ciudad jardin
## 1 540
## ciudad jardin pance ciudad los alamos
## 1 26
## ciudad melendez ciudad modelo
## 2 7
## ciudad pacifica ciudad real
## 3 3
## ciudad talanga ciudad universitaria
## 1 1
## ciudadela comfandi ciudadela del rio
## 17 1
## ciudadela melendez ciudadela paso ancho
## 1 1
## ciudadela pasoancho colinas de menga
## 21 3
## colinas del bosque colinas del sur
## 1 8
## colon colseguros
## 1 44
## colseguros andes comfenalco
## 5 1
## compartir conjunto gibraltar
## 1 1
## cristales cristobal colon
## 83 16
## cuarto de legua departamental
## 44 29
## ed benjamin herrera el bosque
## 1 50
## el caney el castillo
## 209 6
## el cedro el diamante
## 8 2
## el dorado el gran limonar
## 6 8
## el guabal el guabito
## 19 1
## el ingenio el ingenio 3
## 203 1
## el ingenio i el ingenio ii
## 19 21
## el ingenio iii el jardin
## 20 15
## el jordan el lido
## 1 59
## el limonar el nacional
## 135 1
## el paraiso el penon
## 3 60
## el prado el refugio
## 2 120
## el rodeo el sena
## 1 1
## el trebol el troncal
## 5 19
## el vallado eucaristico
## 1 2
## evaristo garcia farrallones de pance
## 2 1
## fenalco kennedy fepicol
## 1 1
## flora flora industrial
## 1 16
## floralia fonaviemcali
## 6 1
## francisco eladio ramirez fuentes de la
## 1 1
## gaitan gran limonar
## 1 24
## granada guadalupe
## 15 21
## guadalupe alto guaduales
## 1 2
## guayaquil hacienda alferez real
## 16 1
## ingenio ingenio i
## 1 1
## ingenio ii jamundi
## 1 4
## jamundi alfaguara jorge eliecer gaitan
## 1 1
## jorge isaacs jose manuel marroquin
## 1 1
## juanambu junin
## 55 24
## la alborada la alianza
## 5 5
## la arboleda la base
## 18 15
## la buitrera la campina
## 3 13
## la cascada la ceibas
## 7 1
## la esmeralda la flora
## 1 368
## la floresta la fortaleza
## 18 4
## la gran colombia la hacienda
## 1 166
## la independencia la libertad
## 12 2
## la luisa la merced
## 1 26
## la morada la nueva base
## 1 8
## la playa la portada al
## 1 1
## la primavera la reforma
## 1 1
## la rivera la rivera i
## 11 2
## la rivera ii la riverita
## 2 1
## la riviera la selva
## 1 11
## la villa del laflora
## 1 1
## lares de comfenalco las acacias
## 1 12
## las americas las camelias
## 3 1
## las ceibas las delicias
## 23 5
## las granjas las quintas de
## 10 1
## las vegas las vegas de
## 1 1
## libertadores los alamos
## 3 1
## los alcazares los andes
## 22 21
## los cambulos los cristales
## 31 154
## los cristales club los farallones
## 1 4
## los guaduales los guayacanes
## 26 3
## los jockeys los libertadores
## 1 4
## los parques barranquilla los robles
## 6 1
## lourdes mamellan
## 2 1
## manzanares mariano ramos
## 5 1
## marroquin iii mayapan las vegas
## 1 46
## melendez menga
## 75 23
## metropolitano del norte miradol del aguacatal
## 21 1
## miraflores morichal de comfandi
## 26 3
## multicentro municipal
## 27 3
## napoles normandia
## 31 159
## normandia west point norte
## 1 9
## norte la flora nueva base
## 1 1
## nueva floresta nueva tequendama
## 15 73
## oasis de comfandi oasis de pasoancho
## 6 1
## occidente pacara
## 11 23
## palmas del ingenio pampa linda
## 1 26
## pampalinda panamericano
## 12 9
## pance parcelaciones pance
## 412 61
## parque residencial el paseo de los
## 1 2
## paso del comercio pasoancho
## 6 6
## poblado campestre ponce
## 2 1
## popular portada de comfandi
## 6 2
## portales de comfandi porvenir
## 1 3
## prados de oriente prados del limonar
## 6 21
## prados del norte prados del sur
## 127 2
## primavera primero de mayo
## 2 37
## primitivo crespo puente del comercio
## 3 6
## puente palma quintas de don
## 1 73
## quintas de salomia rafael uribe uribe
## 4 1
## refugio republica de israel
## 2 1
## rincon de la rincon de salomia
## 1 1
## riveras del valle rozo la torre
## 1 1
## saavedra galindo salomia
## 4 40
## samanes samanes de guadalupe
## 1 1
## sameco san antonio
## 1 24
## san bosco san carlos
## 8 4
## san cayetano san fernando
## 9 55
## san fernando nuevo san fernando viejo
## 10 18
## san joaquin san juan bosco
## 20 7
## san judas san judas tadeo
## 1 2
## san luis san nicolas
## 3 2
## san pedro san vicente
## 3 48
## santa santa anita
## 1 50
## santa anita sur santa barbara
## 1 3
## santa elena santa fe
## 10 8
## santa helena de santa isabel
## 1 64
## santa monica santa monica alta
## 55 1
## santa monica norte santa monica popular
## 2 9
## santa monica residencial santa rita
## 44 45
## santa rosa santa teresita
## 1 263
## santafe santander
## 1 1
## santo domingo sector aguacatal
## 6 1
## sector canaveralejo guadalupe seminario
## 2 32
## sierras de normandia siete de agosto
## 1 8
## simon bolivar tejares cristales
## 1 4
## tejares de san templete
## 14 4
## tequendama tequendema
## 44 1
## terron colorado torres de comfandi
## 1 57
## unicentro cali union de vivienda
## 1 3
## urbanizacion barranquilla urbanizacion boyaca
## 4 1
## urbanizacion colseguros urbanizacion el saman
## 3 1
## urbanizacion gratamira urbanizacion la flora
## 1 83
## urbanizacion la merced urbanizacion la nueva
## 4 4
## urbanizacion las cascadas urbanizacion lili
## 1 2
## urbanizacion nueva granada urbanizacion pacara
## 3 1
## urbanizacion rio lili urbanizacion san joaquin
## 5 4
## urbanizacion tequendama valle de lili
## 7 1
## valle del lili valle grande
## 1009 1
## versalles villa colombia
## 71 6
## villa de veracruz villa del lago
## 6 10
## villa del parque villa del prado
## 1 52
## villa del sol villa del sur
## 25 5
## villas de veracruz vipasa
## 9 32
## zona centro zona norte
## 1 32
## zona norte los zona oeste
## 1 26
## zona oriente zona residencial
## 18 1
## zona sur
## 74
Resultados
Una vez realizado la limpieza de la base de datos, se porcede a realizar los direntes análisis de la base de dato.
3.1 Inicialmente se abordará el precio de las viviendas en diferentes zonas.
vivienda %>% group_by(zona, tipo) %>%
summarise(mean = mean(preciom),median = median(preciom),min = min(preciom),max = max(preciom))
## `summarise()` has grouped output by 'zona'. You can override using the
## `.groups` argument.
## # A tibble: 10 × 6
## # Groups: zona [5]
## zona tipo mean median min max
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Zona Centro apartamento 187. 152. 100 400
## 2 Zona Centro casa 339. 310 148 1100
## 3 Zona Norte apartamento 285. 250 65 1580
## 4 Zona Norte casa 446. 390 89 1940
## 5 Zona Oeste apartamento 668. 570 85 1950
## 6 Zona Oeste casa 736. 680 135 1999
## 7 Zona Oriente apartamento 153. 115 58 1350
## 8 Zona Oriente casa 245. 235 80 750
## 9 Zona Sur apartamento 297. 245 75 1750
## 10 Zona Sur casa 612. 480 77 1900
view(vivienda)
## x must either be a summarytools object created with freq(), descr(), or a list of summarytools objects created using by()
Del gráfico anterior se puede deducir que:
En la Ciudad de Cali en la zonas oriente, norte y sur se consiguen los apartamentos màs económicos y en las zonas sur y oriente las casas más económicas.
Tanto las casas como apartamentos en la zona Oeste son cercanos a los 2.000 millones de pesos, consolidándose como la zona más costosa para adquirir estos inmuebles, aunque el pormedio de precios en esa zona es de 668 millones para apartamentos y 736 millones para casas.
3.2 Análisis por tipo de vivienda
vivienda %>%
count(tipo) %>%
arrange(desc(n))
## # A tibble: 2 × 2
## tipo n
## <chr> <int>
## 1 apartamento 5099
## 2 casa 3220
Como puede observarse el número de viviendas tipo apartamento es 5099 y a su vez el número de vivienda tipo casa es 3220 . De manera gráfica esto podría representarse de la siguiente manera:
# Gráfico de barras para distribución de tipo de vivienda
grafico_tipo <- ggplot(vivienda, aes(x = tipo, fill = tipo)) +
geom_bar(position = "stack", stat = "count") +
geom_text(
aes(label = scales::percent((..count..)/sum(..count..))),
stat = "count",
position = position_stack(vjust = 0.5),
size = 3,
show.legend = FALSE
) +
labs(title = "Gráfico Tipo de Vivienda", x = "Tipo de vivienda", y = "Número")
print(grafico_tipo)
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
En términos de porcentaje para la ciudad de Cali se tiene que el 61% de las viviendas es tipo apartamento y el 39% es casa.
3.3 Es preciso analizar como es la distribución del precio de la vivienda en Cali para ello se calcula el valor del metro cuadrado
vivienda$metro <- (vivienda$preciom/vivienda$areaconst)*1000000
3.4 Para analizar las características de las vviendas en Cali se revisa las variables más representativas como estrato, nùmero de habitaciones, nùmeor de baños etc
estrato <- ggplot(vivienda, aes(x = factor(estrato))) +
geom_bar(position = "stack", stat = "count", fill = "red") +
geom_text(
aes(label = scales::percent((..count..)/sum(..count..))),
stat = "count",
position = position_stack(vjust = 0.5),
size = 3,
show.legend = FALSE
) +
labs(title = "Gráfico por estrato", x = "Estrato", y = "Número de viviendas")
print(estrato)
La anterior gráfica muestra que las viviendas en Cali en el estrato 5 representan el 33.1% del total de viviendas ofertadas, lo que puede dar para revisar si es porque es màs rentable o si se debe implulsar los planes de vivienda en los otros estratos.
3.5 Análisis por número de baños
## analisis por número de baños
banios <- ggplot(vivienda, aes(x = factor(banios))) +
geom_bar(position = "stack", stat = "count", fill = "green") +
geom_text(
aes(label = scales::percent((..count..)/sum(..count..))),
stat = "count",
position = position_stack(vjust = 0.5),
size = 3,
show.legend = FALSE
) +
labs(title = "Gráfico por baños", x = "Número de baños ", y = "Número de viviendas")
print(banios)
La anterior gráfica nos indica que el 35.4 % de las viviendas en Cali tienen dos baños.
Discusión
Es importante realizar este tipo de análisis debiodo a que permite indetificar los sectores de la ciudad que pueden potencializarse teniendo en cuenta los diferentes aspectos económicos y sociales. Es por esto que este análisis pretendía enfocarse en la revisión de la base de datos que recoge el estado actual del campo de la vivienda en la CIudad de Cali y lograr determinar esas característica que van a permitir a las empresas constructoras lograr un mejor desarrollo.
Conclusiones
Se puede concluir que la zona oriente, norte y sur son las más económicas para la conmpra de apartamentos, por otra parte en las zonas sur y oriente las casas más económicas.
Tanto las casas como apartamentos en la zona Oeste es la màs costosa para la coompra tanto de casa como apartamentos.
En la ciudad de Cali se tiene que el 61% de las viviendas es tipo apartamento y el 39% es casa.
La mayorìa de las viviendas en Cali tienen entre dos y tres baños.
Anexos
Se anexa el script de R