Cali es la sede principal de la empresa B&C, por lo tanto, el siguiente informe dará un panorama sobre el estado actual del mercado inmobiliario en la ciudad de Cali.
Se realizará un análisis descriptivo de las principales variables a
tener en cuenta para cumplir con los objetivos de la investigación
plasmados a continuación.
# 2. Objetivos
Definir un nicho de mercado al cual enfocarse.
Desarrollar una estrategia de marketing que genere beneficios económicos a la empresa.
Establecer precios razonables a sus clientes y que estos queden
gratamente satisfechos con la atención prestada.
# 3. Métodos
Para realizar los análisis descriptivos de los datos vivienda_faltantes se realizaron los siguientes pasos:
Los pasos del 1 al 3 son presentados con detalles en el Anexo
1
# 4. Resultados
Al analizar los diagramas de cajas se puede observar que
existen datos atípicos que pueden sesgar la interpretación o análisis a
realizar utilizando la media por lo tanto es conveniente utilizar como
medida centrar la mediana.
medianas_Precio_Zonas <- aggregate(preciom ~ zona, data = datos9, FUN = median)
medianas_Precio_Zonasdatos8 %>%
group_by(zona) %>%
summarise(
Media = mean(preciom),
Mediana = median(preciom),
Desviacion_Estandar = sd(preciom)
)Al analizar las medianas se puede decir que las viviendas más
económicas se encuentran en la Zona Oriente mientras que las viviendas
más costosas se encuentran en la Zona Oeste. Mientras que las Zona
Centro y Norte tienen características similares con relación al precio
de venta.
## Tipo de viviendas más ofertadas en Cali.
El tipo de vivienda más ofertado en la Ciudad de Cali es el tipo
Apartamento.
Al comparar los precios de los tipos de vivienda se observa que
los apartamentos tienden a tener un menor precio que las Casas y podría
ser un nicho de mercado atractivo ya que existe una oferta considerable
en comparación con las casas y presentan un menor precio de
adquisición.
Del Analisis anterior se definio como nicho de mercado las viviendas
tipo apartamento, por lo tanto apartir de este punto solo se analiza
este tipo de datos.
datos_apartamentos = datos9 %>%
filter(tipo == "Apartamento")
ggplot(datos_apartamentos, aes(x = datos_apartamentos$estrato)) +
geom_bar()+
labs(title = "Cantidad de Apartamento por Estrato", x = "Estrato", y = "Frecuencia") +
theme_minimal()datos_apartamentos2 = datos_apartamentos %>%
filter(estrato == 4 |estrato == 5 |estrato == 6 )
ggplot(datos_apartamentos2, aes(x = datos_apartamentos2$parquea)) +
geom_bar()+
labs(title = "Cantidad de Apartamentos por No. Parqueadero", x = "No Parqueaderos", y = "Frecuencia") +
theme_minimal()
Reduciendo el nicho se escogerán apartamentos con 1 o 2
parqueaderos.
datos_apartamentos3 = datos_apartamentos2 %>%
filter(parquea == 1 |parquea == 2)
ggplot(datos_apartamentos3, aes(x = datos_apartamentos3$habitac)) +
geom_bar()+
labs(title = "Cantidad de Apartamentos por No. Habitaciones", x = "No. Habitaciones", y = "Frecuencia") +
theme_minimal()
Se concentrarán los esfuerzos en encontrar apartamentos que tengan entre 2 y 4 habitaciones.
datos_apartamentos4 = datos_apartamentos3 %>%
filter(habitac == 2 |habitac == 3 |habitac == 4)
ggplot(datos_apartamentos4, aes(x = datos_apartamentos4$banios)) +
geom_bar()+
labs(title = "Cantidad de Apartamentos por No. Baños", x = "No. Baños", y = "Frecuencia") +
theme_minimal()
Se concentrarán los esfuerzos en encontrar apartamentos que tengan entre
2 y 4 baños.
datos_apartamentos5 = datos_apartamentos4 %>%
filter(banios == 2 |banios == 3 |banios == 4)
datos_apartamentos5ggplot(datos_apartamentos5, aes(x = preciom)) +
geom_histogram(binwidth = 50, color = "black", fill = "gray") +
labs(title = "Histograma de Precios Viviendas (Datos Filtrados)",
x = "Precio (Millones)",
y = "Cantidad") +
theme_minimal()ggplot(datos_apartamentos5, aes(x = precio_m2)) +
geom_histogram(binwidth = 0.25, color = "black", fill = "gray") +
labs(title = "Histograma de Precios por Metro Cuadrado",
x = "Precio por metro cuadrado ($/m²)",
y = "Frecuencia") +
theme_minimal()Como nicho de mercado se definieron las viviendas tipo apartamentos, entre los estratos 4 y 6, que mínimo tenga 1 parqueadero y como máximo 2 parqueaderos, entre 2 y 4 habitaciones y entre 2 y 4 baños. definiendo así un nicho de 3293 viviendas de un total inicial de 8330.
Como estrategia de marketing se puede considerar ofrecer viviendas que su valor varíen entre los 2 y 3 millones de pesos por metro cuadrado ya que se pueden considerar viviendas a un precio asequible.
Al aplicar un análisis exploratorio de los datos se pudieron conocer con detalle las variables involucradas en el proceso, pudiendo determinar qué datos se podría considerar importantes o irrelevantes. En ese proceso se partió de un total de 8330 registros a tener cerca de 3293 datos que se pueden considerar más atractivos para la empresa B&C ya que esto permite tener una base de datos más interesante para los potenciales clientes de la empresa ahorrando, tiempo y dinero en el proceso de compra y venta de inmuebles.
La base de datos cuenta con 13 variables y 8330 registros, a
continuacion se describe cada una de las variables encontradas en la
base de datos.
## spc_tbl_ [8,330 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8330] 8312 8311 8307 8296 8297 ...
## $ zona : chr [1:8330] "Zona Oeste" "Zona Oeste" "Zona Oeste" "Zona Sur" ...
## $ piso : num [1:8330] 4 1 NA 2 NA NA 2 NA NA 2 ...
## $ estrato : num [1:8330] 6 6 5 3 5 5 6 5 5 5 ...
## $ preciom : num [1:8330] 1300 480 1200 220 330 1350 305 480 275 285 ...
## $ areaconst: num [1:8330] 318 300 800 150 112 390 125 280 74 120 ...
## $ parquea : num [1:8330] 2 1 4 1 2 8 2 4 1 2 ...
## $ banios : num [1:8330] 4 4 7 2 4 10 3 4 2 4 ...
## $ habitac : num [1:8330] 2 4 5 4 3 10 3 4 3 3 ...
## $ tipo : chr [1:8330] "Apartamento" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8330] "arboleda" "normandía" "miraflores" "el guabal" ...
## $ longitud : num [1:8330] -76576 -76571 -76568 -76565 -76565 ...
## $ latitud : num [1:8330] 3454 3454 3455 3417 3408 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parquea : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitac : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ","
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
De acuerdo a la grafica la variables con datos faltantes son
piso y parquea.
Se analiza la variable piso imputando por 0 los datos
faltantes y se analiza el comportamiento de la variable preciom
con respecto a esta.
Se podria decir que la variable piso es una variable de tipo
idenpendiente conrespecto a la variable preciom y se podria no
tomar encuenta esta variable para el analisis.
Al analizar la variable parquea de la misma forma la
variable piso encontramos que las variables parquea y
precio podrian tener una relacion de tipo dependiente, para
evitar agregar sesgos a la base de datos realizando imputacion con una
medida de tendencia central se prefiere no tener en cuenta estos datos
para el analisis.
Despues de realizar la limpieza de datos faltantes, podriamos decir
que tenemos un 80.72% de los registros iniciales y 1 variable menos a
analizar.
## [1] 80.72029
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1 2476 4478 4417 6433 8319
Esta variable no se considera como una variable estadística debido que marca la posición del registro, aunque es numérica no se repite.
## Length Class Mode
## 6724 character character
La variable Zona es considerada una variable de tipo cualitativa con una escala nominal y no presenta datos faltantes o datos ambiguos por lo tanto no se modifica.
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 64 1289 1103 163 4105
#### Tipo:
## Length Class Mode
## 6724 character character
##
## Apartamento APARTAMENTO apto casa Casa CASA
## 4191 42 4 11 2469 7
Es considerada una variable cualitativa con una escala ordinal,
los datos almacenados en esta variable deberían tener solo 2 valores
posibles “Apartamento” y “Casa” por lo tanto se realiza una
transformación de datos.
##
## Apartamento Casa
## 4237 2487
## 3 4 5 6
## 684 1642 2523 1875
Es considerada una variable cualitativa con una escala ordinal, aunque es numérica no obedece a un conteo.
Es considerada una variable cuantitativa continua.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 58.0 248.8 355.0 469.3 580.0 1999.0
Es considerada una variable cuantitativa continua.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 30.0 86.0 130.0 181.2 234.0 1745.0
ggplot(datos5, aes(y = areaconst, x = preciom, color = estrato, shape = tipo)) +
geom_point() +
labs(title = "Dispersión de Precio vs. Área por Tipo de Casa y Estrato",
y = "Área (m2)",
x = "Precio (Millones)",
color = "Estrato",
shape = "Tipo de Casa") +
facet_wrap(~ estrato) +
theme_minimal() +
scale_color_brewer(palette = "Set1")## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 1.000 2.000 1.836 2.000 10.000
Es considerada una variable cuantitativa discreta.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 2.000 3.000 3.257 4.000 10.000
Es considerada una variable cuantitativa discreta.
##
## 0 1 2 3 4 5 6 7 8 9 10
## 15 199 2230 1758 1292 805 279 93 36 12 5
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 3.000 3.000 3.611 4.000 10.000
Es considerada una variable cuantitativa discreta.
#### Barrio:
Es considerada una variable cualitativa con una escala nominal,
debido a la cantidad de errores de transcripcion no se utilizara en este
ejercicio.
## Length Class Mode
## 6724 character character
##
## 20 de julio 3 de julio
## 3 1
## acopi aguablanca
## 21 1
## aguacatal alameda
## 86 6
## alameda del río alamos
## 1 7
## alcazares alférez real
## 1 3
## alferez real alfonso lopez
## 1 1
## alfonso lópez alto jordán
## 10 1
## altos de guadalupe altos de menga
## 4 2
## altos de santa antonio nariño
## 1 1
## aranjuez arboleda
## 12 4
## arboleda campestre candelaria arboledas
## 1 37
## atanasio girardot autopista sur
## 5 1
## bajo aguacatal barranquilla
## 1 1
## barrio el recuerdo barrio obrero
## 1 1
## base aérea belalcazar
## 2 1
## belisario caicedo bella suiza
## 2 18
## bella suiza alta bellavista
## 4 40
## benjamín herrera bochalema
## 4 22
## bosques de alboleda bosques del limonar
## 1 15
## boyacá bretaña
## 1 8
## brisas de guadalupe brisas de los
## 1 34
## Brisas De Los brisas del limonar
## 1 1
## buenos aires caldas
## 6 1
## Cali cali bella
## 2 1
## cali canto calibella
## 1 1
## calicanto calicanto viii
## 6 1
## calima calimio norte
## 2 5
## cambulos camino real
## 3 32
## Camino Real campestre
## 1 1
## caney caney especial
## 67 4
## cañasgordas cañaveralejo
## 7 10
## cañaverales cañaverales los samanes
## 13 1
## capri cascajal
## 52 1
## cataya real centelsa
## 1 1
## centenario Centenario
## 13 1
## centro cerro cristales
## 1 22
## cerros de guadalupe champagnat
## 1 12
## chapinero chiminangos
## 2 2
## chipichape ciudad 2000
## 28 82
## Ciudad 2000 ciudad antejardin
## 1 1
## ciudad bochalema ciudad capri
## 38 13
## ciudad cordoba ciudad córdoba
## 5 1
## ciudad jardin ciudad jardín
## 21 494
## Ciudad Jardín ciudad jardin pance
## 2 1
## ciudad los alamos ciudad los álamos
## 1 12
## ciudad meléndez ciudad melendez
## 1 1
## ciudad modelo ciudad pacifica
## 5 1
## ciudad real ciudad talanga
## 3 1
## ciudadela comfandi ciudadela melendez
## 10 1
## ciudadela paso ancho ciudadela pasoancho
## 1 20
## colinas del bosque colinas del sur
## 1 5
## colon colseguros
## 1 37
## colseguros andes conjunto gibraltar
## 4 1
## cristales cristobal colón
## 80 6
## cristóbal colón cuarto de legua
## 1 42
## departamental el bosque
## 15 45
## El Bosque el caney
## 1 167
## El Caney el castillo
## 1 1
## el cedro el diamante
## 5 1
## el dorado el gran limonar
## 4 8
## el guabal el guabito
## 13 1
## el ingenio El Ingenio
## 198 1
## el ingenio 3 el ingenio i
## 1 19
## el ingenio ii el ingenio iii
## 21 19
## el jardín el lido
## 8 52
## el limonar el paraíso
## 120 1
## el peñon el prado
## 55 1
## el refugio el sena
## 111 1
## el trébol el troncal
## 3 10
## el vallado eucarístico
## 1 1
## evaristo garcía farrallones de pance
## 1 1
## fenalco kennedy flora
## 1 1
## flora industrial floralia
## 14 2
## francisco eladio ramirez fuentes de la
## 1 1
## gran limonar granada
## 24 13
## guadalupe guadalupe alto
## 19 1
## guaduales guayaquil
## 1 5
## hacienda alferez real ingenio
## 1 1
## ingenio i ingenio ii
## 1 1
## jamundi jamundi alfaguara
## 3 1
## jorge eliecer gaitán jorge isaacs
## 1 1
## juanamb√∫ juanambu
## 50 2
## junin junín
## 9 1
## la alborada la alianza
## 3 3
## la arboleda la base
## 17 8
## la buitrera la campiña
## 2 12
## la cascada la ceibas
## 6 1
## la esmeralda la flora
## 1 350
## La Flora la floresta
## 2 8
## la fortaleza la gran colombia
## 3 1
## la hacienda La Hacienda
## 160 2
## la independencia la libertad
## 7 1
## la merced la morada
## 25 1
## la nueva base la playa
## 2 1
## la portada al la primavera
## 1 1
## la reforma la rivera
## 1 4
## la rivera i la rivera ii
## 1 1
## la riverita la riviera
## 1 1
## la selva la villa del
## 9 1
## laflora las acacias
## 1 9
## las américas las camelias
## 2 1
## las ceibas las delicias
## 15 1
## las granjas las vegas
## 4 1
## las vegas de libertadores
## 1 1
## los alamos los alcazares
## 1 9
## los alcázares los andes
## 1 11
## los cambulos los cámbulos
## 24 5
## los cristales los cristales club
## 148 1
## los guaduales Los Guaduales
## 10 1
## los jockeys los libertadores
## 1 3
## los parques barranquilla los robles
## 5 1
## lourdes mamellan
## 2 1
## manzanares mayapan las vegas
## 5 42
## meléndez melendez
## 14 31
## menga metropolitano del norte
## 14 15
## miraflores Miraflores
## 22 1
## morichal de comfandi multicentro
## 1 24
## municipal napoles
## 1 2
## nápoles normandia
## 19 5
## normandía normandía west point
## 155 1
## norte la flora nueva floresta
## 1 7
## nueva tequendama oasis de comfandi
## 66 2
## oasis de pasoancho pacara
## 1 19
## pacará palmas del ingenio
## 4 1
## pampa linda pampalinda
## 23 10
## panamericano pance
## 5 397
## Pance parcelaciones pance
## 3 57
## paseo de los paso del comercio
## 2 4
## pasoancho poblado campestre
## 2 2
## ponce popular
## 1 2
## porvenir prados de oriente
## 1 4
## prados del limonar Prados Del Limonar
## 19 1
## prados del norte Prados Del Norte
## 103 1
## prados del sur primavera
## 2 1
## primero de mayo puente del comercio
## 29 2
## puente palma quintas de don
## 1 69
## Quintas De Don quintas de salomia
## 1 3
## rafael uribe uribe refugio
## 1 2
## rincon de la riveras del valle
## 1 1
## rozo la torre saavedra galindo
## 1 1
## salomia samanes
## 18 1
## sameco san antonio
## 1 10
## san bosco san carlos
## 2 2
## san cayetano san fernando
## 6 44
## San Fernando san fernando nuevo
## 1 10
## san fernando viejo san joaquin
## 15 4
## san joaquín san juan bosco
## 15 3
## san judas tadeo san luis
## 1 1
## san nicolás san pedro
## 1 2
## san vicente santa
## 33 1
## santa anita Santa Anita
## 44 2
## santa anita sur santa bárbara
## 1 2
## santa elena santa fe
## 6 3
## santa helena de santa isabel
## 1 60
## Santa Isabel santa monica
## 1 49
## Santa Monica santa mónica
## 1 2
## santa monica norte santa mónica popular
## 2 3
## santa monica residencial santa mónica residencial
## 5 37
## santa rita santa teresita
## 44 249
## Santa Teresita santo domingo
## 1 3
## sector aguacatal sector cañaveralejo guadalupe
## 1 2
## seminario sierras de normandía
## 32 1
## siete de agosto simón bolivar
## 7 1
## tejares cristales tejares de san
## 4 14
## templete tequendama
## 3 34
## torres de comfandi unicentro cali
## 24 1
## unión de vivienda urbanización barranquilla
## 1 1
## urbanización boyacá urbanización colseguros
## 1 3
## urbanizacion gratamira urbanización la flora
## 1 81
## urbanización la merced urbanización la nueva
## 4 1
## urbanización las cascadas urbanizacion lili
## 1 2
## urbanización nueva granada urbanización pacara
## 2 1
## urbanización río lili urbanización san joaquin
## 5 4
## urbanización tequendama valle del lili
## 6 837
## Valle Del Lili valle grande
## 1 1
## versalles villa colombia
## 65 5
## villa de veracruz villa del lago
## 2 1
## villa del parque villa del prado
## 1 14
## Villa Del Prado villa del sol
## 1 17
## villa del sur villas de veracruz
## 2 1
## vipasa zona norte
## 26 17
## zona norte los zona oeste
## 1 24
## zona oriente zona residencial
## 12 1
## zona sur
## 60
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -76576.00 -76516.00 -76.54 -21691.54 -76.52 -76.46
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.333 3.387 3.448 967.862 3365.000 3494.000
Estas variables indica la posición con respecto al meridiano de
Greenwich y la línea del ecuador, son consideradas unas variables
cuantitativas continuas, al analizar los datos se puede observar que
cuenta con un rango amplio y esto lleva a indicar que hay un error de
digitación ya que esta variable no puede variar significativamente en la
misma área de estudio, por lo tanto, se debe corregir este error
dividiendo por 1000 los datos que presentan anomalías.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -76.59 -76.54 -76.53 -76.53 -76.52 -76.46
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.333 3.379 3.412 3.415 3.451 3.498
ggplot(datos8, aes(y = latitud, x = longitud, color = zona, shape = tipo)) +
geom_point() +
labs(title = "Distribucion espacial de las Viviendas",
y = "Latitud",
x = "Longitud",
color = "Zona",
shape = "Tipo de Casa") +
theme_minimal() +
scale_color_brewer(palette = "Set1")