Introducción

Las ciudades, son espacios urbanos que han ido evolucionando constantemente gracias a quienes la habitan, pues el desarrollo humano permite crear economías a escalas que afectan principalmente al crecimiento de las ciudades. Una característica importante, es que tienen un centro, en el cual se puede encontrar gran parte de las actividades cotidianas: Trabajos, comercio, universidades, entre otros y también, poseen gran conectividad. Todas estas cualidades las podemos ver reflejadas en el Modelo Monocéntrico el cual dice que el piso en el centro es más caro y pequeño ya que tiene más demanda y a medida que se aleja, se puede acceder a pisos más baratos, con más superficies, pero implican mayor distancia a recorrer, es por esto, que se realizará una investigación estadística y espacial respecto al mercado inmobiliario de la comuna de Estación Central ubicada en Santiago de Chile. Para esto, se usarán bases de datos que contengan información respecto a viviendas, permisos y personas de la localidad elegida.

Contexto Comuna

Estación Central es una comuna de la región metropolitana, ubicada en el centro de la ciudad. En un comienzo, la zona era completamente rural, pero la construcción del ferrocarril logró que esta se urbanice ya que se crearon nuevas conectividades: El ferrocarril conectaba con Valparaíso y Concepción, creándose así las primeras oficinas en el sector. Debido a esto, la comuna fue creciendo a lo largo del tiempo, se instalaron hoteles, espacios sociales, universidades y comercio principalmente, además de viviendas, las cuales en la actualidad están sujetas a escándalos ya que principalmente son torres de gran magnitud y con malas instalaciones, por ejemplo, hay edificios de 30 pisos, con departamentos de pequeñas superficies y con bajas cantidades de ascensores, por ende, los tiempos de espera son muy altos para los habitantes y también, se dice que algunos de estos han sido construidos sin los permisos legales. Esto, también indica que hay una gran densidad de habitantes en la comuna ya que se dice que en 10 cuadras hay 30 edificios de 30 pisos cada uno, pero esto lo estudiaremos con mayor detalle a través de nuestros datos.

Base de Datos

Para nuestro análisis, usaremos diversas bases de datos:
+ La primera base, la llamamos Propiedades_RM, la cual presenta información respecto a las características de las viviendas en el sector: m2, baños, dormitorios, entre otros.
+ La segunda base, será Permisos_2017, la cual muestra principalmente información sobre los permisos para habitar o no las viviendas.
+ La tercera, corresponde a Personas_2017, la cual tiene la información del Censo 2017 realizado en Chile.
+ La cuarta, será viviendas_2017, la que contiene características de las viviendas, por ejemplo materiales, tipo de vivienda, entre otros.
+ Y finalmente, usaremos zc_censo2017, que presenta información necesaria para realizar mapas en nuestro estudio.

Todas estas bases corresponden están respaldadas por profesionales y además, son de fuente confiable.

Base_Venta <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/Propiedades_RM (1).rds")

Base_Permisos <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/Permisos_2017 (3).rds")

Base_Censo <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/personas_2017.rds")

Base_Censo2 <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/personas_2017.rds")

Santiagocentro <- (filter(Base_Censo,COMUNA == 13101 ))

Base_Censo <- (filter(Base_Censo,COMUNA == 13106 ))

Base_viviendas <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/viviendas_2017 (1).rds")
EECC_viviendas <- filter(Base_viviendas, COMUNA == 13106)


zc_censo2017 <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/zc_censo2017 (2).rds")

#zc_censo2017 <- readRDS("zc_censo2017.rds")

Filtrando para obtener Estación Central:

EECC <- filter(Base_Venta, codigo_comuna == 13106)
EECC_viviendas <- filter(Base_viviendas, COMUNA == 13106)
Santiagocentro<-(filter(Base_Censo,COMUNA==13106))
sum(is.na(EECC))
## [1] 0
sum(is.na(EECC_viviendas))
## [1] 0
sum(is.na(Santiagocentro))
## [1] 0

NO hay valores faltantes en las bases.

Análisis Estadístico y Espacial

summary(EECC)
##        ID              uf           m2_const       sup_terreno     
##  Min.   :  277   Min.   :  590   Min.   : 20.00   Min.   :  20.00  
##  1st Qu.:12012   1st Qu.: 1809   1st Qu.: 31.60   1st Qu.:  31.60  
##  Median :12350   Median : 2170   Median : 40.00   Median :  40.00  
##  Mean   :11370   Mean   : 2495   Mean   : 47.43   Mean   :  54.67  
##  3rd Qu.:12690   3rd Qu.: 2600   3rd Qu.: 50.00   3rd Qu.:  50.00  
##  Max.   :24666   Max.   :29000   Max.   :450.00   Max.   :1000.00  
##   dormitorios         baños       estacionamientos    bodegas      
##  Min.   : 1.000   Min.   :1.000   Min.   :0.0000   Min.   :0.0000  
##  1st Qu.: 1.000   1st Qu.:1.000   1st Qu.:0.0000   1st Qu.:0.0000  
##  Median : 2.000   Median :1.000   Median :0.0000   Median :0.0000  
##  Mean   : 1.737   Mean   :1.251   Mean   :0.3331   Mean   :0.0903  
##  3rd Qu.: 2.000   3rd Qu.:1.000   3rd Qu.:1.0000   3rd Qu.:0.0000  
##  Max.   :10.000   Max.   :6.000   Max.   :6.0000   Max.   :3.0000  
##      d_casa          d_proyecto       codigo_zona        codigo_comuna  
##  Min.   :0.00000   Min.   :0.00000   Min.   :1.311e+10   Min.   :13106  
##  1st Qu.:0.00000   1st Qu.:0.00000   1st Qu.:1.311e+10   1st Qu.:13106  
##  Median :0.00000   Median :0.00000   Median :1.311e+10   Median :13106  
##  Mean   :0.08734   Mean   :0.01258   Mean   :1.311e+10   Mean   :13106  
##  3rd Qu.:0.00000   3rd Qu.:0.00000   3rd Qu.:1.311e+10   3rd Qu.:13106  
##  Max.   :1.00000   Max.   :1.00000   Max.   :1.311e+10   Max.   :13106  
##  codigo_region    longitud         latitud      
##  Min.   :13    Min.   :-70.73   Min.   :-33.48  
##  1st Qu.:13    1st Qu.:-70.70   1st Qu.:-33.46  
##  Median :13    Median :-70.70   Median :-33.45  
##  Mean   :13    Mean   :-70.70   Mean   :-33.46  
##  3rd Qu.:13    3rd Qu.:-70.69   3rd Qu.:-33.45  
##  Max.   :13    Max.   :-70.68   Max.   :-33.44

Con nuestra primera observación a los datos de los inmuebles, ya se pueden notar datos interesantes respecto a la comuna de Estación Central:
+ Las variables uf, m2_cons, sup_terreno, dormitorios, baños y estacionamientos presentan gran cantidad de outliers, pues sus respectivas medias y medianas están muy alejadas de los máximos, por ejemplo, podríamos decir que las viviendas en Estación Central cuestan 2.495 UF en promedio, pero el máximo valor es de 29.000 UF.
+ Por otra parte, observando los estacionamientos, ocurre que en promedio son 0, el tercer cuartil recién es 1, lo cual indica que estos son muy bajos en la comuna ¿será una razón de esto las conectividades de vivir en el centro?
+ Otro aspecto interesante y similar ocurre con las bodegas, estas son muy bajas, casi 0 en promedio.

Análisis Distribuciones Variables:

par(mfcol = c(1, 2))
hist(EECC$dormitorios, main = "Histograma de Dormitorios", xlab = "Dormitorios", ylab="Frecuencia")
hist(EECC$baños, main = "Histograma de Baños",xlab = "Baños", ylab="Frecuencia")

Como se puede notar en los histogramas, en Estación Central la gran mayoría de las viviendas son de 1 dormitorio, luego siguen las de 2, el resto de los valores no tienen frecuencias muy altas. Ahora, respecto a los baños ocurre algo similiar, predominan las de 1 baño y le siguen las de 2 en una menor cantidad.

hist(EECC$estacionamientos, main = "Histograma de Estacionamientos",xlab = "Estacionamientos", ylab="Frecuencia")

hist(EECC$m2_const, main = "Histograma de m2",xlab = "m2", ylab="Frecuencia") # borrar desde 270

Los inmuebles en la comuna principalmente NO tienen estacionamiento, aún así, algunas tienen 1 estacionamiento, pero con mucha menor frecuencia. Por otra parte, las viviendas presentan bajo nivel de metros cuadrados construidos, pues el rango entre 0 - 50 m2 presenta una mayor (y notoria) frecuencia.

hist(EECC$sup_terreno, main = "Histograma Superficie del Terreno",xlab = "Superficie del Terreno", ylab="Frecuencia") # borrar desde 600

hist(EECC$uf, main = "Histograma UF",xlab = "UF", ylab="Frecuencia") # borrar desde 13000

Con la superficie del terreno ocurre algo similar a lo que hemos visto anteriormente, es decir, en general las viviendas son muy pequeñas en la comuna de estudio, mientras que sus precios rondan aproximadamente entre las 1000 y 2500 UF aproximadamente.

Ahora que entendemos como se distribuyen nuestras variables, procedemos a realizar una limpieza en nuestra base de datos, eliminando principalmente nuestros outliers:

EECC <- filter(EECC, dormitorios <= 6)
EECC <- filter(EECC, baños <= 4)
EECC <- filter(EECC, m2_const <= 270)
EECC <- filter(EECC, sup_terreno <= 600)
EECC <- filter(EECC, uf <= 13000)
##  [1] "COMUNA"        "REGION"        "PROVINCIA"     "DC"           
##  [5] "AREA"          "ZC_LOC"        "ID_ZONA_LOC"   "NVIV"         
##  [9] "NHOGAR"        "PERSONAN"      "P07"           "P08"          
## [13] "P09"           "P10"           "P10COMUNA"     "P10PAIS"      
## [17] "P11"           "P11COMUNA"     "P11PAIS"       "P12"          
## [21] "P12COMUNA"     "P12PAIS"       "P12A_LLEGADA"  "P12A_TRAMO"   
## [25] "P13"           "P14"           "P15"           "P15A"         
## [29] "P16"           "P16A"          "P16A_OTRO"     "P17"          
## [33] "P18"           "P19"           "P20"           "P21M"         
## [37] "P21A"          "P10PAIS_GRUPO" "P11PAIS_GRUPO" "P12PAIS_GRUPO"
## [41] "ESCOLARIDAD"   "P16A_GRUPO"    "CodCom2018"
Base_Censo_Variables <- cbind(Base_Censo$P15,Base_Censo$P15A,Base_Censo$P18,Base_Censo$P01,Base_Censo$P09)
Base_Censo_Variables <- c("Curso_aprobado", "Completado", "Rama_AAEE", "Tipo_vivienda","edad")

Ahora que tenemos nuestra base de datos limpia, pasaremos al análisis demográfico de Estación Central:

Análisis Hacinamiento:

EECC_viviendas <-
  EECC_viviendas %>% 
  filter(P04>0)
EECC_viviendas <-
  EECC_viviendas %>% 
  filter(P04<6)

EECC_viviendas$PER_DOMITORIO <- (EECC_viviendas$CANT_PER / EECC_viviendas$P04)

EECC_viviendas$hacinamiento <- ifelse(EECC_viviendas$PER_DOMITORIO >=2.5, 1,0)

na.exclude(EECC_viviendas$PER_DORMITORIO)
## NULL
#transformacion a factor
EECC_viviendas$hacinamiento<- as.factor(EECC_viviendas$hacinamiento)
class(EECC_viviendas$hacinamiento)
## [1] "factor"
EECC_viviendas$hacinamiento <- factor(EECC_viviendas$hacinamiento,
levels = c(1,0),
labels= c("Hacinado", "No hacinado"))

#Grafico de número de viviendas por su condición

ggplot(EECC_viviendas, aes(x = hacinamiento, )) +
  geom_bar(fill="red") +  labs(x="Condición de hacinamiento", y="Cantidad de hogares con hacinamiento", title="Cantidad de hogares con hacinamiento en comuna Estacion central")

Según el gráfico, podemos ver que al rededor de 5000 hogares se encuentran en un estado de hacinamiento, pero dominan los hogares que no están hacinados, pues son aproximadamente 30500.

Análisis Tipo de hogares

EECC_viviendas$P01 <- factor(EECC_viviendas$P01,
levels = c(1,2,3,4,5,6,7),
labels= c("Casas","Departamento","Vivienda indigena ", " Pieza conventillo", "Mediaagua","carpa","Otro"))

ggplot(data.frame(EECC_viviendas), aes(x=P01)) +
  geom_bar(fill="darkmagenta", width = 0.5, position= position_dodge(0.7))  +  labs(x="Tipo de hogar", y="Cantidad", title="Cantidad Tipo de hogares en comuna Estacion central") + coord_flip()

En el gráfico, podemos notar que en Estación Central predominan las Casas y Departamentos. Esto pareciera ser interesante ya que si recordamos los análisis anteriores, la gran mayoría presentan bajas superficies y 1 dormitorio generalmente, por ende, se podría decir que las casas son muy pequeñas en el área.

Análisis trabajo por Grupo Económico

#Filtrar el 98 que significa que no corresponde a ninguna respuesta coherente.

Base_Censo <-
  Base_Censo %>% 
  filter(!P18=="98")
Base_Censo <-
  Base_Censo %>% 
  filter(!P18=="99")
class(Base_Censo$P18)
## [1] "factor"
#Creacion etiquetas



ggplot(data.frame(Base_Censo), aes(x=P18)) +
  geom_bar(fill="green") +  labs(x="Sector de trabajo", y="Cantidad de trabajadores", title="Cantidad de personas trabajando por grupo economico")

En el gráfico anterior, es apreciable que la actividad económica que predomina es G, la cual representa al comercio al por mayor y al por menor y reparación de vehículos automotores y motocicletas. También es notable que descatan otras variables como Z que corresponde a una rama no identificada, F representa la construcción, H transporte y almacenamiento y N actividades de servicios administrativos y de apoyo, por lo tanto, podríamos decir que Estación Central es principalmente una comuna de comercio.

Análisis Nivel Educacional

Base_Censo <-
  Base_Censo %>% 
  filter(!ESCOLARIDAD=="99")
Base_Censo <-
  Base_Censo %>% 
  filter(!ESCOLARIDAD=="99")
summary(Base_Censo$ESCOLARIDAD)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   11.00   12.00   12.13   15.00   21.00
ggplot(Base_Censo, aes(x=ESCOLARIDAD)) + geom_density(col="blue") + 
  geom_histogram(aes(y=..density..), colour="black", fill=NA)  +  labs(x="Años de escolaridad", y="Densidad", title="Tendencia años escolaridad ")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Se puede decir que según los datos, las personas que viven en Estación Central, presentan estudios hasta el colegio aproximadamente, es decir, educación básica y media. La cantidad de personas que tienen educación superior son inferiores a los que terminaron el colegio.

Base_Censo2 <-
  Base_Censo2 %>% 
  mutate( # crear variables
    CODIGO_COMUNA   = COMUNA * 10 ^ 6, 
    DISTRITO_CENSAL = DC * 10 ^ 4,
    CODIGO_AREA     = AREA * 10 ^ 3, 
    ZC_LOC, 
    COD_INE_15 = as.numeric(CODIGO_COMUNA + DISTRITO_CENSAL + CODIGO_AREA + ZC_LOC)
  ) %>% 
  dplyr::select(COD_INE_15, COMUNA, P07, P08, P09, P15, ESCOLARIDAD, P18)

colnames(Base_Censo2) <- c("ZONA", "COMUNA","Parent", "Sexo", "Edad", "Educ_Nivel", "Escolaridad", "Rama_Econ")
cod_ae <- c(13106)
Educacion <- 
  Base_Censo2 %>% 
  dplyr::filter(!is.na(Escolaridad)) %>% 
  dplyr::filter(Parent==1) %>% 
  dplyr::filter(as.integer(COMUNA) %in% cod_ae) %>% 
  mutate(
    TOT_UNIV = ifelse(Educ_Nivel>=12,1,0)    # dummy para indicar si tiene un título universitario o no
  ) %>% 
  group_by(COMUNA) %>% 
  summarise(TOT_ZC = n(),
            PCTG_UNIV = 100*sum(TOT_UNIV)/TOT_ZC) 

Estudios sobre edad de la comuna

summary(Base_Censo$P09)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    15.0    29.0    38.0    40.4    51.0   100.0
summary(Santiagocentro$P09)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   21.00   34.00   36.56   52.00  100.00
#Tienen numeros muy parecidos

hist(Base_Censo$P09, main = "Distribution edad poblacion Estación Central", col = "lightblue",
xlab = "Edad", prob = TRUE)
lines(density(Base_Censo$P09))
abline(v = mean(Base_Censo$P09), lty = "dashed", col = "red")

En primer lugar, si comparamos las edades de Estación Central con Santiago Centro, la cual es una comuna colindante, podemos notar que se tienen números muy parecidos. Ahora, entrando en mayor detalle en la comuna de estudio, es apreciable que vive gente “joven”, en donde la edad promedio es 36 años.

Análisis edades, por zona censal

Base_Censo <-
  Base_Censo %>% 
  mutate( # crear variables
     CODIGO_COMUNA   = COMUNA * 10 ^ 6, 
    DISTRITO_CENSAL = DC * 10 ^ 4,
    CODIGO_AREA     = AREA * 10 ^ 3, 
    ZC_LOC, 
    COD_INE_15 = as.numeric(CODIGO_COMUNA + DISTRITO_CENSAL + CODIGO_AREA + ZC_LOC)
  ) 

Análisis hacinamiento por zona censal

#Analisis hacinamiento por zona censal
EECC_viviendas <-
  EECC_viviendas %>% 
  filter(P04>0) %>% 
   filter(P04<=6) %>% 
  mutate( # crear variables
    CODIGO_COMUNA   = COMUNA * 10 ^ 6, 
    DISTRITO_CENSAL = DC * 10 ^ 4,
    CODIGO_AREA     = AREA * 10 ^ 3, 
    ZC_LOC, 
    COD_INE_15 = as.numeric(CODIGO_COMUNA + DISTRITO_CENSAL + CODIGO_AREA + ZC_LOC),
    COD_VIV =  COD_INE_15* 10 ^ 4+NVIV,
    Per_Dorm = CANT_PER/P04,
    hacinamiento = ifelse(Per_Dorm>=2.5,1,0)
  )
#Grafico hacinamiento
ggplot(EECC_viviendas, aes(x=reorder(DISTRITO_CENSAL, hacinamiento, function(x)-length(x)))) +
geom_bar(fill='red') +  labs(x='Zona censal', y="Cantidad de hogares con hacinamiento", title="Cantidad de hogares con hacinamiento por zona censal")

En el histograma, es posible notar que por Zona Censal en Estación Central hay un alto valor en la gran mayoría.

zonas17 <- readRDS("C:/Users/franc/OneDrive - Universidad Adolfo Ibanez/MASTER BUSINESS ANAYLTICS 2022/Trimestre 2/Analitica Espacial/trabajo final/Bases/zc_censo2017 (2).rds")
class(zonas17) 
## [1] "sf"         "data.frame"
#Mapa
Educacion_ZC <- 
  Base_Censo2 %>% 
  dplyr::filter(!is.na(Escolaridad)) %>% 
  dplyr::filter(Parent==1) %>% 
  dplyr::filter(as.integer(COMUNA) %in% cod_ae) %>% 
  mutate(
    TOT_UNIV = ifelse(Educ_Nivel>=12,1,0)    # dummy para indicar si tiene un título universitario o no
  ) %>% 
  group_by(ZONA) %>% 
  summarise(TOT_ZC = n(),
            PCTG_UNIV = 100*sum(TOT_UNIV)/TOT_ZC) 


zonas17 <- 
  zonas17 %>% 
  dplyr::filter(as.integer(COMUNA) %in% cod_ae) %>% 
  left_join(Educacion_ZC, by = c("COD_INE_15"="ZONA"))
zonas17_urb <- zonas17 %>% 
  dplyr::filter(AREA==1)

#COROPLETO TRADICIONAL
tm_shape(zonas17_urb) +
  tm_fill("PCTG_UNIV",title="") +
  tm_borders() +
  tm_layout(legend.position = c("right", "bottom"))+
  tm_layout(main.title = "Porcentaje universitarios por Zona Censal", title.size = 1.5,main.title.position="right") 

En el mapa anterior, los colores más claros representan a un menor porcentaje de universitarios, mientras que los más oscuros, un mayor porcentaje. Es notable que predominan los de color claro.

Analisis econometrico

Analisis incial

EECC_ECO <- EECC %>% 
  dplyr::select(uf, m2_const, sup_terreno, dormitorios, baños, estacionamientos, bodegas)
st(EECC_ECO) 
Summary Statistics
Variable N Mean Std. Dev. Min Pctl. 25 Pctl. 75 Max
uf 1341 2420.542 1208.851 590 1806 2590 12269.226
m2_const 1341 46.044 25.475 20 31.4 50 230
sup_terreno 1341 52.648 48.503 20 31.4 50 510
dormitorios 1341 1.711 0.903 1 1 2 6
baños 1341 1.237 0.459 1 1 1 4
estacionamientos 1341 0.32 0.628 0 0 1 5
bodegas 1341 0.087 0.286 0 0 0 2

#Exploración de correlaciones

Correlacion_EECC_ECO <- cor(EECC_ECO, method = "pearson")
Correlacion_EECC_ECO
##                         uf  m2_const sup_terreno dormitorios     baños
## uf               1.0000000 0.7163969   0.7330210   0.6451562 0.5300214
## m2_const         0.7163969 1.0000000   0.8404217   0.8218935 0.5841014
## sup_terreno      0.7330210 0.8404217   1.0000000   0.7499328 0.4810084
## dormitorios      0.6451562 0.8218935   0.7499328   1.0000000 0.5977393
## baños            0.5300214 0.5841014   0.4810084   0.5977393 1.0000000
## estacionamientos 0.4780764 0.5200506   0.5516426   0.5179100 0.3683937
## bodegas          0.1240944 0.1138883   0.1076132   0.1026386 0.1049012
##                  estacionamientos   bodegas
## uf                      0.4780764 0.1240944
## m2_const                0.5200506 0.1138883
## sup_terreno             0.5516426 0.1076132
## dormitorios             0.5179100 0.1026386
## baños                   0.3683937 0.1049012
## estacionamientos        1.0000000 0.1987935
## bodegas                 0.1987935 1.0000000
ggplot(EECC, aes(x = m2_const, y = uf, color = d_casa )) + geom_point() + geom_smooth() + theme_gray()
## `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'

colnames(EECC)
##  [1] "ID"               "uf"               "m2_const"         "sup_terreno"     
##  [5] "dormitorios"      "baños"            "estacionamientos" "bodegas"         
##  [9] "d_casa"           "d_proyecto"       "codigo_zona"      "codigo_comuna"   
## [13] "codigo_region"    "longitud"         "latitud"

Se puede ver que los departamentos tienen un comportamiento bastante homogéneo respecto a su relación de tamaño y precio, lo que se significa, respaldado en el gráfico, que tenemos muchos departamento en un rango acotado de metros cuadrado, con solo algunas propiedades de este tipo que se despegan hacia precio más altos dada la misma cantidad de espacio. Por otro lado, las casa son mucho más dispersas, lo que se traduce en propiedades con mayor variedad de combinaciones precio-m2_construidos

hasc<-select(EECC_viviendas,COD_INE_15,Per_Dorm,hacinamiento)
hasc<-hasc %>% group_by(COD_INE_15) %>% summarise(TOT_zc=n(),PCTG_HAC=100*sum(hacinamiento)/TOT_zc)
zonas17<-zonas17 %>%  left_join(hasc,by=c("COD_INE_15"="COD_INE_15"))
zonas17_urb<-zonas17_urb %>%  left_join(hasc,by=c("COD_INE_15"="COD_INE_15"))
tm_shape(zonas17_urb) +
  tm_fill("PCTG_HAC",title="",n=6, style = "quantile") +
  tm_borders() +
  tm_layout(legend.position = c("right", "bottom"))+
  tm_layout(main.title = "Porcentaje de hacinamiento por Zona Censal", title.size = 1.5,main.title.position="right")

En este mapa podemos observar que los niveles de hacinamiento en la Estación Central por zona censal, está esparcida por toda comuna teniendo concentraciones notables en el lado derecho del mapa anterior, por lo tanto, podemos decir que están agrupadas en un lado de la comuna.

Base_Permisos_EECC<-subset(Base_Permisos,Base_Permisos$COD_COMUNA==13106)

ggplot(data.frame(Base_Permisos_EECC), aes(x=USO_DESTIN)) +
  geom_bar(fill="darkmagenta", width = 0.5, position= position_dodge(0.7))  +  labs(x="Tipo de hogar", y="Cantidad", title="Cantidad Tipo de hogares en comuna Estacion central")

En este histograma podemos observar la cantidad de tipos de hogar en la zona de Estación Central, donde la mayoría son del tipo habitacional.

## [1] "character"
ggplot(data.frame(Base_Permisos_EECC), aes(x=USO_DESTIN, fill=NUM_PISOS)) +
  geom_bar(width = 0.5, position= position_dodge(0.7))  +  labs(x="Tipo de hogar", y="Cantidad", title="Cantidad Tipo de hogares en comuna Estacion central")

En el gráfico anterior, se puede observar los diferentes tipos de hogar, con relacion con los pisos contruidos, en donde la mayoria son hogares de tipo habitacional.

#Base_Permisos_EECC_p1<-Base_Permisos[Base_Permisos$USO_DESTIN=="HABITACIONAL"|Base_Permisos$USO_DESTIN=="MIXTO",]

#tm_shape(zonas17_urb) + tm_polygons(c("PCTG_HAC", "PCTG_UNIV")) + tm_shape(Base_Permisos_EECC_p1)+tm_dots()
 #   tm_facets(sync = TRUE, ncol = 2)

En los gráficos anteriores buscan mostrar la relación de las propiedades tipo vivienda o mixta , con la cantidad la cantidad de hacianamiento y la escolaridad. Al mismo tiempo, podemos concluir que la relación entre hacinamiento y dueños de hogar con nivel educacional universitario es aparentente inverso, ya que donde hay menos hacinamiento, hay más personas universitarias dueñas del hogar. El hacianmiento tiene una relación obvia y es confirmada con los permisos habitacionales dibujados en el mapa.

Conclusión

Para concluir, en terminos generales se puede decir que Estación Central es una comuna que está ubicada en el centro de Santiago, la cual tiene muchas viviendas, comercio y conectividades. Al estudiar, las viviendas y las personas del lugar, podemos notar que principamente vive gente joven, con nivel educacional básica y media completa, y generalmente se dedican al comercio. Al analizar las viviendas, ocurre algo interesante, pues es notable que estas son muy pequeñas en m2 y con bajos dormitorios y baños, en donde además, existen viviendas habitacionales que superan los 30 pisos. Por otra parte, notando el nivel de hacinamiento, se puede notar que esta es muy alta y concentrada al analizarla por zona censal, lo cual se puede respaldar al momento de analizar los permisos habitacionales, por lo tanto, podemos decir que Estación Central es una comuna en donde, aparentemente, el modelo monocéntrico hace sentido, pues hay alto nivel de comercio, las viviendas son pequeñas para regular la demanda y existen buenas conexiones al estar ubicados en el centro.