INTRODUCCIÓN

En el presente trabajo analizaremos la base de datos del GCBA correspondiente a “Obras Iniciadas”. Listado de obras civiles, públicas y privadas, nuevas o de remodelación iniciadas (previamente registradas) en la Ciudad que cuentan con un profesional Director de Obra (DO) a cargo.

La dataset fue obtenido del portal de datos abiertos del GCBA (https://data.buenosaires.gob.ar/) y su fecha ultima de actualización corresponde al 7 de Septiembre de 2022.

El objeto del estudio será obtener estadísticas sobre las obras iniciadas en la CABA y dar respuesta a una serie de preguntas: * ¿En que comunas/barrios se iniciaron mas obras? * Estadísticas sobre los m2 a construir * Relaciones entre m2 y superficies de comunas/barrios * Otros interrogantes

Cargo las librerías de R a ser utilizadas durante la elaboración del proyecto.

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.2     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.2     ✔ tidyr     1.3.0
## ✔ purrr     1.0.1     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(sf)
## Linking to GEOS 3.9.3, GDAL 3.5.2, PROJ 8.2.1; sf_use_s2() is TRUE

Importo los datasets con los cuales voy a trabajar durante el presente trabajo.

base_obras_caba <- read.csv(file = "../entradas/obras-iniciadas.csv", stringsAsFactors = TRUE, encoding = "UTF-8")

barrios <- read.csv(file = "../entradas/barrios.csv", stringsAsFactors = TRUE, encoding = "UTF-8", sep = ";")

comunas <- read.csv(file = "../entradas/comunas.csv", stringsAsFactors = TRUE, encoding = "UTF-8", sep = ";")

Obtengo las primeras informaciones sobre las bases importadas.

str(base_obras_caba)
## 'data.frame':    7519 obs. of  23 variables:
##  $ periodo                : int  202002 202002 202002 202002 202002 202002 202002 202002 202002 202002 ...
##  $ long                   : num  -58.4 NA -58.4 -58.5 -58.4 ...
##  $ lat                    : num  -34.6 NA -34.6 -34.6 -34.6 ...
##  $ expediente             : Factor w/ 5518 levels "","  197492/2017",..: 1 3155 1025 1 688 1 2675 1329 1984 1 ...
##  $ calle                  : Factor w/ 1251 levels "11 DE SEPTIEMBRE DE 1888",..: 1080 1089 27 714 122 686 494 1081 365 1025 ...
##  $ calle_nro              : int  3208 4363 2434 2748 1872 74 2142 4272 91 3063 ...
##  $ seccion                : int  13 66 37 53 11 60 19 81 65 43 ...
##  $ manzana                : Factor w/ 829 levels "001","001 ","001A",..: 266 449 625 246 120 583 534 145 2 445 ...
##  $ parcela                : Factor w/ 528 levels "","000","0000",..: 17 14 63 374 31 265 208 176 177 126 ...
##  $ fecha_inicio_obra      : Factor w/ 746 levels "","2016-02-11",..: 663 63 18 1 134 1 1 612 1 1 ...
##  $ estado                 : Factor w/ 6 levels "Clausura parcial",..: 3 3 3 3 2 3 3 3 3 3 ...
##  $ ultimo_avo_solicitado  : Factor w/ 16 levels "","Demolición",..: 12 8 8 3 12 2 5 11 8 3 ...
##  $ fecha_ultimo_avo       : Factor w/ 867 levels "","2015-01-07",..: 833 397 670 822 1 1 865 775 1 1 ...
##  $ estado_tramite         : Factor w/ 57 levels "Alta de obra iniciada",..: 24 25 25 46 24 37 13 23 16 25 ...
##  $ profesional            : Factor w/ 2924 levels " ABACA SPOLZINO RODRIGO EZEQUIEL",..: 1602 1460 2124 1750 1870 676 718 1733 837 2865 ...
##  $ metros_a_construir     : num  973.4 2400 1479.6 1301 10.9 ...
##  $ fecha_estado_tramite   : Factor w/ 754 levels "2016-11-16","2016-12-22",..: 715 236 433 740 406 738 542 655 122 686 ...
##  $ tipo_obra              : Factor w/ 15 levels ""," ","AMPLIACION Y MODIFICACION C/DEMOLICION PARCIAL",..: 3 15 15 11 12 9 15 10 15 11 ...
##  $ destino                : Factor w/ 97 levels "","BANCO Y OFICINAS",..: 42 67 67 67 42 67 67 67 67 67 ...
##  $ barrio                 : Factor w/ 16 levels "","Comuna 1",..: 10 1 6 5 9 3 7 3 14 5 ...
##  $ comuna                 : int  1196 NA 1426 1430 1128 1407 1425 1417 1406 1429 ...
##  $ codigo_postal          : Factor w/ 49 levels "","Agronomia",..: 4 1 12 49 29 42 22 19 14 31 ...
##  $ codigo_postal_argentino: Factor w/ 5707 levels "","C1001AAB",..: 571 1 3965 4892 275 1804 3770 2969 1192 4658 ...
colnames(base_obras_caba)
##  [1] "periodo"                 "long"                   
##  [3] "lat"                     "expediente"             
##  [5] "calle"                   "calle_nro"              
##  [7] "seccion"                 "manzana"                
##  [9] "parcela"                 "fecha_inicio_obra"      
## [11] "estado"                  "ultimo_avo_solicitado"  
## [13] "fecha_ultimo_avo"        "estado_tramite"         
## [15] "profesional"             "metros_a_construir"     
## [17] "fecha_estado_tramite"    "tipo_obra"              
## [19] "destino"                 "barrio"                 
## [21] "comuna"                  "codigo_postal"          
## [23] "codigo_postal_argentino"
summary(base_obras_caba)
##     periodo            long             lat                 expediente  
##  Min.   :202002   Min.   :-58.53   Min.   :-34.69                :1679  
##  1st Qu.:202002   1st Qu.:-58.49   1st Qu.:-34.62   /0           :  12  
##  Median :202002   Median :-58.46   Median :-34.60   4787741/2015 :  11  
##  Mean   :202002   Mean   :-58.46   Mean   :-34.60   6836864/2018 :  11  
##  3rd Qu.:202002   3rd Qu.:-58.43   3rd Qu.:-34.58   16747721/2017:   9  
##  Max.   :202002   Max.   :-58.34   Max.   :-34.54   05123815/2018:   8  
##                   NA's   :115      NA's   :116      (Other)      :5789  
##                         calle        calle_nro        seccion     
##  CORDOBA AV.               :  56   Min.   :    0   Min.   : 1.00  
##  CALLE SIN NOMBRE OFICIAL  :  47   1st Qu.: 1130   1st Qu.:31.00  
##  ALBERDI, JUAN BAUTISTA AV.:  40   Median : 2410   Median :47.00  
##  TERRADA                   :  38   Mean   : 2597   Mean   :48.11  
##  PARAGUAY                  :  35   3rd Qu.: 3736   3rd Qu.:66.00  
##  QUESADA                   :  35   Max.   :12280   Max.   :98.00  
##  (Other)                   :7268                                  
##     manzana        parcela      fecha_inicio_obra
##  102    :  41   001    : 155             :4069   
##  034    :  39   002    : 107   2018-11-06:  25   
##  063    :  39   003    : 104   2018-02-07:  20   
##  009    :  38   003    : 103   2018-03-19:  20   
##  043    :  38   015    : 102   2018-07-23:  19   
##  007    :  37   016    : 102   2017-04-12:  18   
##  (Other):7287   (Other):6846   (Other)   :3348   
##                                    estado          ultimo_avo_solicitado
##  Clausura parcial                     :  47   En AVO 1        :1200     
##  Clausurada                           :  80   En AVO 4        :1065     
##  Normal                               :7307   En AVO 2        : 989     
##  Obra paralizada constatada por DGFYCO:   1   Demolición final: 966     
##  Paralizada                           :  78   En AVO 3        : 771     
##  Paralizada por desvinculación        :   6   Sin inicio      : 734     
##                                               (Other)         :1794     
##    fecha_ultimo_avo             estado_tramite                   profesional  
##            :1317    Obra finalizada    :1965   ILARI ELIAS GABRIEL     :  65  
##  2019-09-17:  35    En AVO 2           : 837   ARES HORACIO RAUL       :  57  
##  2019-04-12:  31    En AVO 1           : 806   TARASIDO JUAN PABLO     :  44  
##  2019-08-10:  29    En AVO 3           : 756   FUENTES OSCAR ANTONIO   :  33  
##  2019-05-09:  27    Carga finalizada   : 463   MONACO CLAUDIO SERGIO   :  33  
##  2019-10-09:  27    En demolición final: 321   DOMESTICO RAFAEL ERNESTO:  30  
##  (Other)   :6053    (Other)            :2371   (Other)                 :7257  
##  metros_a_construir fecha_estado_tramite
##  Min.   :     1     2017-10-07: 205     
##  1st Qu.:   410     2017-10-25: 170     
##  Median :  1100     2017-05-13: 104     
##  Mean   :  2271     2017-10-18:  74     
##  3rd Qu.:  2062     2020-02-07:  60     
##  Max.   :286681     2019-12-02:  59     
##  NA's   :931        (Other)   :6847     
##                                           tipo_obra   
##  DEMOLICION TOTAL Y OBRA NUEVA                 :3446  
##  OBRA NUEVA                                    :1585  
##  AMPLIACION Y MODIFICACION C/DEMOLICION PARCIAL:1039  
##  DEMOLICION TOTAL                              : 773  
##  MODIFICACION Y/O AMPLIACION                   : 223  
##  DEMOLICIÓN TOTAL Y OBRA NUEVA                 : 150  
##  (Other)                                       : 303  
##                    destino           barrio         comuna    
##  VIVIENDA MULTIFAMILIAR:4732   Comuna 12:1038   Min.   :1001  
##  OTROS                 :2178   Comuna 11: 822   1st Qu.:1406  
##                        : 383   Comuna 13: 707   Median :1417  
##  MULTIVIVIENDA         :  43   Comuna 15: 676   Mean   :1377  
##  VIVIENDA UNIFAMILIAR  :  17   Comuna 14: 650   3rd Qu.:1428  
##  vivienda multifamiliar:  13   Comuna 10: 556   Max.   :1440  
##  (Other)               : 153   (Other)  :3070   NA's   :155   
##        codigo_postal  codigo_postal_argentino
##  Palermo      : 650           : 161          
##  Caballito    : 490   C1427CHS:  11          
##  Villa Urquiza: 487   C1286AFW:   9          
##  Villa Devoto : 380   C1417AHH:   8          
##  Flores       : 332   C1427BTT:   8          
##  Belgrano     : 313   C1038AAB:   7          
##  (Other)      :4867   (Other) :7315

Corriendo el summary detecto algunas inconsistencias en los encabezados de algunas columnas, paso a renombrar las mismas y aprovecho para separar algunas columnas para luego poder vincular (left_join) por medio de un campo idéntico con otras bases. A su vez elimino todas las filas que contienen un campo NA y redondeo los M2 a construir.

base_obras_caba <- base_obras_caba %>% 
      rename(comunas=barrio, CP=comuna, barrio=codigo_postal) %>%
      mutate(NOM_COMUNAS = substr(comunas, 1, 6),
             COMUNAS = substr(comunas, 8,9)) %>%
      na.omit() %>%
      mutate(metros_a_construir = round(metros_a_construir)) %>%
      select(-NOM_COMUNAS)

Exporto la base para tenerla guardada.

write.csv(base_obras_caba, "../entradas/base_obras_caba_modificada.csv", row.names = FALSE)
base_obras_caba <- read.csv(file = "../entradas//base_obras_caba_modificada.csv", stringsAsFactors = TRUE, encoding = "UTF-8")

Verifico con un summary que se hayan aplicado las modificaciones ejecutadas y obtengo unas primeras estadisticas.

summary(base_obras_caba)
##     periodo            long             lat                 expediente  
##  Min.   :202002   Min.   :-58.53   Min.   :-34.69                :1421  
##  1st Qu.:202002   1st Qu.:-58.49   1st Qu.:-34.63   6836864/2018 :  11  
##  Median :202002   Median :-58.46   Median :-34.60   /0           :   9  
##  Mean   :202002   Mean   :-58.46   Mean   :-34.60   16747721/2017:   9  
##  3rd Qu.:202002   3rd Qu.:-58.43   3rd Qu.:-34.58   05123815/2018:   8  
##  Max.   :202002   Max.   :-58.34   Max.   :-34.54   05090897/2018:   7  
##                                                     (Other)      :4974  
##                         calle        calle_nro        seccion     
##  CORDOBA AV.               :  41   Min.   :    2   Min.   : 1.00  
##  ALBERDI, JUAN BAUTISTA AV.:  39   1st Qu.: 1130   1st Qu.:31.00  
##  TERRADA                   :  33   Median : 2412   Median :47.00  
##  DIRECTORIO AV.            :  32   Mean   : 2604   Mean   :48.47  
##  QUESADA                   :  31   3rd Qu.: 3730   3rd Qu.:67.00  
##  HELGUERA                  :  30   Max.   :12280   Max.   :98.00  
##  (Other)                   :6233                                  
##     manzana        parcela      fecha_inicio_obra
##  034    :  35   001    :  92             :3049   
##  043    :  35   011    :  88   2018-11-06:  25   
##  074    :  35   003    :  87   2018-03-19:  20   
##  020    :  34   015    :  86   2018-02-07:  19   
##  009    :  33   018    :  84   2018-07-23:  19   
##  064    :  33   016    :  83   2017-04-12:  17   
##  (Other):6234   (Other):5919   (Other)   :3290   
##                                    estado          ultimo_avo_solicitado
##  Clausura parcial                     :  47   En AVO 1        :1187     
##  Clausurada                           :  59   En AVO 4        :1005     
##  Normal                               :6251   En AVO 2        : 973     
##  Obra paralizada constatada por DGFYCO:   1   En AVO 3        : 716     
##  Paralizada                           :  76   Sin inicio      : 630     
##  Paralizada por desvinculación        :   5   Demolición final: 473     
##                                               (Other)         :1455     
##    fecha_ultimo_avo             estado_tramite
##            :1057    Obra finalizada    :1338  
##  2019-09-17:  34    En AVO 2           : 825  
##  2019-04-12:  29    En AVO 1           : 801  
##  2019-08-10:  28    En AVO 3           : 706  
##  2019-10-09:  27    Carga finalizada   : 417  
##  2019-05-09:  26    En demolición final: 279  
##  (Other)   :5238    (Other)            :2073  
##                               profesional   metros_a_construir
##  ILARI ELIAS GABRIEL                :  64   Min.   :     1    
##  ARES HORACIO RAUL                  :  49   1st Qu.:   402    
##  DOMESTICO RAFAEL ERNESTO           :  27   Median :  1069    
##  FUENTES OSCAR ANTONIO              :  26   Mean   :  2182    
##  SINTES VICENTE                     :  26   3rd Qu.:  2018    
##  VILLARPANDO GONZALEZ DANIEL ROBERTO:  23   Max.   :286681    
##  (Other)                            :6224                     
##  fecha_estado_tramite                                            tipo_obra   
##  2017-10-07: 158      DEMOLICION TOTAL Y OBRA NUEVA                   :3371  
##  2017-10-25: 144      OBRA NUEVA                                      :1446  
##  2017-05-13:  75      AMPLIACION Y MODIFICACION C/DEMOLICION PARCIAL  : 992  
##  2017-10-18:  74      MODIFICACION Y/O AMPLIACION                     : 216  
##  2019-12-02:  55      DEMOLICIÓN TOTAL Y OBRA NUEVA                   : 148  
##  2020-02-07:  49      AMPLIACIÓN Y MODIFICACIÓN CON DEMOLICIÓN PARCIAL: 114  
##  (Other)   :5884      (Other)                                         : 152  
##                    destino          comunas           CP      
##  VIVIENDA MULTIFAMILIAR:4315   Comuna 12: 913   Min.   :1001  
##  OTROS                 :1945   Comuna 11: 740   1st Qu.:1406  
##                        :  54   Comuna 15: 598   Median :1417  
##  MULTIVIVIENDA         :  43   Comuna 13: 584   Mean   :1378  
##  vivienda multifamiliar:   7   Comuna 14: 525   3rd Qu.:1428  
##  VIVIENDA UNIFAMILIAR  :   7   Comuna 10: 520   Max.   :1440  
##  (Other)               :  68   (Other)  :2559                 
##            barrio     codigo_postal_argentino    COMUNAS      
##  Palermo      : 525   C1427CHS:  11           Min.   : 1.000  
##  Caballito    : 432   C1286AFW:   9           1st Qu.: 6.000  
##  Villa Urquiza: 429   C1417AHH:   8           Median :11.000  
##  Villa Devoto : 348   C1427BTT:   8           Mean   : 9.668  
##  Flores       : 301   C1038AAB:   7           3rd Qu.:13.000  
##  Belgrano     : 262   C1427BSD:   7           Max.   :15.000  
##  (Other)      :4142   (Other) :6389

LIMPIEZA, TRATAMIENTO Y TRANSFORMACIÓN DE DATOS

Ejecuto algunos calculos asociaciados a M2 a construir por comunas sobre el total de la base sin filtrar.

base_obras_caba_calculos_m2_comunas <- base_obras_caba %>%
  select(metros_a_construir, comunas) %>%
  group_by(comunas) %>%
  summarise(min = min(metros_a_construir, na.rm = TRUE),           
          max = max(metros_a_construir, na.rm = TRUE),           
          media = mean(metros_a_construir, na.rm = TRUE)  ,          
          mediana = median(metros_a_construir, na.rm = TRUE)  ,          
          desvio = sd(metros_a_construir, na.rm = TRUE),         
          cv = desvio / media * 100) %>%
  arrange(desc(max))
head(base_obras_caba_calculos_m2_comunas)
## # A tibble: 6 × 7
##   comunas     min    max media mediana desvio    cv
##   <fct>     <int>  <int> <dbl>   <dbl>  <dbl> <dbl>
## 1 Comuna 1      1 286681 8204.   2577  21456.  262.
## 2 Comuna 4      1 239492 4462.   1480  15684.  352.
## 3 Comuna 12     1 103829 1522.    829   4729.  311.
## 4 Comuna 13     1  99483 2565.   1273   6023.  235.
## 5 Comuna 14     1  86524 3007.   1729   6030.  201.
## 6 Comuna 15     1  75999 1774.   1124.  4032.  227.

Ejecuto algunos cálculos asociados a M2 a construir por barrios sobre el total de la base sin filtrar.

base_obras_caba_calculos_m2_barrios <- base_obras_caba %>%
  select(metros_a_construir, barrio) %>%
  group_by(barrio) %>%
  summarise(min = min(metros_a_construir, na.rm = TRUE),           
          max = max(metros_a_construir, na.rm = TRUE),           
          media = mean(metros_a_construir, na.rm = TRUE)  ,          
          mediana = median(metros_a_construir, na.rm = TRUE)  ,          
          desvio = sd(metros_a_construir, na.rm = TRUE),         
          cv = desvio / media * 100) %>%
  arrange(desc(max))
head(base_obras_caba_calculos_m2_barrios)
## # A tibble: 6 × 7
##   barrio          min    max  media mediana desvio    cv
##   <fct>         <int>  <int>  <dbl>   <dbl>  <dbl> <dbl>
## 1 "Monserrat"      76 286681 11373.    2287 42450.  373.
## 2 "Boca"            1 239492 10136.    1203 39288.  388.
## 3 "Saavedra"        7 103829  1530.     776  6540.  427.
## 4 "Nu\\u00f1ez"     1  99483  2588.    1025  8356.  323.
## 5 "Palermo"         1  86524  3007.    1729  6030.  201.
## 6 "Chacarita"       1  75999  2521.    1297  7897.  313.

Agrupo la base total para obtener quien es Profesional que mas m2 a cargo tiene.

base_obras_caba_prof_sinfiltro <- base_obras_caba %>%
group_by(profesional) %>% 
summarise(sum = sum(metros_a_construir, na.rm = TRUE)) %>%
arrange(desc(sum))
head(base_obras_caba_prof_sinfiltro)
## # A tibble: 6 × 2
##   profesional                      sum
##   <fct>                          <int>
## 1 RZEPA MONICA FABIANA          472249
## 2 COLOMBO GUALTER LUIS          383531
## 3 FARJI ALBERTO RAUL            289844
## 4 LODEIRO BROS EZEQUIEL ARMANDO 247169
## 5 TARASIDO JUAN PABLO           244621
## 6 SAMBRESQUI GUILLERMO DANIEL   219213

Unifico el campo de calle y numero en una columna, aplico un filtrado de la base para VIVIENDAS MULTIFAMILIARES y genero una nueva columna con un campo para categorizar en rangos por m2 los tipos de obra. Luego ordeno toda la base de mayor a menor por m2.

base_obras_caba_filtrado_rangos <- base_obras_caba %>%
mutate(direccion = paste0(calle, " ", calle_nro)) %>%
select(lat, long, estado, estado_tramite, profesional, tipo_obra, destino, comunas, COMUNAS, barrio, direccion, metros_a_construir) %>%
filter(tipo_obra == "OBRA NUEVA", estado == "Normal" , destino == "VIVIENDA MULTIFAMILIAR") %>% 
mutate(sup_rango = case_when(metros_a_construir %in% c(1:30) ~ "Permiso de Micro Obra",                               
                             metros_a_construir %in% c(31:500) ~ "Permiso de Obra Menor",                              
                             metros_a_construir %in% c(501:2500) ~ "Permiso de Obra Media", 
                             metros_a_construir > 2500 ~ "Permiso de Obra Mayor")) %>%
arrange(desc(metros_a_construir))
head(base_obras_caba_filtrado_rangos)
##         lat      long estado                         estado_tramite
## 1 -34.61899 -58.44530 Normal                               En AVO 3
## 2 -34.59921 -58.42588 Normal                               En AVO 4
## 3 -34.57875 -58.44104 Normal                               En AVO 1
## 4 -34.61348 -58.36742 Normal Pedido de excavación al 10% autorizado
## 5 -34.60520 -58.52468 Normal Pedido de excavación al 10% autorizado
## 6 -34.58304 -58.42783 Normal                               En AVO 1
##                     profesional  tipo_obra                destino   comunas
## 1         GONZALEZ DIEGO MARTIN OBRA NUEVA VIVIENDA MULTIFAMILIAR  Comuna 6
## 2           BENITEZ OMAR CARLOS OBRA NUEVA VIVIENDA MULTIFAMILIAR  Comuna 5
## 3     GOMEZ LUENGO PABLO EMILIO OBRA NUEVA VIVIENDA MULTIFAMILIAR Comuna 13
## 4          RZEPA MONICA FABIANA OBRA NUEVA VIVIENDA MULTIFAMILIAR  Comuna 1
## 5 LODEIRO BROS EZEQUIEL ARMANDO OBRA NUEVA VIVIENDA MULTIFAMILIAR Comuna 11
## 6    CARPINACCI HORACIO EDUARDO OBRA NUEVA VIVIENDA MULTIFAMILIAR Comuna 14
##   COMUNAS       barrio                            direccion metros_a_construir
## 1       6    Caballito           GARCIA LORCA, FEDERICO 210              59044
## 2       5      Almagro                        ROCAMORA 4350              55692
## 3      13   Colegiales                            CONESA 12              49476
## 4       1    Monserrat REPUBLICA BOLIVARIANA DE VENEZUELA 2              42056
## 5      11 Villa Devoto                      LASTRA AV. 4290              41008
## 6      14      Palermo    FRAY JUSTO SANTAMARIA DE ORO 2142              39373
##               sup_rango
## 1 Permiso de Obra Mayor
## 2 Permiso de Obra Mayor
## 3 Permiso de Obra Mayor
## 4 Permiso de Obra Mayor
## 5 Permiso de Obra Mayor
## 6 Permiso de Obra Mayor
summary(base_obras_caba_filtrado_rangos)
##       lat              long                                          estado    
##  Min.   :-34.69   Min.   :-58.53   Clausura parcial                     :   0  
##  1st Qu.:-34.62   1st Qu.:-58.49   Clausurada                           :   0  
##  Median :-34.60   Median :-58.46   Normal                               :1014  
##  Mean   :-34.60   Mean   :-58.46   Obra paralizada constatada por DGFYCO:   0  
##  3rd Qu.:-34.58   3rd Qu.:-58.43   Paralizada                           :   0  
##  Max.   :-34.54   Max.   :-58.36   Paralizada por desvinculación        :   0  
##                                                                                
##                     estado_tramite                profesional 
##  Obra finalizada           :249    ILARI ELIAS GABRIEL  : 25  
##  En AVO 3                  :188    ARES HORACIO RAUL    :  8  
##  En AVO 2                  :166    GRADEL JOSE LEON     :  8  
##  En AVO 1                  :121    ALGAMIZ ADRIAN VICTOR:  7  
##  En AVO 4                  : 57    MONACO CLAUDIO SERGIO:  7  
##  Pedido de AVO 3 autorizado: 37    POTAP AARON JAVIER   :  7  
##  (Other)                   :196    (Other)              :952  
##                                             tipo_obra   
##  OBRA NUEVA                                      :1014  
##                                                  :   0  
##  AMPLIACION Y MODIFICACION C/DEMOLICION PARCIAL  :   0  
##  AMPLIACIÓN Y MODIFICACIÓN CON DEMOLICIÓN PARCIAL:   0  
##  DEMOLICION PARCIAL Y AMPLIACION DE OBRA         :   0  
##  DEMOLICION PARCIAL Y OBRA NUEVA                 :   0  
##  (Other)                                         :   0  
##                    destino          comunas       COMUNAS      
##  VIVIENDA MULTIFAMILIAR:1014   Comuna 12:144   Min.   : 1.000  
##                        :   0   Comuna 11:110   1st Qu.: 7.000  
##  BANCO Y OFICINAS      :   0   Comuna 14:109   Median :11.000  
##  COMERCIAL             :   0   Comuna 13: 99   Mean   : 9.825  
##  COMERCIO              :   0   Comuna 15: 95   3rd Qu.:13.000  
##  Comercio Minorista    :   0   Comuna 10: 70   Max.   :15.000  
##  (Other)               :   0   (Other)  :387                   
##            barrio     direccion         metros_a_construir  sup_rango        
##  Palermo      :109   Length:1014        Min.   :   97.0    Length:1014       
##  Villa Urquiza: 65   Class :character   1st Qu.:  879.2    Class :character  
##  Caballito    : 63   Mode  :character   Median : 1574.0    Mode  :character  
##  Belgrano     : 48                      Mean   : 3011.4                      
##  Flores       : 48                      3rd Qu.: 2881.5                      
##  Villa Devoto : 46                      Max.   :59044.0                      
##  (Other)      :635

Agrupo la base procesada por Barrio (VIVIENDA MULTIFAMILIAR).

base_obras_caba_barrio <- base_obras_caba_filtrado_rangos %>%
select(barrio, metros_a_construir) %>%
group_by(barrio) %>% 
summarise(cantidad = n(), sum = sum(metros_a_construir, na.rm = TRUE)) %>%
arrange(desc(cantidad))
head(base_obras_caba_barrio)
## # A tibble: 6 × 3
##   barrio        cantidad    sum
##   <fct>            <int>  <int>
## 1 Palermo            109 366405
## 2 Villa Urquiza       65 175092
## 3 Caballito           63 222746
## 4 Belgrano            48 223524
## 5 Flores              48 126550
## 6 Villa Devoto        46 147670

Agrupo la base procesada por Comuna (VIVIENDA MULTIFAMILIAR).

base_obras_caba_comunas <- base_obras_caba_filtrado_rangos %>%
select(COMUNAS, metros_a_construir) %>%
group_by(COMUNAS) %>% 
summarise(cantidad = n(), sum = sum(metros_a_construir, na.rm = TRUE)) %>%
arrange(desc(cantidad))
head(base_obras_caba_comunas)
## # A tibble: 6 × 3
##   COMUNAS cantidad    sum
##     <int>    <int>  <int>
## 1      12      144 298178
## 2      11      110 256727
## 3      14      109 366405
## 4      13       99 420840
## 5      15       95 208537
## 6      10       70  82867

Ejecuto un left_join con el dataset que posee información de la comunas para luego obtener una tasa de incidencia de m2 construidos sobre la superficie total de las comunas.

base_obras_caba_comunas_2 <- left_join(base_obras_caba_comunas, comunas, by = "COMUNAS") %>%
  mutate(m2_sup = sum/AREA * 100) %>%
  arrange(desc(m2_sup))
head(base_obras_caba_comunas_2)
## # A tibble: 6 × 10
##   COMUNAS cantidad    sum WKT          ID OBJETO BARRIOS PERIMETRO   AREA m2_sup
##     <dbl>    <int>  <int> <fct>     <int> <fct>  <fct>       <dbl>  <dbl>  <dbl>
## 1       6       63 222746 MULTIPOL…     3 LIMIT… CABALL…    10991. 6.85e6   3.25
## 2      13       99 420840 MULTIPOL…    15 LIMIT… BELGRA…    26199. 1.47e7   2.86
## 3       5       44 165910 MULTIPOL…     2 LIMIT… ALMAGR…    12323. 6.66e6   2.49
## 4      14      109 366405 MULTIPOL…     9 LIMIT… PALERMO    22127. 1.58e7   2.31
## 5      12      144 298178 MULTIPOL…     8 LIMIT… COGHLA…    17232. 1.56e7   1.91
## 6       4       58 414172 MULTIPOL…    13 LIMIT… BARRAC…    35423. 2.17e7   1.91

Agrupo la base procesada por Escala (VIVIENDA MULTIFAMILIAR).

base_obras_caba_escala <- base_obras_caba_filtrado_rangos %>%
select(sup_rango, metros_a_construir) %>%
group_by(sup_rango) %>% 
summarise(cantidad = n(), sum = sum(metros_a_construir, na.rm = TRUE) ) %>%
arrange(desc(cantidad))
head(base_obras_caba_escala)
## # A tibble: 3 × 3
##   sup_rango             cantidad     sum
##   <chr>                    <int>   <int>
## 1 Permiso de Obra Media      618  833862
## 2 Permiso de Obra Mayor      293 2184647
## 3 Permiso de Obra Menor      103   35043

Agrupo la base procesada por Profesional a cargo (VIVIENDA MULTIFAMILIAR).

base_obras_caba_prof <- base_obras_caba_filtrado_rangos %>%
select(profesional,metros_a_construir) %>%
group_by(profesional) %>% 
summarise(cantidad = n(), sum = sum(metros_a_construir, na.rm = TRUE)) %>%
arrange(desc(cantidad))
head(base_obras_caba_prof)
## # A tibble: 6 × 3
##   profesional           cantidad   sum
##   <fct>                    <int> <int>
## 1 ILARI ELIAS GABRIEL         25 13660
## 2 ARES HORACIO RAUL            8  5019
## 3 GRADEL JOSE LEON             8 25777
## 4 ALGAMIZ ADRIAN VICTOR        7  3799
## 5 MONACO CLAUDIO SERGIO        7 27418
## 6 POTAP AARON JAVIER           7 19365

VIZUALIZAMOS LA INFORMACIÓN PROCESADA

Genero un histograma con los m2 a construir facetado por comunas.

ggplot(base_obras_caba) + 
    geom_histogram(aes(x = metros_a_construir)) +
  labs(title = "Obras Iniciadas - CABA",
  subtitle = "Histograma - Fecha actualización: 07.09.2022",
  x = "m2",
  y = "cantidad de expedientes",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  theme_minimal() + 
  facet_wrap(~comunas)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Genero un gráfico de columnas con la cantidad de obras por comuna.

ggplot(data = base_obras_caba_comunas, aes(x = COMUNAS, y = cantidad)) +
  geom_col(fill = "Grey", alpha = 0.8) +
  coord_flip() + 
  labs(title = "Obras Iniciadas por Comuna - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Comunas",
  y = "Cantidad de Obras",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  geom_text(aes(label = cantidad), hjust=1, size=3)+ 
  theme_minimal() 

Genero un gráfico de columnas con la cantidad de obras por barrios.

ggplot(data = base_obras_caba_barrio, aes(x = barrio, y = cantidad)) +
  geom_col(fill = "Salmon", alpha = 0.8) +
  coord_flip() + 
  labs(title = "Obras Iniciadas por Barrio - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Barrios",
  y = "Cantidad de Obras",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  geom_text(aes(label = cantidad), hjust=1, size=4)+ 
  theme_minimal()

Genero un gráfico de barras con cantidad de obras por comunas/barrios/m2.

    ggplot(base_obras_caba_filtrado_rangos) +
    geom_bar(aes(x = comunas, weight = metros_a_construir, fill = barrio)) +
    coord_flip() +
  labs(title = "Obras Iniciadas por Comunas, Barrios y M2 - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Comunas",
  y = "M2",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)",
  fill = "Barrios") +
     scale_fill_viridis_d() +
  theme_minimal()

Genero un gráfico de barras con la tasa de incidencia de m2 sobre la superficie de cada comuna.

    ggplot(base_obras_caba_comunas_2) +
    geom_bar(aes(x = COMUNAS, weight= m2_sup), fill = "grey" , alpha = 0.9) +
  labs(title = "Obras Iniciadas por Comunas - Tasa de incidencia - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Comunas",
  y = "m2/sup.comuna",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  theme_minimal()

Genero un gráfico de columnas con la cantidad de obras según rangos de escala.

ggplot(data = base_obras_caba_escala, aes(x = sup_rango, y = cantidad)) +
  geom_col(fill = "Yellow",  alpha = 0.8) +
  coord_flip() + 
  labs(title = "Obras Iniciadas segun escala - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Rango de permisos",
  y = "Cantidad de obras",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  geom_text(aes(label = cantidad), hjust=1.5, size=4)+ 
  theme_minimal()

Genero un mapeo de puntos por comunas.

  ggplot(base_obras_caba_filtrado_rangos) +
  geom_point(aes(x=long, y=lat, color = comunas), size=3, alpha=.5) +
  labs(title = "Obras Iniciadas por comuna - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Longitud",
  y = "Latitud",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  theme_minimal() 

Genero un mapeo de puntos por comunas y por tipo de escala de la obra.

  ggplot(data= base_obras_caba_filtrado_rangos, aes(x=long, y=lat)) +
  geom_point(aes(color = comunas, size= metros_a_construir), alpha=.7 ) +
  labs(title = "Obras Iniciadas por comuna y por tipo de escala - CABA",
  subtitle = "Vivienda Multifamiliar - Fecha actualización: 07.09.2022",
  x = "Longitud",
  y = "Latitud",
  caption = "Fuente: Datos Abiertos CABA (https://data.buenosaires.gob.ar/)") +
  theme_minimal() 

COMENTARIOS FINALES

Luego del trabajo en el procesamiento del dataset se pudieron validar y evidenciar gráficamente las estadísticas presentadas uno de los primeros summary respecto a la información de obras iniciadas en CABA.

Algunos datos relevantes:

TODOS LOS DESTINOS

VIVIENDAS MULTIFAMILIARES

Final del TP.-