###TAREA CLASE 1### ##Ciencia de Datos para Ciudades## #Alumna Milagros Vidal#

Decidí utilizar una base de datos abierta de la Ciudad de Buenos Aires ya que actualmente estoy trabajando en el barrio 31 donde se estan incorporando nuevos mecanismos de denuncia a raiz de la voluntad de generar allí una unidad descentralizada de gestión política y administrativa como otras comunas de la ciudad. La base de datos elegida recompila todos los registros de denuncias, pedidos o quejas a través de los distintos canales de comunicación.

Primero realizo un head y un summary para tener una aproximación a los datos que contiene el dataset.

atencion2020 <- read.csv("atencionciudadana2020.csv", stringsAsFactors = TRUE)
head(atencion2020)
##      contacto periodo                              categoria
## 1 00000001/20  202001                              TRÃ\201NSITO
## 2 00000002/20  202001                              TRÃ\201NSITO
## 3 00000003/20  202001             ARBOLADO Y ESPACIOS VERDES
## 4 00000004/20  202001             ARBOLADO Y ESPACIOS VERDES
## 5 00000005/20  202001                LIMPIEZA Y RECOLECCIÓN
## 6 00000006/20  202001 FISCALIZACIÓN ACTIVIDADES COMERCIALES
##                subcategoria                                      concepto
## 1             DENUNCIA VIAL                     VEHÃ\215CULO MAL ESTACIONADO
## 2             DENUNCIA VIAL                     VEHÃ\215CULO MAL ESTACIONADO
## 3     PLANTACIÓN DE Ã\201RBOL                         PLANTACIÓN DE Ã\201RBOL
## 4     PLANTACIÓN DE Ã\201RBOL                         PLANTACIÓN DE Ã\201RBOL
## 5 LIMPIEZA DE VÃ\215A PÚBLICA RECOLECCIÓN DE RESIDUOS FUERA DEL CONTENEDOR
## 6 HABILITACIONES Y PERMISOS      ACTIVIDAD DE BAILE EFECTUADA SIN PERMISO
##   tipo_prestacion fecha_ingreso  hora_ingreso domicilio_cgpc domicilio_barrio
## 1        DENUNCIA    2020-01-01 01:09:05 a.m.       COMUNA 6        CABALLITO
## 2        DENUNCIA    2020-01-01 01:17:27 a.m.       COMUNA 4 PARQUE PATRICIOS
## 3       SOLICITUD    2020-01-01 01:17:53 a.m.      COMUNA 13       COLEGIALES
## 4       SOLICITUD    2020-01-01 01:19:07 a.m.      COMUNA 13       COLEGIALES
## 5       SOLICITUD    2020-01-01 01:19:43 a.m.      COMUNA 12          COGHLAN
## 6        DENUNCIA    2020-01-01 01:28:07 a.m.       COMUNA 4         BARRACAS
##                domicilio_calle domicilio_altura domicilio_esquina_proxima
## 1 PUEYRREDON, HONORIO, DR. AV.             1070                          
## 2                  CASEROS AV.             3223                          
## 3                        CONDE             1014                          
## 4        LACROZE, FEDERICO AV.             3160                          
## 5                   WASHINGTON             2519                          
## 6                     BRANDSEN             1474                          
##                   lat                long   canal    genero estado_del_contacto
## 1    -34.608243165909   -58.4451671012401 Comunas  Femenino             Cerrado
## 2   -34.6377387892868   -58.4096502205379 Comunas  Femenino             Cerrado
## 3   -34.5761428273626   -58.4535069261386 Comunas Masculino             Cerrado
## 4   -34.5776156276225 -58.449107631244104 Comunas Masculino             Abierto
## 5   -34.5659141136746 -58.472584847375096 Comunas  Femenino             Cerrado
## 6 -34.637692524741304   -58.3725592154604 Comunas Masculino             Cerrado
##   fecha_cierre_contacto
## 1            2020-01-01
## 2            2020-01-01
## 3            2020-01-07
## 4                      
## 5            2020-01-02
## 6            2020-01-02
summary(atencion2020)
##         contacto         periodo      
##  00000130/20:     2   Min.   :202001  
##  00000234/20:     2   1st Qu.:202002  
##  00000293/20:     2   Median :202006  
##  00000447/20:     2   Mean   :202006  
##  00000477/20:     2   3rd Qu.:202010  
##  00000541/20:     2   Max.   :202012  
##  (Other)    :574423                   
##                              categoria                         subcategoria   
##                                   :183946                            :185706  
##  TRÃ\201NSITO                        :120118   DENUNCIA VIAL            :108336  
##  LIMPIEZA Y RECOLECCIÓN          :116375   RESIDUOS VOLUMINOSOS     : 70768  
##  CALLES Y VEREDAS                 : 29681   CESTOS Y CONTENEDORES    : 26913  
##  ARBOLADO Y ESPACIOS VERDES       : 28909   LIMPIEZA DE VÃ\215A PÚBLICA: 18018  
##  RECICLADO Y PROTECCIÓN AMBIENTAL: 15719   REPARACIÓN DE VEREDA    : 15953  
##  (Other)                          : 79687   (Other)                  :148741  
##                                                           concepto     
##  VEHÃ\215CULO MAL ESTACIONADO                                    :105931  
##  RETIRO DE ESCOMBROS / RESTOS DE OBRA                         : 88923  
##  DESOBSTRUCCIÓN (VACTOR)                                     : 42107  
##  RETIRO DE RESIDUOS VOLUMINOSOS (MUEBLES Y ELECTRODOMÉSTICOS): 25926  
##  RETIRO DE RESTOS DE JARDINERÃ\215A DOMICILIARIA                 : 25078  
##  DESAGOTE DE POZO CIEGO (ATMOSFÉRICO)                        : 20254  
##  (Other)                                                      :266216  
##   tipo_prestacion      fecha_ingreso           hora_ingreso   
##  DENUNCIA :142717   2020-03-05:  4316   12:29:34 p.m.:    22  
##  QUEJA    : 68126   2020-03-04:  4293   02:38:34 p.m.:    20  
##  REPORTE  :  4247   2020-03-06:  4289   12:40:55 p.m.:    20  
##  SERVICIO :140192   2020-03-12:  3970   01:27:52 p.m.:    19  
##  SOLICITUD:219153   2020-03-09:  3951   02:11:54 p.m.:    19  
##                     2020-03-13:  3726   02:14:38 p.m.:    19  
##                     (Other)   :549890   (Other)      :574316  
##    domicilio_cgpc    domicilio_barrio                    domicilio_calle  
##  COMUNA 7 : 35599   FLORES   : 29527                             :122844  
##  COMUNA 12: 29736            : 23130   RIVADAVIA AV.             :  3879  
##  COMUNA 4 : 26960   PALERMO  : 19482   CORRIENTES AV.            :  2501  
##  COMUNA 11: 26485   BARRACAS : 16610   ALBERDI, JUAN BAUTISTA AV.:  2196  
##  COMUNA 10: 24073   Palermo  : 15443   SANTA FE AV.              :  1915  
##  12.0     : 23892   CABALLITO: 15348   BLANCO ENCALADA           :  1891  
##  (Other)  :407690   (Other)  :454895   (Other)                   :439209  
##  domicilio_altura               domicilio_esquina_proxima
##  Min.   :    1                               :552598     
##  1st Qu.: 1130    RIVADAVIA AV.              :   202     
##  Median : 2329    ESTOMBA                    :   177     
##  Mean   : 2544    AMENABAR                   :   150     
##  3rd Qu.: 3643    SOLDADO DE LA INDEPENDENCIA:   145     
##  Max.   :16486    MENDOZA                    :   135     
##  NA's   :144681   (Other)                    : 21028     
##                 lat                        long               canal       
##                   : 22986                    : 22986   147       :112399  
##  -34.6491969617196: 16511   -58.4404177642598: 16511   Comunas   :104979  
##  -34.6548185936464: 11308   -58.3984812816138: 11308   GCS Web   : 98116  
##  -34,6548185936464:  4803   -58,3984812816138:  4803   App BA 147: 64842  
##  -34,6491969617196:  3541   -58,4404177642598:  3541   App       : 64216  
##  -34.6747887091587:  3280   -58.4663941509314:  3280             : 54400  
##  (Other)          :512006   (Other)          :512006   (Other)   : 75483  
##        genero       estado_del_contacto fecha_cierre_contacto
##           : 73070   Abierto: 82463                : 82463    
##  Femenino :229948   Cerrado:491972      2020-03-10:  4943    
##  Masculino:270885                       2020-07-20:  3657    
##  Otros    :   532                       2020-02-03:  3613    
##                                         2020-03-09:  3592    
##                                         2020-07-01:  3590    
##                                         (Other)   :472577

Ahora activo el tidyverse para poder generar gráficos.

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.1.1     v dplyr   1.0.5
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
atencionbarrio <- filter(atencion2020, "domicilio_barrio">=15000)
summary(atencionbarrio)
##         contacto         periodo      
##  00000130/20:     2   Min.   :202001  
##  00000234/20:     2   1st Qu.:202002  
##  00000293/20:     2   Median :202006  
##  00000447/20:     2   Mean   :202006  
##  00000477/20:     2   3rd Qu.:202010  
##  00000541/20:     2   Max.   :202012  
##  (Other)    :574423                   
##                              categoria                         subcategoria   
##                                   :183946                            :185706  
##  TRÃ\201NSITO                        :120118   DENUNCIA VIAL            :108336  
##  LIMPIEZA Y RECOLECCIÓN          :116375   RESIDUOS VOLUMINOSOS     : 70768  
##  CALLES Y VEREDAS                 : 29681   CESTOS Y CONTENEDORES    : 26913  
##  ARBOLADO Y ESPACIOS VERDES       : 28909   LIMPIEZA DE VÃ\215A PÚBLICA: 18018  
##  RECICLADO Y PROTECCIÓN AMBIENTAL: 15719   REPARACIÓN DE VEREDA    : 15953  
##  (Other)                          : 79687   (Other)                  :148741  
##                                                           concepto     
##  VEHÃ\215CULO MAL ESTACIONADO                                    :105931  
##  RETIRO DE ESCOMBROS / RESTOS DE OBRA                         : 88923  
##  DESOBSTRUCCIÓN (VACTOR)                                     : 42107  
##  RETIRO DE RESIDUOS VOLUMINOSOS (MUEBLES Y ELECTRODOMÉSTICOS): 25926  
##  RETIRO DE RESTOS DE JARDINERÃ\215A DOMICILIARIA                 : 25078  
##  DESAGOTE DE POZO CIEGO (ATMOSFÉRICO)                        : 20254  
##  (Other)                                                      :266216  
##   tipo_prestacion      fecha_ingreso           hora_ingreso   
##  DENUNCIA :142717   2020-03-05:  4316   12:29:34 p.m.:    22  
##  QUEJA    : 68126   2020-03-04:  4293   02:38:34 p.m.:    20  
##  REPORTE  :  4247   2020-03-06:  4289   12:40:55 p.m.:    20  
##  SERVICIO :140192   2020-03-12:  3970   01:27:52 p.m.:    19  
##  SOLICITUD:219153   2020-03-09:  3951   02:11:54 p.m.:    19  
##                     2020-03-13:  3726   02:14:38 p.m.:    19  
##                     (Other)   :549890   (Other)      :574316  
##    domicilio_cgpc    domicilio_barrio                    domicilio_calle  
##  COMUNA 7 : 35599   FLORES   : 29527                             :122844  
##  COMUNA 12: 29736            : 23130   RIVADAVIA AV.             :  3879  
##  COMUNA 4 : 26960   PALERMO  : 19482   CORRIENTES AV.            :  2501  
##  COMUNA 11: 26485   BARRACAS : 16610   ALBERDI, JUAN BAUTISTA AV.:  2196  
##  COMUNA 10: 24073   Palermo  : 15443   SANTA FE AV.              :  1915  
##  12.0     : 23892   CABALLITO: 15348   BLANCO ENCALADA           :  1891  
##  (Other)  :407690   (Other)  :454895   (Other)                   :439209  
##  domicilio_altura               domicilio_esquina_proxima
##  Min.   :    1                               :552598     
##  1st Qu.: 1130    RIVADAVIA AV.              :   202     
##  Median : 2329    ESTOMBA                    :   177     
##  Mean   : 2544    AMENABAR                   :   150     
##  3rd Qu.: 3643    SOLDADO DE LA INDEPENDENCIA:   145     
##  Max.   :16486    MENDOZA                    :   135     
##  NA's   :144681   (Other)                    : 21028     
##                 lat                        long               canal       
##                   : 22986                    : 22986   147       :112399  
##  -34.6491969617196: 16511   -58.4404177642598: 16511   Comunas   :104979  
##  -34.6548185936464: 11308   -58.3984812816138: 11308   GCS Web   : 98116  
##  -34,6548185936464:  4803   -58,3984812816138:  4803   App BA 147: 64842  
##  -34,6491969617196:  3541   -58,4404177642598:  3541   App       : 64216  
##  -34.6747887091587:  3280   -58.4663941509314:  3280             : 54400  
##  (Other)          :512006   (Other)          :512006   (Other)   : 75483  
##        genero       estado_del_contacto fecha_cierre_contacto
##           : 73070   Abierto: 82463                : 82463    
##  Femenino :229948   Cerrado:491972      2020-03-10:  4943    
##  Masculino:270885                       2020-07-20:  3657    
##  Otros    :   532                       2020-02-03:  3613    
##                                         2020-03-09:  3592    
##                                         2020-07-01:  3590    
##                                         (Other)   :472577

Genero un gráfico de barras donde pueda comparar la cantidad de registros segun categoría.

ggplot()+
  geom_bar(data=atencion2020, aes(x=categoria))

La disposición del gráfico es ilegible por lo que invierto las variables y le agrego un título.

ggplot()+
  geom_bar(data=atencion2020, aes(x=categoria))+
  labs(title="cantidad y tipos de registros")+
  coord_flip()

Ahora quiero saber el tipo de prestacion de cada uno de estos registros.

ggplot(atencion2020) +
    geom_bar(aes(x = tipo_prestacion)) +
labs(title="TIPOS DE PRESTACION") +
  coord_flip()

A partir del gráfico generado, podemos ver como las solicitudes superan en al menos 3 veces a las quejas. Ahora quiero unir ambas variables para ver el tipo de prestación de cada una de las categorías.

ggplot(atencion2020) +
    geom_bar(aes(x =categoria, fill = tipo_prestacion)) +
    coord_flip()

Ahora quiero saber los tipos de prestaciones segun la comuna.

ggplot(atencion2020) +
    geom_bar(aes(x =domicilio_cgpc, fill = tipo_prestacion)) +
    coord_flip()

Ahora tambien quiero discernir por comuna pero por categoria de registro.

ggplot(atencion2020) +
    geom_bar(aes(x =domicilio_cgpc, fill = categoria)) +
    coord_flip()

Ahora activo el sf para poder manipular un archivo con información geográfica.

library(sf)
## Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
comunascaba <- st_read("comunas_wgs84.shp",
                          stringsAsFactors = TRUE)
## Reading layer `comunas_wgs84' from data source 
##   `C:\Users\admin\Desktop\FEPP_CSII\comunas_wgs84.shp' using driver `ESRI Shapefile'
## Simple feature collection with 15 features and 0 fields
## Geometry type: MULTIPOLYGON
## Dimension:     XY
## Bounding box:  xmin: -58.53152 ymin: -34.70529 xmax: -58.33515 ymax: -34.52649
## CRS:           NA

Ahora hago un summary y puedo ver que tengo solo una columna de geometria

summary(comunascaba)
##          geometry 
##  MULTIPOLYGON:15  
##  epsg:NA     : 0

A traves de la función ggplot hago mi primer mapa.

ggplot()+
  geom_sf(data=comunascaba)