###TAREA CLASE 1### ##Ciencia de Datos para Ciudades## #Alumna Milagros Vidal#
Decidí utilizar una base de datos abierta de la Ciudad de Buenos Aires ya que actualmente estoy trabajando en el barrio 31 donde se estan incorporando nuevos mecanismos de denuncia a raiz de la voluntad de generar allí una unidad descentralizada de gestión política y administrativa como otras comunas de la ciudad. La base de datos elegida recompila todos los registros de denuncias, pedidos o quejas a través de los distintos canales de comunicación.
Primero realizo un head y un summary para tener una aproximación a los datos que contiene el dataset.
atencion2020 <- read.csv("atencionciudadana2020.csv", stringsAsFactors = TRUE)
head(atencion2020)
## contacto periodo categoria
## 1 00000001/20 202001 TRÃ\201NSITO
## 2 00000002/20 202001 TRÃ\201NSITO
## 3 00000003/20 202001 ARBOLADO Y ESPACIOS VERDES
## 4 00000004/20 202001 ARBOLADO Y ESPACIOS VERDES
## 5 00000005/20 202001 LIMPIEZA Y RECOLECCIÓN
## 6 00000006/20 202001 FISCALIZACIÓN ACTIVIDADES COMERCIALES
## subcategoria concepto
## 1 DENUNCIA VIAL VEHÃ\215CULO MAL ESTACIONADO
## 2 DENUNCIA VIAL VEHÃ\215CULO MAL ESTACIONADO
## 3 PLANTACIÓN DE Ã\201RBOL PLANTACIÓN DE Ã\201RBOL
## 4 PLANTACIÓN DE Ã\201RBOL PLANTACIÓN DE Ã\201RBOL
## 5 LIMPIEZA DE VÃ\215A PÚBLICA RECOLECCIÓN DE RESIDUOS FUERA DEL CONTENEDOR
## 6 HABILITACIONES Y PERMISOS ACTIVIDAD DE BAILE EFECTUADA SIN PERMISO
## tipo_prestacion fecha_ingreso hora_ingreso domicilio_cgpc domicilio_barrio
## 1 DENUNCIA 2020-01-01 01:09:05 a.m. COMUNA 6 CABALLITO
## 2 DENUNCIA 2020-01-01 01:17:27 a.m. COMUNA 4 PARQUE PATRICIOS
## 3 SOLICITUD 2020-01-01 01:17:53 a.m. COMUNA 13 COLEGIALES
## 4 SOLICITUD 2020-01-01 01:19:07 a.m. COMUNA 13 COLEGIALES
## 5 SOLICITUD 2020-01-01 01:19:43 a.m. COMUNA 12 COGHLAN
## 6 DENUNCIA 2020-01-01 01:28:07 a.m. COMUNA 4 BARRACAS
## domicilio_calle domicilio_altura domicilio_esquina_proxima
## 1 PUEYRREDON, HONORIO, DR. AV. 1070
## 2 CASEROS AV. 3223
## 3 CONDE 1014
## 4 LACROZE, FEDERICO AV. 3160
## 5 WASHINGTON 2519
## 6 BRANDSEN 1474
## lat long canal genero estado_del_contacto
## 1 -34.608243165909 -58.4451671012401 Comunas Femenino Cerrado
## 2 -34.6377387892868 -58.4096502205379 Comunas Femenino Cerrado
## 3 -34.5761428273626 -58.4535069261386 Comunas Masculino Cerrado
## 4 -34.5776156276225 -58.449107631244104 Comunas Masculino Abierto
## 5 -34.5659141136746 -58.472584847375096 Comunas Femenino Cerrado
## 6 -34.637692524741304 -58.3725592154604 Comunas Masculino Cerrado
## fecha_cierre_contacto
## 1 2020-01-01
## 2 2020-01-01
## 3 2020-01-07
## 4
## 5 2020-01-02
## 6 2020-01-02
summary(atencion2020)
## contacto periodo
## 00000130/20: 2 Min. :202001
## 00000234/20: 2 1st Qu.:202002
## 00000293/20: 2 Median :202006
## 00000447/20: 2 Mean :202006
## 00000477/20: 2 3rd Qu.:202010
## 00000541/20: 2 Max. :202012
## (Other) :574423
## categoria subcategoria
## :183946 :185706
## TRÃ\201NSITO :120118 DENUNCIA VIAL :108336
## LIMPIEZA Y RECOLECCIÓN :116375 RESIDUOS VOLUMINOSOS : 70768
## CALLES Y VEREDAS : 29681 CESTOS Y CONTENEDORES : 26913
## ARBOLADO Y ESPACIOS VERDES : 28909 LIMPIEZA DE VÃ\215A PÚBLICA: 18018
## RECICLADO Y PROTECCIÓN AMBIENTAL: 15719 REPARACIÓN DE VEREDA : 15953
## (Other) : 79687 (Other) :148741
## concepto
## VEHÃ\215CULO MAL ESTACIONADO :105931
## RETIRO DE ESCOMBROS / RESTOS DE OBRA : 88923
## DESOBSTRUCCIÓN (VACTOR) : 42107
## RETIRO DE RESIDUOS VOLUMINOSOS (MUEBLES Y ELECTRODOMÉSTICOS): 25926
## RETIRO DE RESTOS DE JARDINERÃ\215A DOMICILIARIA : 25078
## DESAGOTE DE POZO CIEGO (ATMOSFÉRICO) : 20254
## (Other) :266216
## tipo_prestacion fecha_ingreso hora_ingreso
## DENUNCIA :142717 2020-03-05: 4316 12:29:34 p.m.: 22
## QUEJA : 68126 2020-03-04: 4293 02:38:34 p.m.: 20
## REPORTE : 4247 2020-03-06: 4289 12:40:55 p.m.: 20
## SERVICIO :140192 2020-03-12: 3970 01:27:52 p.m.: 19
## SOLICITUD:219153 2020-03-09: 3951 02:11:54 p.m.: 19
## 2020-03-13: 3726 02:14:38 p.m.: 19
## (Other) :549890 (Other) :574316
## domicilio_cgpc domicilio_barrio domicilio_calle
## COMUNA 7 : 35599 FLORES : 29527 :122844
## COMUNA 12: 29736 : 23130 RIVADAVIA AV. : 3879
## COMUNA 4 : 26960 PALERMO : 19482 CORRIENTES AV. : 2501
## COMUNA 11: 26485 BARRACAS : 16610 ALBERDI, JUAN BAUTISTA AV.: 2196
## COMUNA 10: 24073 Palermo : 15443 SANTA FE AV. : 1915
## 12.0 : 23892 CABALLITO: 15348 BLANCO ENCALADA : 1891
## (Other) :407690 (Other) :454895 (Other) :439209
## domicilio_altura domicilio_esquina_proxima
## Min. : 1 :552598
## 1st Qu.: 1130 RIVADAVIA AV. : 202
## Median : 2329 ESTOMBA : 177
## Mean : 2544 AMENABAR : 150
## 3rd Qu.: 3643 SOLDADO DE LA INDEPENDENCIA: 145
## Max. :16486 MENDOZA : 135
## NA's :144681 (Other) : 21028
## lat long canal
## : 22986 : 22986 147 :112399
## -34.6491969617196: 16511 -58.4404177642598: 16511 Comunas :104979
## -34.6548185936464: 11308 -58.3984812816138: 11308 GCS Web : 98116
## -34,6548185936464: 4803 -58,3984812816138: 4803 App BA 147: 64842
## -34,6491969617196: 3541 -58,4404177642598: 3541 App : 64216
## -34.6747887091587: 3280 -58.4663941509314: 3280 : 54400
## (Other) :512006 (Other) :512006 (Other) : 75483
## genero estado_del_contacto fecha_cierre_contacto
## : 73070 Abierto: 82463 : 82463
## Femenino :229948 Cerrado:491972 2020-03-10: 4943
## Masculino:270885 2020-07-20: 3657
## Otros : 532 2020-02-03: 3613
## 2020-03-09: 3592
## 2020-07-01: 3590
## (Other) :472577
Ahora activo el tidyverse para poder generar gráficos.
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.3 v purrr 0.3.4
## v tibble 3.1.1 v dplyr 1.0.5
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 1.4.0 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
atencionbarrio <- filter(atencion2020, "domicilio_barrio">=15000)
summary(atencionbarrio)
## contacto periodo
## 00000130/20: 2 Min. :202001
## 00000234/20: 2 1st Qu.:202002
## 00000293/20: 2 Median :202006
## 00000447/20: 2 Mean :202006
## 00000477/20: 2 3rd Qu.:202010
## 00000541/20: 2 Max. :202012
## (Other) :574423
## categoria subcategoria
## :183946 :185706
## TRÃ\201NSITO :120118 DENUNCIA VIAL :108336
## LIMPIEZA Y RECOLECCIÓN :116375 RESIDUOS VOLUMINOSOS : 70768
## CALLES Y VEREDAS : 29681 CESTOS Y CONTENEDORES : 26913
## ARBOLADO Y ESPACIOS VERDES : 28909 LIMPIEZA DE VÃ\215A PÚBLICA: 18018
## RECICLADO Y PROTECCIÓN AMBIENTAL: 15719 REPARACIÓN DE VEREDA : 15953
## (Other) : 79687 (Other) :148741
## concepto
## VEHÃ\215CULO MAL ESTACIONADO :105931
## RETIRO DE ESCOMBROS / RESTOS DE OBRA : 88923
## DESOBSTRUCCIÓN (VACTOR) : 42107
## RETIRO DE RESIDUOS VOLUMINOSOS (MUEBLES Y ELECTRODOMÉSTICOS): 25926
## RETIRO DE RESTOS DE JARDINERÃ\215A DOMICILIARIA : 25078
## DESAGOTE DE POZO CIEGO (ATMOSFÉRICO) : 20254
## (Other) :266216
## tipo_prestacion fecha_ingreso hora_ingreso
## DENUNCIA :142717 2020-03-05: 4316 12:29:34 p.m.: 22
## QUEJA : 68126 2020-03-04: 4293 02:38:34 p.m.: 20
## REPORTE : 4247 2020-03-06: 4289 12:40:55 p.m.: 20
## SERVICIO :140192 2020-03-12: 3970 01:27:52 p.m.: 19
## SOLICITUD:219153 2020-03-09: 3951 02:11:54 p.m.: 19
## 2020-03-13: 3726 02:14:38 p.m.: 19
## (Other) :549890 (Other) :574316
## domicilio_cgpc domicilio_barrio domicilio_calle
## COMUNA 7 : 35599 FLORES : 29527 :122844
## COMUNA 12: 29736 : 23130 RIVADAVIA AV. : 3879
## COMUNA 4 : 26960 PALERMO : 19482 CORRIENTES AV. : 2501
## COMUNA 11: 26485 BARRACAS : 16610 ALBERDI, JUAN BAUTISTA AV.: 2196
## COMUNA 10: 24073 Palermo : 15443 SANTA FE AV. : 1915
## 12.0 : 23892 CABALLITO: 15348 BLANCO ENCALADA : 1891
## (Other) :407690 (Other) :454895 (Other) :439209
## domicilio_altura domicilio_esquina_proxima
## Min. : 1 :552598
## 1st Qu.: 1130 RIVADAVIA AV. : 202
## Median : 2329 ESTOMBA : 177
## Mean : 2544 AMENABAR : 150
## 3rd Qu.: 3643 SOLDADO DE LA INDEPENDENCIA: 145
## Max. :16486 MENDOZA : 135
## NA's :144681 (Other) : 21028
## lat long canal
## : 22986 : 22986 147 :112399
## -34.6491969617196: 16511 -58.4404177642598: 16511 Comunas :104979
## -34.6548185936464: 11308 -58.3984812816138: 11308 GCS Web : 98116
## -34,6548185936464: 4803 -58,3984812816138: 4803 App BA 147: 64842
## -34,6491969617196: 3541 -58,4404177642598: 3541 App : 64216
## -34.6747887091587: 3280 -58.4663941509314: 3280 : 54400
## (Other) :512006 (Other) :512006 (Other) : 75483
## genero estado_del_contacto fecha_cierre_contacto
## : 73070 Abierto: 82463 : 82463
## Femenino :229948 Cerrado:491972 2020-03-10: 4943
## Masculino:270885 2020-07-20: 3657
## Otros : 532 2020-02-03: 3613
## 2020-03-09: 3592
## 2020-07-01: 3590
## (Other) :472577
Genero un gráfico de barras donde pueda comparar la cantidad de registros segun categoría.
ggplot()+
geom_bar(data=atencion2020, aes(x=categoria))
La disposición del gráfico es ilegible por lo que invierto las variables y le agrego un título.
ggplot()+
geom_bar(data=atencion2020, aes(x=categoria))+
labs(title="cantidad y tipos de registros")+
coord_flip()
Ahora quiero saber el tipo de prestacion de cada uno de estos registros.
ggplot(atencion2020) +
geom_bar(aes(x = tipo_prestacion)) +
labs(title="TIPOS DE PRESTACION") +
coord_flip()
A partir del gráfico generado, podemos ver como las solicitudes superan en al menos 3 veces a las quejas. Ahora quiero unir ambas variables para ver el tipo de prestación de cada una de las categorías.
ggplot(atencion2020) +
geom_bar(aes(x =categoria, fill = tipo_prestacion)) +
coord_flip()
Ahora quiero saber los tipos de prestaciones segun la comuna.
ggplot(atencion2020) +
geom_bar(aes(x =domicilio_cgpc, fill = tipo_prestacion)) +
coord_flip()
Ahora tambien quiero discernir por comuna pero por categoria de registro.
ggplot(atencion2020) +
geom_bar(aes(x =domicilio_cgpc, fill = categoria)) +
coord_flip()
Ahora activo el sf para poder manipular un archivo con información geográfica.
library(sf)
## Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
comunascaba <- st_read("comunas_wgs84.shp",
stringsAsFactors = TRUE)
## Reading layer `comunas_wgs84' from data source
## `C:\Users\admin\Desktop\FEPP_CSII\comunas_wgs84.shp' using driver `ESRI Shapefile'
## Simple feature collection with 15 features and 0 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -58.53152 ymin: -34.70529 xmax: -58.33515 ymax: -34.52649
## CRS: NA
Ahora hago un summary y puedo ver que tengo solo una columna de geometria
summary(comunascaba)
## geometry
## MULTIPOLYGON:15
## epsg:NA : 0
A traves de la función ggplot hago mi primer mapa.
ggplot()+
geom_sf(data=comunascaba)