library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.4 v dplyr 1.0.7
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 2.0.1 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(sf)
## Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
El dataset cargado es:
barrios_caba_mapa <- st_read("https://cdn.buenosaires.gob.ar/datosabiertos/datasets/barrios/barrios.geojson", stringsAsFactors=TRUE)
## Reading layer `barrios_badata_wgs84' from data source
## `https://cdn.buenosaires.gob.ar/datosabiertos/datasets/barrios/barrios.geojson'
## using driver `GeoJSON'
## Simple feature collection with 48 features and 6 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -58.53152 ymin: -34.70529 xmax: -58.33515 ymax: -34.52649
## Geodetic CRS: WGS 84
barrios_caba <- read.csv("barrios_caba.csv", stringsAsFactors = TRUE)
seleccion_barrios_caba <- select(barrios_caba, barrio, comuna, perimetro, area)
Con este dataset sabemos que hay 48 observaciones, es decir, filas y 4 variables, es decir, columnas (barrio, comuna, perimetro y area)
summary(seleccion_barrios_caba)
## barrio comuna perimetro area
## AGRONOMIA: 1 Min. : 1.000 Min. : 4531 Min. : 1232270
## ALMAGRO : 1 1st Qu.: 4.000 1st Qu.: 6554 1st Qu.: 2222027
## BALVANERA: 1 Median : 9.500 Median : 8254 Median : 3679709
## BARRACAS : 1 Mean : 8.458 Mean : 9863 Mean : 4242703
## BELGRANO : 1 3rd Qu.:12.000 3rd Qu.:11127 3rd Qu.: 5142993
## BOCA : 1 Max. :15.000 Max. :22127 Max. :15845871
## (Other) :42
A partir de este resumen podemos ver el máximo de comunas en las que se agrupan los barrios = 15. El perrÃmetro y área, máximo y minimo de los barrios. El promedio de perÃmetro de los barrios es: 9.863, y el promedio de área es: 4.242.703
En el siguiente dataset se agrega informacion geoespacial:
seleccion_barrios_caba_mapa <- select(barrios_caba_mapa, BARRIO, COMUNA, PERIMETRO, AREA, OBJETO, geometry)
Contamos entonces con 48 filas y 6 variables (columnas), además de las mismas que el dataset anterior, tambien tenemos variables de objeto y geometria.
summary(seleccion_barrios_caba_mapa)
## BARRIO COMUNA PERIMETRO
## AGRONOMIA: 1 1.00000000000 : 6 10021.45966480000: 1
## ALMAGRO : 1 10.00000000000: 6 10165.61402770000: 1
## BALVANERA: 1 15.00000000000: 6 10596.82673920000: 1
## BARRACAS : 1 11.00000000000: 4 10785.26108140000: 1
## BELGRANO : 1 12.00000000000: 4 10990.96447150000: 1
## BOCA : 1 4.00000000000 : 4 11033.51030190000: 1
## (Other) :42 (Other) :18 (Other) :42
## AREA OBJETO geometry
## 1232270.15874000010 : 1 BARRIO:48 MULTIPOLYGON :48
## 1279951.37256000005 : 1 epsg:4326 : 0
## 1334146.08282999997 : 1 +proj=long...: 0
## 1385411.51374000008 : 1
## 1406833.59580000001 : 1
## 15845871.28800000064: 1
## (Other) :42
A partir de este resumen podemos observar que existen 48 barrios y se agrupan por comuna.
Analizando un poco más los datos que tenemos, a partir de un grafico podemos entender más:
ggplot(seleccion_barrios_caba)+
geom_histogram(aes(x=comuna, fill=area))
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Este gráfico nos muestra la superficie de cada comuna, es decir a partir del dato de área y de cada comuna, sabemos cuales son las más grandes (la 1, 4, 10, 15), y las que ocupan menos espacio.
ggplot(seleccion_barrios_caba)+
geom_bar(aes(x=comuna, fill=barrio))+
labs (title="Barrios por comuna", subtitle = "CABA")
Con el gráfico de barras pudimos ordenar los barrios dentro de cada comuna.
A partir del dataset con información geografica de los barrios de caba podemos observar el siguiente mapa:
ggplot()+
geom_sf(data=seleccion_barrios_caba_mapa)+
theme_bw()
Un simple mapa que muestra cómo estan ordenados los 48 barrios de la CABA en el espacio.
Ahora vemos el mapa de CABA con la ubicación de las comunas:
ggplot(seleccion_barrios_caba_mapa)+
geom_sf(aes(fill=COMUNA), color="white")+
labs(title="COMUNAS DE CABA", caption = "Fuente: BA Data", fill = "Número de comuna")+
theme_light()
Otro mapa similar al anterior, pero en vez de rellenar con comunas, en este caso con el área:
ggplot(seleccion_barrios_caba_mapa)+
geom_sf(aes(fill=BARRIO), color="white")+
labs(title="LOS BARRIOS DE CABA")+
theme_gray()