Visualizaciones

library(tidyverse)
library(gt)
library(plotly) # para gráficos interactivos
library(scales) # Para etiquetas con formato
library(treemapify) # para treemaps
library(ggrepel) # para que no se solapen las etiquetas
library(wordcloud2) # para visualizar nube de palabras.

Opción 2: Registro Nacional de Barrios Populares (ReNaBaP) en Argentina

renabap <- read.csv("data/renabap-datos-barrios-csv.csv", stringsAsFactors = TRUE)

# Creamos renabap_modif reemplazando el nombre Ciudad Autónoma de Buenos Aires por CABA para que se vea mejor como etiqueta
renabap_modif <- renabap %>%
  mutate(
    provincia = as.character(provincia),  # primero lo paso a texto
    provincia = ifelse(provincia == "Ciudad Autónoma de Buenos Aires", "CABA", provincia),
    provincia = factor(provincia)        # lo devuelvo a factor (si lo necesitas como factor)
  )

Preguntas y Respuestas

2.a ¿Cuántas filas y columnas tiene la base de datos? Hacer una breve descripción del contenido de la misma

#dim(renabap)

La base de datos RENABAP tiene 6,467 filas y 17 columnas, donde cada fila representa un barrio popular registrado a nivel nacional, mientras que cada columna corresponde a una variable que describe alguna característica de ese barrio.Esta base ayuda a entender mejor cómo viven muchas familias en los barrios populares de Argentina. Muestra su tamaño y las carencias que enfrentan: falta de papeles legales, pocos servicios básicos y viviendas en malas condiciones. Con estos datos en mano, es posible diseñar políticas más efectivas para integrar a estos barrios en la ciudad y mejorar la vida de quienes los habitan.

#colnames(renabap)

#summary(renabap_modif)

Algunos datos que se observan son: Las provincias con mayor número de registros son Buenos Aires (2.065 barrios), Santa Fe (469) y Chaco (442). La cantidad de familias por barrio varía entre 6 y 15.400, con un promedio de 191 familias. La superficie promedio de los barrios es de 105.799 m², aunque existe gran dispersión (algunos alcanzan más de 9 millones de m²). En materia de servicios básicos, como la energía electrica se observa que el modo más frecuente es la conexión irregular a la red (3.670 barrios). Menos familias tienen conexión formal con medidor domiciliario y factura (2.187).

head(renabap_modif)

##   id_renabap nombre_barrio    provincia departamento           localidad
## 1          1   Monterrey I Buenos Aires        Pilar   Presidente Derqui
## 2          2   Malvinas II Buenos Aires     La Plata José Melchor Romero
## 3          3   Ferroviario Buenos Aires     La Plata    Angel Etcheverry
## 4          4   La Favelita Buenos Aires     La Plata              Tolosa
## 5          5        Casaca Buenos Aires     La Plata           City Bell
## 6          6     La Güemes Buenos Aires     La Plata    Manuel B. Gonnet
##   cantidad_viviendas_aproximadas cantidad_familias_aproximada
## 1                             40                           44
## 2                            290                          319
## 3                            133                          146
## 4                            122                          134
## 5                             20                           22
## 6                             12                           13
##   decada_de_creacion anio_de_creacion
## 1        Década 1990               NA
## 2        Década 1990               NA
## 3        Década 2000               NA
## 4        Década 1970               NA
## 5        Década 2000               NA
## 6        Década 1970               NA
##                               energia_electrica
## 1 Conexión regular a la red con medidor prepago
## 2                   Conexión irregular a la red
## 3                   Conexión irregular a la red
## 4                   Conexión irregular a la red
## 5                   Conexión irregular a la red
## 6                   Conexión irregular a la red
##                      efluentes_cloacales
## 1  Desagüe a cámara séptica y pozo ciego
## 2  Desagüe a cámara séptica y pozo ciego
## 3 Desagüe sólo a pozo negro/ciego u hoyo
## 4 Desagüe sólo a pozo negro/ciego u hoyo
## 5  Desagüe a cámara séptica y pozo ciego
## 6 Desagüe sólo a pozo negro/ciego u hoyo
##                                 agua_corriente         cocina       calefaccion
## 1           Bomba de agua de pozo domiciliaria Gas en garrafa         Sin Datos
## 2          Conexión irregular a la red de agua Gas en garrafa     Leña o carbón
## 3 Conexión formal a la red de agua con factura Gas en garrafa     Leña o carbón
## 4          Conexión irregular a la red de agua Gas en garrafa Energía eléctrica
## 5           Bomba de agua de pozo domiciliaria Gas en garrafa         Sin Datos
## 6          Conexión irregular a la red de agua Gas en garrafa Energía eléctrica
##   titulo_propiedad clasificacion_barrio superficie_m2
## 1               NO         Asentamiento         11674
## 2               NO         Asentamiento         98093
## 3               NO         Asentamiento         75887
## 4               NO         Asentamiento         36889
## 5               NO         Asentamiento         25768
## 6               NO         Asentamiento          3424

ggplot() +
  geom_histogram(data = renabap_modif, aes(x = cantidad_viviendas_aproximadas),
    color = "black",
    fill = "#FFD700",
    binwidth = 75) +
    scale_y_continuous(
    limits = c(0, 2400), 
    breaks = seq(0, 2400, by = 200)) +
  labs(title = "Gráfico 1: Distribución de la cantidad de viviendas por barrio",
            x = "Cantidad de viviendas aproximadas",
            y = "Frecuencia") + # En ese eje vemos cuántos barrios tienen esa cantidad de viviendas
  theme_light()

En el gráfico 1 se observa que la mayoría de los barrios cuentan con muy pocas viviendas, concentrándose especialmente en el rango de hasta 250. Para detallar mejor esta distribución, se presenta un recorte de la visualización en el gráfico siguiente.

ggplot() +
  geom_histogram(
    data = renabap_modif %>% filter(cantidad_viviendas_aproximadas <= 1000), # <-- recorte a 1000 viviendas
    aes(x = cantidad_viviendas_aproximadas),
    color = "black",
    fill = "#FFD700",
    binwidth = 50
  ) +
  labs(
    title = "Gráfico 2: Distribución de la cantidad de viviendas por barrio (< 1,000 viviendas)",
    x = "Cantidad de viviendas aproximadas",
    y = "Frecuencia",
    caption = "Fuente: RENABAP (2024)"
  ) +
  scale_x_continuous(labels = comma, limits = c(0, 1000)) +  # eje X con límite y formato legible
  scale_y_continuous(breaks = seq(0, 3000, by = 250)) +       # eje Y más detallado
  theme_light()

El gráfico 2 muestra con mayor claridad que la mayoría de los barrios tienen menos de 250 viviendas, lo que confirma que se trata de asentamientos pequeños. Destaca el primer intervalo, con hasta 50 viviendas, que agrupa a más de 2,000 barrios.

2.b ¿Qué provincias concentran el mayor cantidad de barrios populares? ¿Y de familias viviendo en barrios populares? ¿Existe alguna relación entre ambos resultados?

Agrupo los datos por provincia y luego la cantidad total de viviendas, como proxy del numero de barrios, y se ordena de mayor a menor.

library(dplyr)
# Agrupamos por provincia y departamento (para no mezclar capitales)
barriosxprovincia <- renabap_modif %>%
  group_by(provincia, departamento) %>% 
  summarise(barrios = sum(cantidad_viviendas_aproximadas, na.rm = TRUE)) %>% 
  ungroup()

library(scales)
ggplot() +
  geom_histogram(
    data = renabap_modif %>% filter(superficie_m2 < 500000), #Para que se observe mejor el gráfico recortamos a superifices menores a 500 mil m2.
    aes(x = superficie_m2),
    color = "black",
    fill = "orange",
    binwidth = 5000
  ) +
  labs(
    title = "Gráfico 3: Distribución de la superficie de los barrios (< 500.000 m²)",
    x = "Superficie (m²)",
    y = "Frecuencia",
    caption = "Fuente: RENABAP (2024)"
  ) +
  scale_x_continuous(labels = comma) +  # Eje X en formato legible
  theme_minimal() #  esto nos da un estilo mas limpio, sin elementos innecesarios que distraigan.

Como se aprecia en el gráfico 3, la gran mayoría de los barrios poseen superficies pequeñas, con tamaños inferiores a 100.000 m².

# Agrupamos otra vez solo por provincia (sumando todos sus departamentos)
barriosxprovincia_total <- barriosxprovincia %>%
  group_by(provincia) %>%
  summarise(total_barrios = sum(barrios, na.rm = TRUE)) %>%
  arrange(desc(total_barrios))

# Para que pueda verse las etiquetas de provincia en el eje x se tiene que convertir de factor a carácter nuevamente a provincia
barriosxprovincia_total <- barriosxprovincia_total %>%
  mutate(provincia = as.character(provincia))

library(scales)


ggplot() + 
  geom_bar(
    data = barriosxprovincia_total,
    aes(x = reorder(provincia, total_barrios), y = total_barrios), # para Ordenar las barras según el total de viviendas, de mayor a menor
    stat = "identity", # para asegurarnos que las barras usen los valores reales "total_barrios"
    fill = "#8B795E"
  ) +
  coord_flip() + # esto invierte los ejes para que las provincias queden en el eje Y (vertical) y las barras se vean horizontales.
  labs(
    title = "Gráfico 4: Provincias con mayor número de viviendas (barrios populares)",
    x = "Provincia",
    y = "Total de viviendas (en miles)",
    caption = "Fuente: RENABAP (2024)"
  ) +
  scale_y_continuous(
    labels = label_comma(scale = 1/1000),
    breaks = seq(0, 500000, by = 100000)
  ) +
  theme_minimal() + #  esto nos da un estilo mas limpio, sin elementos innecesarios que distraigan.
  theme(
    plot.title = element_text(hjust = 0, size = 12, face = "bold"),
    axis.text.y = element_text(size = 10),
    axis.text.x = element_text(size = 10)
  )

El gráfico 4 muestra una fuerte desigualdad entre provincias: Buenos Aires concentra más de 500 000 viviendas en barrios populares, mientras que Santa Fe y la Ciudad Autónoma de Buenos Aires (CABA) apenas alcanzan entre 50 000 y 80 000. En un segundo grupo, Misiones, Chaco, Tucumán y Salta presentan cifras de entre 20 000 y 40 000 viviendas, reforzando las disparidades regionales.

head(barriosxprovincia_total)

## # A tibble: 6 × 2
##   provincia    total_barrios
##   <chr>                <int>
## 1 Buenos Aires        535133
## 2 Santa Fe             84306
## 3 CABA                 73195
## 4 Misiones             52995
## 5 Chaco                50711
## 6 Tucumán              43608

#FAMILIAS
# Agrupo por familias viviendo en barrios
familiaxprovincia <- renabap_modif %>%
  group_by(provincia, departamento) %>%
  summarise(familias = sum(cantidad_familias_aproximada, na.rm = TRUE)) %>%
  ungroup()

## `summarise()` has grouped output by 'provincia'. You can override using the
## `.groups` argument.

familiaxprovincia

## # A tibble: 375 × 3
##    provincia    departamento    familias
##    <fct>        <fct>              <int>
##  1 Buenos Aires 25 de mayo           633
##  2 Buenos Aires 9 de julio           402
##  3 Buenos Aires Almirante Brown    21700
##  4 Buenos Aires Arrecifes            353
##  5 Buenos Aires Avellaneda         11881
##  6 Buenos Aires Azul                 544
##  7 Buenos Aires Bahía Blanca        6574
##  8 Buenos Aires Balcarce             117
##  9 Buenos Aires Baradero             835
## 10 Buenos Aires Berazategui         1723
## # ℹ 365 more rows

familiaxprovincia_total <- familiaxprovincia %>%
  group_by(provincia) %>%
  summarise(total_familias = sum(familias, na.rm = TRUE)) %>%
  arrange(desc(total_familias))
familiaxprovincia_total

## # A tibble: 24 × 2
##    provincia    total_familias
##    <fct>                 <int>
##  1 Buenos Aires         588779
##  2 Santa Fe              92776
##  3 CABA                  80517
##  4 Misiones              58322
##  5 Chaco                 55821
##  6 Tucumán               48003
##  7 Salta                 39319
##  8 Córdoba               37039
##  9 Río Negro             36239
## 10 Corrientes            29136
## # ℹ 14 more rows

*Calcumos la participacion de las familas por provincia respecto al total

familiaxprovincia_total <- familiaxprovincia_total %>%
  mutate(
    porcentaje = total_familias / sum(total_familias) * 100,
    etiqueta = paste0(provincia, ", ", round(porcentaje, 1), "%")
  )

library(treemapify)

# Ahora calculo la proporción de familias viviendo en barrios populares por provincia

#  Con treemap cada rectángulo representa una provincia, así el tamaño de cada rectángulo es proporcional a la cantidad total de familias que viven en barrios populares en esa provincia.
ggplot() +
  geom_treemap(
    data = familiaxprovincia_total,
    aes(area = total_familias, fill = total_familias)
  ) +
  geom_treemap_text(
    data = familiaxprovincia_total,
    aes(area = total_familias, label = etiqueta),  
    colour = "white",
    place = "centre",
    size = 10,
    reflow = TRUE
  ) +
scale_fill_gradient2(low = "#BFEFFF", mid = "#9AC0CD", high = "#68838B",midpoint = median(familiaxprovincia_total$total_familias), labels = comma
)+
  labs(
    title = "Gráfico 5: Proporción de familias viviendo en barrios populares por provincia",
    subtitle = "En porcentajes (%)",
    caption = "Fuente: RENABAP (2024)",
    fill = "Familias"
  ) +
  theme_minimal() # esto nos da un estilo mas limpio, sin elementos innecesarios que distraigan.

# Otras notas:
#geom_treemap_text, nos permite agregar la etiqueta de la provincia más su porcentaje
# scale_fill_gradiente nos pernmite identificar las provincias con más familias con el color mas oscuro hasta el color más tenue con provincias con menos familias

Como se observa en el gráfico 5, la provincia de Buenos Aires concentra el 47.6% de las familias que habitan en barrios populares del país, lo que representa casi la mitad del total nacional. Es decir, En la provincia de Buenos Aires viven más de 500,000 familias en barrios populares. Si bien esta cifra resulta esperable por la magnitud demográfica y urbana de la provincia, permite dimensionar el enorme peso de este territorio en relación con las necesidades habitacionales. En un segundo grupo destacan Santa Fe (7.5%) y la CABA (6.5%), que juntas aportan más del 14% adicional.

# Unir las dos tablas por provincia
barrios_familias_total <- barriosxprovincia_total %>%
  inner_join(familiaxprovincia_total, by = "provincia") %>%
  select(provincia, total_barrios, total_familias)  # <-- Solo dejamos estas columnas
  


# Formateamos la tabla con gt()
barrios_familias_total %>%
  gt() %>%
  tab_header(
    title = "Tabla 1: Barrios y Familias por Provincia",
    subtitle = "Número total de viviendas (barrios) y familias por provincia"
  ) %>%
  fmt_number(
    columns = c(total_barrios, total_familias),
    decimals = 0,
    use_seps = TRUE  # Agrega separadores de miles
  ) %>%
  cols_label(
    provincia = "Provincia",
    total_barrios = "Total de viviendas",
    total_familias = "Total de familias"
  ) %>%
  tab_source_note(
    source_note = "Fuente: RENABAP (2024)"
  )

Provincia	Total de viviendas	Total de familias
Tabla 1: Barrios y Familias por Provincia
Número total de viviendas (barrios) y familias por provincia
Buenos Aires	535,133	588,779
Santa Fe	84,306	92,776
CABA	73,195	80,517
Misiones	52,995	58,322
Chaco	50,711	55,821
Tucumán	43,608	48,003
Salta	35,714	39,319
Córdoba	33,644	37,039
Río Negro	32,922	36,239
Corrientes	26,465	29,136
Formosa	25,393	27,942
Mendoza	23,996	26,432
Entre Ríos	23,869	26,276
Santiago del Estero	19,033	20,947
Jujuy	17,208	18,938
Neuquén	13,458	14,813
Chubut	9,686	10,660
Tierra del Fuego	5,585	6,147
San Juan	5,047	5,563
San Luis	4,038	4,442
Catamarca	3,571	3,936
Santa Cruz	2,601	2,863
La Rioja	2,247	2,476
La Pampa	372	409
Fuente: RENABAP (2024)

En la provincia de Buenos Aires viven más de 588.000 familias en barrios populares, distribuidas en más de 535.000 viviendas. Es, con diferencia, la región con mayor cantidad en todo el país, reflejo de su densidad poblacional y del crecimiento de los asentamientos en el conurbano. Luego se ubican provincias como Santa Fe, CABA, Misiones, Chaco y Tucumán, que también registran cifras altas, todas por encima de las 40.000 viviendas en estas zonas.

Existe una relación muy fuerte entre el número de viviendas y la cantidad de familias que viven en barrios populares: las provincias con más viviendas tienden, como era de esperar, a concentrar también más hogares.No obstante, hay pequeñas variaciones en esa proporción que podrían explicarse por factores como el tamaño promedio de los hogares, situaciones de hacinamiento o la presencia de viviendas vacías o compartidas entre varias familias.

2.c ¿Qué departamentos concentran la mayor cantidad de barrios populares? ¿Y de familias viviendo en barrios populares? ¿Existe alguna relación entre ambos resultados?

Agrupo los datos según el nombre del departamento, para analizar los totales por cada unidad territorial. Después se calcula la cantidad de viviendas aproximadas por departamento a traves de la funcion sum () en summarise. La funcion arrange es para ordenar, con la opcion desc se da de mayor a menor, para al final con head (10), definir los top 10.

barriosxdepartamento <- renabap_modif %>%
  group_by(departamento) %>% 
  summarise(barrios_depart=sum(cantidad_viviendas_aproximadas)) %>% 
  arrange(desc(barrios_depart)) %>% 
  head(10)

familiasxdepartamento <- renabap_modif %>%
  group_by(departamento) %>% 
  summarise(familias_depart=sum(cantidad_familias_aproximada)) %>% 
  arrange(desc(familias_depart)) %>% 
  head(10)

Otra forma de cálculo

departamento_top10 <- renabap_modif %>%
  group_by(departamento) %>%
  summarise(
    barrios_depart = sum(cantidad_viviendas_aproximadas),
    familias_depart = sum(cantidad_familias_aproximada)) %>%
  arrange(desc(familias_depart)) %>%
  head(10)

Al observar los datos, vemos que la Capital, y en particular la Comuna 8, lidera el ranking con más de 112.000 familias en barrios populares. Este dato refleja una fuerte concentración de población en asentamientos ubicados dentro de zonas urbanas ya consolidadas. Le siguen La Matanza, Rosario, Lomas de Zamora y Quilmes, todos dentro del AMBA, donde las cifras también son muy altas. Esto confirma que los barrios populares están principalmente en áreas metropolitanas.

En todos los casos, hay más familias que viviendas, lo que puede estar indicando hacinamiento o que varias familias comparten una misma unidad habitacional.Aunque hay una relación directa entre el número de viviendas y el de familias, las pequeñas diferencias sugieren que hay otros factores a considerar, como el tamaño promedio de los hogares o el uso compartido de casas.

2d. ¿Cuál es el tamaño promedio de los barrios en términos de superficie y cantidad de viviendas? ¿Varía mucho entre provincias?

Como en los otros casos, agrupo los datos por provincia para que el cálculo se haga por separado en cada una. Después a traves de summarise, saco el promedio de la superficie “mean()”de los barrios en esa provincia, y el promedio de viviendas por barrio. Como son decimales redondeo el resultado, en el caso de vivienda lo hago aun número exacto. Al final, ordeno las provincias de mayor a menor según la cantidad promedio de viviendas por barrio.

promedios_provincia <- renabap_modif %>% 
  group_by(provincia) %>% 
  summarise(promedio_superficie=round(mean(superficie_m2),1),
            promedio_vivienda=round(mean(cantidad_viviendas_aproximadas),0)) %>% 
  arrange(desc(promedio_vivienda))

Resultado:

# Mostrar la tabla con formato
promedios_provincia %>%
  gt() %>%
  tab_header(
    title = "Tabla 2: Promedios de Superficie y Viviendas por Provincia",
    subtitle = "Promedio de superficie (m²) y cantidad de viviendas en barrios populares"
  ) %>%
  fmt_number(
    columns = c(promedio_superficie, promedio_vivienda),
    decimals = 0,          # Redondear valores
    use_seps = TRUE         # Separadores de miles
  ) %>%
  cols_label(
    provincia = "Provincia",
    promedio_superficie = "Promedio de superficie (m²)",
    promedio_vivienda = "Promedio de viviendas"
  ) %>%
  tab_source_note(
    source_note = "Fuente: RENABAP (2024)"
  )

Provincia	Promedio de superficie (m²)	Promedio de viviendas
Tabla 2: Promedios de Superficie y Viviendas por Provincia
Promedio de superficie (m²) y cantidad de viviendas en barrios populares
CABA	65,171	1,494
Buenos Aires	124,810	259
Formosa	203,589	202
Santa Fe	80,756	180
Santiago del Estero	184,922	149
Río Negro	114,946	137
Misiones	133,625	128
San Luis	126,557	126
Santa Cruz	254,329	124
Tucumán	65,872	118
Chubut	152,029	117
Neuquén	170,980	116
Chaco	104,724	115
Tierra del Fuego	154,226	114
Jujuy	43,291	108
Córdoba	66,742	106
Corrientes	79,481	103
Entre Ríos	59,415	103
Salta	90,240	101
Mendoza	66,826	67
La Rioja	114,122	66
San Juan	80,530	62
Catamarca	58,581	59
La Pampa	111,861	41
Fuente: RENABAP (2024)

En Argentina, el tamaño y la densidad de los barrios populares varía mucho según la provincia. En la Ciudad Autónoma de Buenos Aires, los barrios son compactos, con muchas viviendas en poco espacio. El barrio promedio en la CABA tiene 1.494 viviendas, siendo el más poblado en promedio, pero con una superficie media relativamente baja (65.170 m²). En cambio, en provincias como Santa Cruz (254.328 m²) o Formosa (203.589 m²), hay barrios extensos pero con pocas viviendas, 124 y 202 respectivamente, reflejando una urbanización más dispersa. En lugares como La Pampa o San Juan, los barrios son más pequeños tanto en superficie como en cantidad de casas, lo que muestra distintas formas de crecimiento urbano en el país.

2e. ¿En qué décadas se crearon la mayoría de los barrios registrados en el RENABAP?

Agrupo los datos según la década en que se creó cada barrio, para permitir contar barrios por período histórico. En seguida calculo cuantos barrios hay en cada decada con la funcion “n()”. Por último, ordeno los resultados de mayor a menor, para ver rápidamente en qué décadas se concentró la creación de barrios populares.

barrios_por_decada <- renabap_modif %>%
  group_by(decada_de_creacion) %>%
  summarise(cantidad_barrios = n()) %>%
  arrange(desc(cantidad_barrios))
barrios_por_decada

## # A tibble: 13 × 2
##    decada_de_creacion cantidad_barrios
##    <fct>                         <int>
##  1 Década 2000                    1735
##  2 Década 2010                    1604
##  3 Década 1990                     995
##  4 Década 1980                     790
##  5 Década 1970                     472
##  6 Década 1960                     361
##  7 Década 1950                     191
##  8 Década 1940                      95
##  9 Década 2020                      84
## 10 Década 1930                      54
## 11 Década 1910                      39
## 12 Década 1920                      34
## 13 Década 1900                      13

Según los registros del RENABAP, la mayoría de los barrios populares surgieron entre 1980 y 2010, con un fuerte aumento en la década de 2000, cuando se registraron 1.735 nuevos barrios, y otro pico importante en los años 2010, con 1.604. Este patrón evidencia una expansión sostenida de la urbanización informal en el país.

Las causas de este fenómeno podrian estar ligadas a procesos económicos complejos: crisis recurrentes, pérdida del poder adquisitivo, aumento del empleo informal y dificultades para acceder a tierras urbanas. Todos estos factores, sumados a políticas habitacionales insuficientes, crearon un escenario en el que miles de familias se vieron forzadas a buscar alternativas por fuera del mercado formal. Así, muchas comunidades se formaron ocupando terrenos fiscales, ubicados en zonas periurbanas o sin servicios básicos, como una respuesta directa a la falta de opciones.

2f. ¿Qué porcentaje de los barrios cuenta con conexión regular a la red eléctrica? ¿Y cuántos tienen conexión irregular o directamente no tienen?

Realizo un nueva clasificación para el tipo de conexion de la energía eléctrica en: regular, irregular y sin conexión, todo lo cual se ve reflejado en la base renabap_modif2.

renabap_modif2 <- renabap_modif %>% 
mutate(conexion_clasificada=case_when(energia_electrica %in%
                              c("Conexión regular a la red con medidor domiciliario con consumo limitado", "Conexión regular a la red con medidor domiciliario pero sin factura", "Conexión regular a la red con medidor prepago", "Conexión formal a la red con medidor domiciliario con factura") ~ "Regular", energia_electrica %in%
                              c("Conexión irregular a la red",
"Energía solar", "Generador eléctrico a combustión", "Conexión a la red con medidor compartido", "Conexión a la red con medidor comunitario") ~ "Irregular", energia_electrica %in%
                              c("No tiene conexión eléctrica") ~ "Sin conexión"))

renabap_modif2 <- mutate(renabap_modif2,
                         conexion_clasificada=as.factor(conexion_clasificada))

tipo_conexion_electrica <- renabap_modif2 %>% 
  group_by(conexion_clasificada) %>% 
  summarise(cantidad_barrios=n())

total_barrios <- summarise(tipo_conexion_electrica, total_tipos=sum(cantidad_barrios))

tipo_conexion_electrica <- renabap_modif2 %>%
  group_by(conexion_clasificada) %>%
  summarise(cantidad_barrios = n()) %>%
  mutate(
    porcentaje = round(cantidad_barrios / sum(cantidad_barrios) * 100, 1)
  )
tipo_conexion_electrica

## # A tibble: 3 × 3
##   conexion_clasificada cantidad_barrios porcentaje
##   <fct>                           <int>      <dbl>
## 1 Irregular                        3962       61.3
## 2 Regular                          2401       37.1
## 3 Sin conexión                      104        1.6

Los datos muestran una realidad preocupante en los barrios populares: solo el 37,1% tiene acceso a una conexión formal a la electricidad. La mayoría, un 61,3%, depende de conexiones irregulares, y un pequeño pero significativo 1,6% no tiene acceso alguno.

Esta informalidad afecta a casi dos tercios de los barrios y conlleva serios riesgos: instalaciones peligrosas, facturación arbitraria, vulnerabilidad ante cortes, y dificultades para acceder al servicio.

2i. ¿Qué proporción de barrios no cuenta con título de propiedad? ¿A qué porcentaje de las familias involucra?

tenencia_propiedad <- renabap_modif2 %>% 
  group_by(titulo_propiedad) %>%
  summarise(cantidad_barrios=n()) %>% 
  mutate(pct_titulo=cantidad_barrios/sum(cantidad_barrios)*100)

tenencia_familias <- renabap_modif2 %>% 
  group_by(titulo_propiedad) %>% 
  summarise(cantidad_familias=sum(cantidad_familias_aproximada)) %>%
  mutate(pct_tenencia_familias=round(cantidad_familias/sum(cantidad_familias)*100,2))

Otra forma de calculo

En base a lo anterior, agrupo los datos según si el barrio tiene o no tiene título de propiedad (valores “SI” o “NO”). Después calculo la Cantidad de barrios con y sin título y el total de familias que viven en esos barrios (cantidad_familias). Ya con la función mutate agrego dos columnas con los porcentajes: % de barrios con o sin título y % de familias afectadas por la (no) tenencia del título. Como son decimales opto por redondearlas.

tenencia_resumen <- renabap_modif2 %>% 
  group_by(titulo_propiedad) %>% 
  summarise(cantidad_barrios=n(),
            cantidad_familias=sum(cantidad_familias_aproximada)) %>%
  mutate(pct_titulo_propiedad=round(cantidad_barrios/sum(cantidad_barrios)*100,1),
         pct_tenencia_familias=round(cantidad_familias/sum(cantidad_familias)*100,2))
tenencia_resumen

## # A tibble: 2 × 5
##   titulo_propiedad cantidad_barrios cantidad_familias pct_titulo_propiedad
##   <fct>                       <int>             <int>                <dbl>
## 1 NO                           6462           1230348                 99.9
## 2 SI                              5              7447                  0.1
## # ℹ 1 more variable: pct_tenencia_familias <dbl>

En Argentina, la falta de un título legal de la tierra es una realidad que atraviesa a casi todos los barrios populares. De los 6.467 barrios registrados por el RENABAP, solo 5 cuentan con algún tipo de título formal. Es decir, el 99,9% no tiene reconocimiento legal sobre el suelo que ocupa. Más de 1,23 millones de familias viven en esta condición de informalidad, lo que representa el 99,4% del total. Solo una mínima parte (0,6%) tiene acceso a un título legal que garantice seguridad sobre su vivienda. Esta ausencia de documentos no es solo una cuestión legal: significa vivir sin certezas, sin poder invertir con tranquilidad, sin poder dejar una casa a sus hijos, y muchas veces, sin acceso a mejoras básicas.

3. Preguntas adicionales

3a. ¿Cuál es la densidad habitacional promedio de los barrios (familias por m²)? ¿Dónde se localizan los casos más críticos de hacinamiento urbano?

Esta pregunta puede ser interesante porque permitiría medir el hacinamiento. Cuántas familias viven en un metro cuadrado en los barrios populares, ello nos permite entender la presión real sobre el espacio habitable. Y, a partir de eso, anticipar problemas que afectan la vida cotidiana, como la falta de salud y la sobrecarga de servicios.

Considerando que densidad = cantidad_familias_aproximada / superficie_m2

Primero creo la variable densidad_familias_m2 en la base modificada2, luego la densidad promedio nacional (a traves de acceder a la columna que contiene la densidad de cada barrio: renabap_modif2$densidad_familias_m2).

renabap_modif2 <- renabap_modif2 %>% 
  mutate(densidad_familias_m2=round(cantidad_familias_aproximada/superficie_m2,4))

promedio_densidad <- round(mean(renabap_modif2$densidad_familias_m2),4)
promedio_densidad

## [1] 0.003

Calculo el umbral_critico en base al percentil 90, es decir el 10% de barrios que viven en las zonas más pobladas.

umbral_critico <- quantile(renabap_modif2$densidad_familias_m2, 0.90)

Ahora identificamos los barrios críticos, para ello filtro en base al >= del umbral crítico previamente definido, para ver los resultados selecciono las columnas que deseo mostrar, enfocándome en un top 20.

barrios_criticos <- renabap_modif2 %>% 
  filter(densidad_familias_m2>=umbral_critico) %>% 
  select(nombre_barrio,provincia,departamento,localidad,cantidad_familias_aproximada, superficie_m2,densidad_familias_m2) %>%
  arrange(desc(densidad_familias_m2)) %>% 
  head(20)

renabap_criticos_top <- renabap_modif2 %>%
  filter(densidad_familias_m2 >= umbral_critico) %>%
  arrange(desc(densidad_familias_m2)) %>%
  slice(1:20)

# Para añadir puntos (scatter plot) usamos geom_point

ggplot() +
  geom_point(data = renabap_criticos_top, aes(x = superficie_m2, y = cantidad_familias_aproximada),
    color = "red",
    size = 3
  ) +
  geom_text_repel(
    data = renabap_criticos_top,
    aes(x = superficie_m2, y = cantidad_familias_aproximada, label = nombre_barrio),
    size = 3,
    max.overlaps = 1000
  ) +
  scale_x_continuous(labels = comma) +
  scale_y_continuous(labels = comma) +
  labs(
    title = "Gráfico 6: Top 20 barrios críticos con mayor densidad habitacional",
    subtitle = "Densidad medida en familias por m² (percentil 90)",
    x = "Superficie del barrio (m²)",
    y = "Cantidad de familias",
    caption = "Fuente: RENABAP (2024)"
  ) + 
  theme_minimal()

#Notas a algunos comandos:
#geom_text_repel: añade etiquetas a los puntos sin que se solapen
# max.overlaps: 1000 Permite mayor cantidad de etiquetas antes de eliminarlas por solapamiento

El gráfico 6 muestra los veinte barrios con mayor densidad habitacional, lo que permite comprender mejor los desafíos que enfrentan. La mayoría son barrios pequeños, donde la alta densidad supone riesgos para la calidad de vida, el acceso a servicios y la reducción de la vulnerabilidad social. En contraste, casos como Padre Rodolfo Ricciardelli y Villa 20 concentran miles de familias en superficies más amplias, lo que los convierte en excepciones que requieren políticas específicas.

De la tabla se observa, que el barrio Nuevo San Alberto, en Ituzaingó, presenta la mayor densidad, con 0.0842 familias por metro cuadrado. Le siguen La FabriKita II en Vicente López (0.0736) y Los Pinos en Villa Soldati (0.0683). En estos lugares, entre 84 y 68 familias comparten cada 1.000 m². Estos niveles de concentración no solo dificultan la calidad de vida, sino que también implican serios riesgos sanitarios, sociales y urbanísticos que requieren respuestas urgentes. Entonces se podria decir que en algunos casos, el espacio habitable por familia es extremadamente reducido, lo que genera altos niveles de hacinamiento y tensión urbana.

3b. ¿Qué relación existe entre la década de creación de los barrios y el acceso al agua y desagüe cloacal?

Esta pregunta permite evaluar los efectos de las politicas públicas en este sector. Ya que la evolución en el tiempo permite identificar patrones importantes: si los barrios más antiguos fueron integrándose progresivamente al tejido urbano formal o si la exclusión permanece sin importar la antigüedad. También permite ver si los barrios más recientes nacen con mejores condiciones de acceso a servicios e infraestructura o si la precariedad se mantiene como constante.

Procedemos al calculo Agrupamos y contamos por década y acceso a agua y efluentes cloacales.

agua_por_decada <- renabap_modif2 %>%
  group_by(decada_de_creacion,agua_corriente) %>% 
  summarise(cantidad=n()) %>%
  arrange(decada_de_creacion)

## `summarise()` has grouped output by 'decada_de_creacion'. You can override
## using the `.groups` argument.

cloacas_por_decada <- renabap_modif2 %>% 
  group_by (decada_de_creacion, efluentes_cloacales) %>% 
  summarise(cantidad=n()) %>% 
  arrange(decada_de_creacion)

## `summarise()` has grouped output by 'decada_de_creacion'. You can override
## using the `.groups` argument.

Aqui se calcula los porcentajes por década para comparar mejor

agua_por_decada <- agua_por_decada %>%
  group_by(decada_de_creacion) %>% 
  mutate(pct_agua=round(cantidad/sum(cantidad)*100,1))

cloacas_por_decada <- cloacas_por_decada %>% 
  group_by (decada_de_creacion) %>% 
  mutate(pct_cloaca=round(cantidad/sum(cantidad)*100,1))

Ahora me enfoco en el acceso al agua y a los efluentes cloacales formales para analizar su evolución a lo largo de las diferentes décadas.

agua_formal <- agua_por_decada %>%
  filter(agua_corriente=="Conexión formal a la red de agua con factura") %>% 
  select(decada_de_creacion, pct_agua)

cloaca_formal <- cloacas_por_decada %>% 
  filter(efluentes_cloacales=="Conexión formal a la red cloacal") %>% 
  select(decada_de_creacion,pct_cloaca)

Se une las dos últimas tablas para ver la relación

servicios_formales_por_decada <- left_join(agua_formal, cloaca_formal, by="decada_de_creacion")
servicios_formales_por_decada

## # A tibble: 12 × 3
## # Groups:   decada_de_creacion [12]
##    decada_de_creacion pct_agua pct_cloaca
##    <fct>                 <dbl>      <dbl>
##  1 Década 1910             5.1       NA  
##  2 Década 1920             5.9        2.9
##  3 Década 1930             5.6       NA  
##  4 Década 1940             7.4        2.1
##  5 Década 1950             9.4        5.2
##  6 Década 1960            10.8        4.2
##  7 Década 1970            12.7        5.7
##  8 Década 1980            11.5        3.9
##  9 Década 1990            11.3        2.8
## 10 Década 2000             8.5        2.2
## 11 Década 2010             3.8        0.8
## 12 Década 2020             3.6       NA

De la tabla podemos ver que conforme pasaron las décadas, hay una diferencia en el acceso a servicios esenciales. Así, los barrios populares más antiguos, creados entre las décadas del 50 y el 80, muestran una conexión algo más frecuente a las redes de agua (hasta 12,7%) y cloacas (5,7%). Son comunidades que, con años de existencia, lograron avances parciales en su integración urbana. Pero en los barrios más nuevos, la situación es otra: a medida que nos acercamos a 2020, los niveles de acceso se desploman. Solo el 3,6% de los barrios formados en esa década accede al agua por vías formales, y menos del 1% tiene cloacas.

3c. ¿Cómo ha cambiado la superficie promedio de los barrios registrados por década?

# Agrupar por década y calcular superficie promedio
superficie_por_decada <- renabap_modif %>%
  filter(!is.na(decada_de_creacion) & decada_de_creacion != "") %>%
  group_by(decada_de_creacion) %>%
  summarise(superficie_promedio = mean(superficie_m2, na.rm = TRUE), .groups = "drop") %>%
  arrange(decada_de_creacion) %>%
  mutate(decada_de_creacion = factor(decada_de_creacion, levels = decada_de_creacion))

ggplot() +
  geom_line(
    data = superficie_por_decada,
    aes(x = decada_de_creacion, y = superficie_promedio, group = 1),
    color = "#87CEFA",
    linewidth = 1.2
  ) +
  geom_point(
    data = superficie_por_decada,
    aes(x = decada_de_creacion, y = superficie_promedio),
    color = "#CD5555",
    size = 3
  ) +
  geom_text(
    data = superficie_por_decada,
    aes(x = decada_de_creacion, y = superficie_promedio, label = comma(round(superficie_promedio,0))),
    vjust = -1,
    size = 3
  ) +
  labs(
    title = "Gráfico 7: Superficie promedio de los barrios por década de creación",
    x = "Década de creación",
    y = "Superficie promedio (m²)",
    caption = "Fuente: RENABAP (2024)"
  ) +
  scale_y_continuous(limits = c(80000, 160000)) +   # Eje Y entre 80000 y 160000 en función del dato mínimo y máximo
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # para poner las etiquetas en forma diagonal

#Notas:
#  geom_line: conecta los puntos para mostrar la tendencia de la superficie promedio por década
#  geom_point: añade los puntos sobre la línea
#  geom_text: agrega los valores exactos como etiquetas sobre cada punto (en miles).

El gráfico 7 muestra cómo, con el paso de las décadas, los barrios populares fueron construyéndose en espacios cada vez más pequeños. Esto no solo refleja el crecimiento de la población y la falta de tierras disponibles, sino también el impacto de las crisis económicas, la inflación y los cambios estructurales que marcaron al país, aumentando la informalidad urbana. En los últimos años, se percibe una leve recuperación, posiblemente ligada a programas de regularización e integración que buscan ofrecer mejores condiciones para quienes viven en estos barrios.

3d. ¿Cuáles son los nombres de barrios más frecuentes en el RENABAP?

# Contar frecuencia de barrios y quedarnos con los 100 más frecuentes (excluyendo "Sin Nombre")
barrios_frecuentes <- renabap_modif %>%
  filter(
    !is.na(nombre_barrio) & 
    nombre_barrio != "" & 
    nombre_barrio != "Sin Nombre"   # <-- Excluye explícitamente "Sin Nombre"
  ) %>%
  group_by(nombre_barrio) %>%
  summarise(frecuencia = n()) %>%
  arrange(desc(frecuencia)) %>%
  slice_max(order_by = frecuencia, n = 100)  # <-- Top 100

#wordcloud2(data = barrios_frecuentes, size = 0.5, color = "random-dark")

library(htmltools)

# Creamos la nube
nube <- wordcloud2(data = barrios_frecuentes, size = 0.25, color = "random-dark")

# Le agregamos título y fuente
tagList(
  tags$h3("Gráfico 8: Barrios más frecuentes en el RENABAP",
          style = "text-align:center; font-size:17px;font-weight:bold; color:black;"),  # acá se ajusta el tamaño del título
  nube,
  tags$p("Fuente: RENABAP (2024)",
         style = "text-align:center; font-size:12px; color:black;")
)

Gráfico 8: Barrios más frecuentes en el RENABAP

Fuente: RENABAP (2024)

El gráfico 8, nos muestra que los nombres más comunes de barrios en distintos departamentos y provincias son: “San Cayetano” (el nombre más repetido que aparece en numerosos barrios a lo largo del país), seguidos de “La Esperanza” y “San Martín”, entre otros.

3e. ¿¿Cómo varía la superficie de los barrios según si tienen título de propiedad?

# Filtramos para evitar valores vacíos o NA
renabap_modif2 <- renabap_modif %>%
  filter(!is.na(titulo_propiedad) & titulo_propiedad != "")

# Gráfico
ggplot()+
  geom_point(data=renabap_modif2, aes(x = superficie_m2, y = cantidad_familias_aproximada),
  alpha = 0.6, color = "darkblue") +  # para transparentar los puntos y no saturen el gráfico
  facet_wrap(~titulo_propiedad) +
  # Etiquetas en los puntos (para ambas facetas)
  geom_text_repel(
    data = renabap_modif2 %>%
      filter(cantidad_familias_aproximada > 1000),  # <-- Ajusta el umbral según quieras
    aes(
      x = superficie_m2,
      y = cantidad_familias_aproximada,
      label = nombre_barrio
    ),
    size = 3,
    color = "black",
    max.overlaps = 50
  ) +
  facet_wrap(~titulo_propiedad) +  # Se mantiene el facetado por título
  scale_x_log10(labels = scales::comma) +
  scale_y_continuous(labels = scales::comma) +
  labs(
    title = "Gráfico 9: Superficie vs Cantidad de Familias según Título de Propiedad",
    subtitle = "Comparación de barrios con y sin título formal",
    x = "Superficie del barrio (m², escala logarítmica)",
    y = "Cantidad de familias",
    caption = "Fuente: RENABAP (2024)"
  )  +
  theme(
    plot.subtitle = element_text(hjust = 0.5)  # <-- Centra el subtítulo
  )

## Warning: ggrepel: 149 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

#Notas:
# facet_wrap(~titulo_propiedad) divide el gráfico en dos paneles: barrios con y sin título de propiedad.
# geom_text_repel añade etiquetas a puntos destacados (barrios con más de 1,000 familias), evitando que se superpongan.
# scale_x_log10() convertimos a logaritmo el eje X, lo que es muy útil cuando hay valores muy diferentes entre sí.

En el gráfico 9, vemos que la formalización de la tierra en barrios populares sigue siendo una deuda pendiente (casi todos no tienen título), incluso en grandes conglomerados. En el gráfico de la izquierda se observa la gran diferencia de tamaño que existe entre los barrios (entre 1 mil y 1 millón de m2), que van desde pequeños asentamientos hasta barrios enormes con más de 5,000 familias, evidenciando que la informalidad no es solo un problema de los asentamientos chicos, sino también de comunidades muy numerosas.Por su parte el gráfico de la derecha se ve que, los barrios con título, en cambio, son pocos y tienden a tener menos familias y menor superficie.

Conclusión General

El panorama que revela el RENABAP es contundente. El 99,9% de los barrios populares no tiene título de propiedad. Esto afecta a más de 1,23 millones de familias que viven sin garantías legales, sin seguridad, y con barreras para acceder a derechos básicos como el crédito, la herencia o programas de vivienda.

En términos de servicios, la situación también es crítica: solo el 37% tiene acceso regular a la electricidad, mientras que el resto depende de conexiones informales. El agua potable y los desagües cloacales también muestran enormes déficits, con miles de familias dependiendo de sistemas precarios.

Hay barrios donde la densidad es tan alta que más de 80 familias viven en apenas 1.000 m². Esa concentración trae aparejados problemas de salud, convivencia y deterioro ambiental.

Lo más preocupante es que esta precariedad no disminuye con el tiempo. La mayoría de los barrios surgió entre 1980 y 2010, pero los más recientes no nacen con mejores condiciones. La desigualdad urbana se sostiene, y las soluciones siguen llegando tarde o no llegando.

Sugerencia de Datos adicionales para enriquecer el estudio:

- Datos socioeconómicos de las familias

Se deberian incorporar datos sobre ingresos, empleo y nivel educativo de las familias para entender mejor las condiciones de vida en los barrios populares. No se trata solo de cuántas casas hay o si tienen agua, sino de conocer quiénes viven allí, cómo se sostienen día a día y qué oportunidades tienen para salir de la exclusión. Estos datos ayudarían a diseñar mejores políticas, acorde a las necesidades de las personas.

- Información sobre composición demográfica

Incorporar datos sobre la composición demográfica de los barrios populares (niños, personas mayores, mujeres jefas de hogar, personas con discapacidad) es clave para entender sus verdaderas necesidades. Cada grupo requiere políticas específicas. Un barrio con alta presencia de niños necesita más escuelas y espacios de juego. Uno con mayoría de personas mayores necesita atención en salud, accesibilidad y cuidado. Este enfoque más segmentado permite que las respuestas del Estado sean más efectivas e inclusivas.

RENABAP

Diony Javier Carbajal Galarza