Encuesta de Uso del Tiempo y Trabajo No Remunerado

(Uruguay, 2021)

Informe sobre procesamiento parcial de datos - efecto de la pandemia en la distribución de las tareas de cuidados al interior de los hogares

Ciencia de Datos I, julio-agosto de 2023
Introducción

¿Quién nos cuidó? ¿Quién nos alimentó, bañó, entretuvo, consoló…? Si apelamos a nuestros recuerdos de la infancia, sin pensarlo mucho, seguramente las primeras imágenes que se nos aparezcan sean mujeres: madres, abuelas, tías, hermanas, vecinas… Si bien los hombres cada vez más van tomando más protagonismo en estas tareas relacionadas al llamado “trabajo no remunerado”, quienes ponen el cuerpo siguen siendo las mujeres. En 2020 se dio un evento sin precedentes: la pandemia por COVID-19 generó a lo largo y ancho del mundo un confinamiento al interior de los hogares, llevando la presión y carga de esas tareas de cuidados al límite. ¿Quién se hizo cargo de esto?

Hasta hace no mucho tiempo, se daba por sentado que el trabajo relacionado con cuidados y limpieza del hogar era intríseco a las mujeres. Si nos remontamos -un poco- más para atrás, tampoco había un cuestionamiento relativo a la posibilidad este fuera remunerado o considerado como trabajo. “La que nos ayuda en casa”, “la que viene a darle una mano a mamá”, “la que se queda con mi hermano mientras mis padres trabajan”, “la que cuida de mi abuelo”, seguramente sean expresiones que resuenen en quien lee este texto.

El concepto de trabajo no remunerado es reciente y su inclusión en cláusulas de convenios laborales o incluso en la legislación más aún. Las encuestas de uso del tiempo aportan información sobre la forma en que las personas distribuyen su tiempo en función de las actividades que realizan y asimismo, la división del trabajo (remunerado y no remunerado) entre mujeres y hombres y su distribución a la interna del hogar, lo cual resulta imprescindible para poder avanzar hacia una sociedad en la que nos cuidemos entre todxs.

Entre 2021 y 2022,el Instituto Nacional de Estadística y el Ministerio de Desarrollo Social realizaron una nueva edición de la Encuesta de Uso del Tiempo y Trabajo No Remunerado, la segunda en nuestro país. El informe ministerial -incluido en la carpeta “docs”- fue divulgado en marzo de este año y los microdatos utilizados para este informe fueron publicados el 19 de julio de 2023.

Este informe es realizado en el marco de la materia de Ciencia de Datos I del posgrado de Big Data e inteligencia territorial de FLACSO Argentina con el objetivo de interiorizarme en el procesamiento de datos en el software R y, por tanto, los resultados serán a efectos de adentrarme en el procesamiento con este lenguaje y en este sentido, parciales y no exhaustivos.

Importación de datos

En primer lugar, levantamos las carpetas y cargamos la librería tidyverse.

source("scripts/Estructura_carpetas.R")
#install.packages("tidyverse")
library(tidyverse)

Vamos a cargar también los microdatos correspondientes a la Encuesta de Uso del Tiempo y Trabajo No Remunerado disponible en este link

EUT <- read.csv(file = "data/eut_externa_2021.csv", 
                header = TRUE, 
                stringsAsFactors = TRUE, 
                encoding = "UTF-8")

Analizamos las dimensiones de la matriz y con esto obtenemos que se trata de una encuesta con 7316 observaciones y 351 variables. Paso entonces a observar el nombre de las primeras 20 variables para entender mejor la manera en que está presentada la información.

head(colnames(EUT), n = 20)
##  [1] "domanio"         "NUMERO"          "domdepartamento" "domseccion"     
##  [5] "domsegmento"     "domlocalidad"    "w"               "PERINFORMANTE"  
##  [9] "PERNRO"          "h1"              "h2"              "h5"             
## [13] "h7"              "h8"              "h9"              "h10"            
## [17] "h6"              "INSE1_1"         "INSE1_2"         "INSE1_3"
Limpieza, tratamiento y transformación de datos

Dado que resulta difícil interpretar el significado de las variables por su denominación, paso a importar desde el siguiente link el diccionario correspondiente a la encuesta. Para esto cargo la librería readxl:

#install.packages("readxl")
library(readxl)
dicc_EUT <- read_excel(path = "data/DICCIONARIO EUT2021.xls", 
                       skip= 5)

Como primera idea, se me ocurre realizar un pivot_longer, un left_join y luego un pivot_wider para extraer del diccionario una codificación más acorde al concepto de cada variable y “pegárselo” a la base, pero al analizar la tabla de excel me encuentro con un documento que a simple vista no está presentado como para cruzar bases.

No obstante, de este análisis entiendo, en primer lugar, que existen tres subprocesamientos: uno correspondiente al hogar, otro a la persona que completó la encuesta y otro a la percepción sobre las actividades en función del género. También comprendo que el número de ID de esta encuesta no es por hogar, sino por persona de cada hogar (al parecer, la variable p01 de EUT).

Voy a intentar entonces crear una base única de diccionarios para poder realizar los pasos mencionados. Primero, voy a crear una matriz específica para cada una.

dicc_EUT_HOGAR <- read_excel(path = "data/DICCIONARIO EUT2021.xls",
                             sheet = 1, 
                             skip = 5)
dicc_EUT_PERSONA <- read_excel(path = "data/DICCIONARIO EUT2021.xls", 
                               sheet = 2, 
                               skip = 5)
dicc_EUT_ACT <- read_excel(path = "data/DICCIONARIO EUT2021.xls", 
                           sheet = 3, 
                           skip = 5)

Voy a unir estos diccionarios para ahora sí, tener un diccionario único. Primero, chequeo que tengan las mismas columnas.

names(dicc_EUT_HOGAR)
## [1] "...1"                        "...2"                       
## [3] "CÓDIGO"                      "DESCRIPCIÓN Y OBSERVACIONES"
names(dicc_EUT_PERSONA)
## [1] "...1"                        "...2"                       
## [3] "CÓDIGOS"                     "DESCRIPCIÓN Y OBSERVACIONES"
names(dicc_EUT_ACT)
## [1] "...1"                        "...2"                       
## [3] "CÓDIGOS"                     "DESCRIPCIÓN Y OBSERVACIONES"

Como dicc_EUT_HOGAR presenta una columna como CÓDIGO, distinto a CÓDIGOS que presentan tanto dicc_EUT_PERSONA como dicc_EUT_ACT, paso a realizar esa homogenización, para poder unirlos.

dicc_EUT_HOGAR <- dicc_EUT_HOGAR %>% 
  mutate(CÓDIGOS = CÓDIGO) %>% #La variable está escrita distinta en esta hoja.
  select(-CÓDIGO) %>% 
  select(`...1`, `...2`, "CÓDIGOS", "DESCRIPCIÓN Y OBSERVACIONES")

Ahora, chequeo que todas las columnas sean de la misma clase para poder unirlas, y de lo contrario, las transformo en factores.

dicc_EUT_HOGAR <- dicc_EUT_HOGAR %>% 
  mutate(CÓDIGOS = factor(CÓDIGOS))
dicc_EUT_PERSONA <- dicc_EUT_PERSONA %>% 
  mutate(CÓDIGOS = factor(CÓDIGOS))
dicc_EUT_ACT <- dicc_EUT_ACT %>% 
  mutate(CÓDIGOS = factor(CÓDIGOS))
class(dicc_EUT_ACT$CÓDIGOS)
## [1] "factor"
class(dicc_EUT_PERSONA$CÓDIGOS)
## [1] "factor"
class(dicc_EUT_HOGAR$CÓDIGOS)
## [1] "factor"
dicc_EUT <- bind_rows(dicc_EUT_HOGAR, dicc_EUT_PERSONA, dicc_EUT_ACT)

Ahora, tengo un nuevo dicc_EUT con 535, 1 observaciones, por tanto paso a limpiar los NA.

Nomenclatura_EUT <- dicc_EUT %>% 
  filter(!is.na(`...2`))

La cantidad de observaciones en Nomenclatura_EUT(338, 1) debería ser igual a la cantidad de variables de mi base inicial (7316, 1), sin embargo, son distintas. Por lo que puedo observar, hay ciertas inconsistencias en la presentación de la información en forma de diccionario, por tanto voy optar por una base más pequeña en términos de variables. Específicamente, para este trabajo, me gustaría analizar el impacto de la pandemia por COVID-19 en términos de cuidados y trabajo no remunerado en los hogares uruguayos.

EUT_PANDEMIA <- EUT %>% 
  select(NUMERO, #Número de identificación del hogar
         domdepartamento, #Código correlativo del 1 al 19 comenzando por Montevideo y continuando alfabéticamente
         h5, h7, h8, h9, h10, h6, #Cantidad de personas en el hogar, a recodificar
         INSE6, #Servicio Doméstico - variable por hogar, no por persona
         p1, #Edad
         p2, #Sexo
         p3_1, p3_2, p3_3, p3_4, p3_5, p3_6, #Ascendencia principal, a recodificar
         p4, #País de nacimiento (Uruguay/Inmigrante)
         B10, B10_1, B10_2, B11, B11_1, B11_2, #Trabajo no remunerado en tareas de alimentación 
         C13, C13_1, C13_2, C14, C14_1, C14_2, #Trabajo no remunerado en tareas de limpieza 
         D15, D15_1, D15_2, D16, D16_1, D16_2, #Trabajo no remunerado en tareas relacionadas a la ropa
         E17, E17_1, E17_2, E18, E18_1, E18_2, #Trabajo no remunerado en compras
         G20, G20_1, G20_2, #Trabajo no remunerado en tareas de reparaciones
         H21, H21_1, H21_2, #Trabajo no remunerado en trámites
         N_92, # PANDEMIA - Situación laboral pre pandemia 
         N_94, # PANDEMIA - Ingresos post pandemia
         NA_95, # PANDEMIA - Apoyos escolares post pandemia
         NA_96, # PANDEMIA - Colaboración otros hogares post pandemia
         NA_97, # PANDEMIA - Ayuda recibida post pandemia
         )

Ahora, la nueva base, con 7316, 1 variables, voy a recodificar algunas para mejor procesamiento:

  • La variable domdepartamento responde al departamento de residencia del hogar. Me llama la atención que haya solo 18 departamentos cuando Uruguay tiene 19, por tanto elijo tratarlo como una variable binaria entre la capital del país (Montevideo) donde reside aproximadamente la mitad de la población y el resto del país.

  • En cuanto a la variable INSE6, se trata de la contratación de servicio doméstico y las respuestas en el diccionario son: “Sí, todos los días (5 o más días a la semana)”,“Sí, por hora (menos de 5 días a la semana, independientemente de la forma de pago)”, “Sí, con cama” y “No”.

  • En cuanto a la variable p2 responde al sexo de la persona.

  • En el caso de la variable p3_1 a p3_5 recoge binariamente la ascendencia y en caso que haya marcado afirmativa más de una, la variable p3_6 recoge la principal. Entonces, voy a crear una variable ASC que resuma la información y muestre la ascendencia principal.

  • La variable p4 pregunta sobre el país de nacimiento con la posibilidad de responder: “Uruguay” u “Otro”.

  • Las variables B10, B10_1, B10_2, B11, B11_1 y B11_2 cuentan si la persona del hogar dedicó su tiempo -y si lo hizo, cuánto- en el día de ayer a las tareas de alimentación como preparado y cocción de alimentos y servir la comida, poner la mesa, levantar y/o lavar la losa. La primera variable es binaria (Si/No), y en caso de ser positiva, la segunda recoge las horas y la tercera los minutos. Por tanto, la variable final, quedará expresada en minutos. Este procedimiento será el mismo para las siguientes seis variables.

  • Las variables C13, C13_1, C13_2, C14, C14_1, C14_2 cuentan si la persona del hogar dedicó su tiempo -y si lo hizo, cuánto- en el día de ayer a las tareas de limpieza y cuidado de las mascotas o jardín y/o lavado del auto.

  • Las variables D15, D15_1, D15_2, D16, D16_1, D16_2 cuentan si la persona del hogar dedicó su tiempo -y si lo hizo, cuánto- en el día de ayer a las tareas de limpieza y cuidado de la ropa propia o de los miembros del hogar.

  • Las variables E17, E17_1, E17_2, E18, E18_1, E18_2 cuentan si la persona del hogar dedicó su tiempo -y si lo hizo, cuánto- en el día de ayer a las tareas de compras de artículos para el hogar o el cuidado de sí mismo y/o las personas que viven en el.

  • Las variables G20, G20_1, G20_2 cuentan si la persona del hogar dedicó su tiempo -y si lo hizo, cuánto- en el día de ayer al mantenimiento de la vivienda y tareas de reparaciones varias como eléctrica, sanitaria y/o albañilería, entre otras.

  • Las variables H21, H21_1, H21_2 cuentan si la persona del hogar dedicó su tiempo -y si lo hizo, cuánto- en el día de ayer a las gestiones externas como pagar cuentas o realizar algún trámite para el hogar o alguno de sus integrantes.

  • Las variables TNR_total será la suma de todas las TNR anteriores.

Las siguientes cinco variables refieren específicamente a la coyuntura de emergencia sanitaria a raíz de la pandemia por COVID-19, que es el objetivo de estudio de este informe.

  • La variable N_92 consulta sobre la situación personal en tanto al mercado de trabajo previo a la pandemia.

  • La variable N_94 consulta sobre el efecto de la pandemia sobre los ingresos personales.

  • La variable NA_95 recoge información sobre el impacto de la pandemia en el apoyo personal en tareas escolares a niñxs del hogar.

  • La variable NA_96 pregunta sobre la colaboración a otros hogares a partir de la pandemia.

  • Y de manera análoga, la variable NA_97 pregunta sobre la ayuda recibida de otros hogares a raíz de la pandemia.

Ahora sí, paso a renombrar las variables que faltan en la base filtrada EUT_PANDEMIA:

EUT_PANDEMIA <- EUT_PANDEMIA %>% 
  rename(HOGAR = NUMERO,
         PERSONAS_HOGAR = h5, 
         NINXS_0a3 = h7,
         NINXS_4a5 = h8, 
         NINXS_6a12 = h9,
         MAY_65 = h10,
         PERS_DISCAP = h6, 
         EDAD = p1,
         )

Entonces, paso a realizar un summary para tener una primera vista de lo que voy a analizar.

summary(EUT_PANDEMIA)
##      HOGAR        PERSONAS_HOGAR     NINXS_0a3        NINXS_4a5      
##  Min.   :   1.0   Min.   : 1.000   Min.   :0.0000   Min.   :0.00000  
##  1st Qu.: 753.8   1st Qu.: 2.000   1st Qu.:0.0000   1st Qu.:0.00000  
##  Median :1519.5   Median : 3.000   Median :0.0000   Median :0.00000  
##  Mean   :1501.0   Mean   : 3.201   Mean   :0.1366   Mean   :0.08994  
##  3rd Qu.:2253.2   3rd Qu.: 4.000   3rd Qu.:0.0000   3rd Qu.:0.00000  
##  Max.   :2986.0   Max.   :12.000   Max.   :2.0000   Max.   :2.00000  
##                                                                      
##    NINXS_6a12         MAY_65        PERS_DISCAP          EDAD       
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.0000   Min.   :  0.00  
##  1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.: 21.00  
##  Median :0.0000   Median :0.0000   Median :0.0000   Median : 40.00  
##  Mean   :0.3536   Mean   :0.4079   Mean   :0.1359   Mean   : 40.94  
##  3rd Qu.:1.0000   3rd Qu.:1.0000   3rd Qu.:0.0000   3rd Qu.: 60.00  
##  Max.   :4.0000   Max.   :4.0000   Max.   :3.0000   Max.   :104.00  
##                                                                     
##      DPTO                     SERV_DOM        SEXO          ASC           
##  Length:7316        Todos los días:  68   Hombre:3364   Length:7316       
##  Class :character   Por hora      : 199   Mujer :3952   Class :character  
##  Mode  :character   Con cama      :   6                 Mode  :character  
##                     Sin servicio  :2729                                   
##                     NA's          :4314                                   
##                                                                           
##                                                                           
##        PAIS_NAC       TNR_alim          TNR_limpia         TNR_ropa      
##  Uruguay   :7095   Min.   :    0.00   Min.   :   0.00   Min.   :   0.00  
##  Inmigrante: 221   1st Qu.:    0.00   1st Qu.:   0.00   1st Qu.:   0.00  
##                    Median :   30.00   Median :  30.00   Median :   0.00  
##                    Mean   :   59.46   Mean   :  62.39   Mean   :  17.07  
##                    3rd Qu.:   90.00   3rd Qu.:  96.50   3rd Qu.:  20.00  
##                    Max.   :12078.00   Max.   :6039.00   Max.   :6069.00  
##                    NA's   :1196       NA's   :1197      NA's   :1197     
##   TNR_compras       TNR_repara       TNR_tramita        TNR_total      
##  Min.   :   0.0   Min.   :  0.000   Min.   :  0.000   Min.   :    0.0  
##  1st Qu.:   0.0   1st Qu.:  0.000   1st Qu.:  0.000   1st Qu.:   30.0  
##  Median :   0.0   Median :  0.000   Median :  0.000   Median :  120.0  
##  Mean   :  20.6   Mean   :  4.515   Mean   :  3.845   Mean   :  167.9  
##  3rd Qu.:  30.0   3rd Qu.:  0.000   3rd Qu.:  0.000   3rd Qu.:  240.0  
##  Max.   :6039.0   Max.   :600.000   Max.   :240.000   Max.   :18117.0  
##  NA's   :1197     NA's   :1196      NA's   :1196      NA's   :1197     
##               SIT_LAB_PRECOVID       INGR_POSTCOVID APOYO_ESC_POSTCOVID
##  Trabajando           :3267    Aumentó      : 252   Aumentó   : 770    
##  Jubilado/Pensionista :1393    Disminuyó    :1546   Disminuyó :  27    
##  Estudiante           : 640    Incambiado   :3862   Incambiado: 524    
##  Quehaceres del hogar : 416    Ya no percibe: 461   NA's      :5995    
##  Sin trabajo, buscando: 346    NA's         :1195                      
##  (Other)              :  59                                            
##  NA's                 :1195                                            
##  COLAB_OTROS_POSTCOVID AYUDA_REC_POSTCOVID
##  Aumentó   : 961       Aumentó   : 620    
##  Disminuyó :   0       Disminuyó :  83    
##  Incambiado: 123       Incambiado:5418    
##  NA's      :6232       NA's      :1195    
##                                           
##                                           
## 

De este summary() hay, fundamentalmente, dos cosas que me llaman la atención:

  1. Que el número máximo de hogares (HOGAR) sea 2986, lo cual no coincide con el número de observaciones (7316), por tanto no sirve como variable identificadora.

  2. Que es significativa la cantidad de NA en la gran mayoría de las respuestas.

Analizando el diccionario original, el importado desde excel, puedo ver que hay dos variables que corresponden a “identificación del informante”: p0 y p01. p0 es categórica y representa si la persona está respondiendo por sí misma y p01 corresponde a un número de registro de persona. Veamos de qué se trata:

summary(EUT$p01)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   1.000   1.000   1.053   1.000   6.000    3779

No se trata de un número indentificatorio. Voy a agrupar los datos por HOGAR, ya que analizando la base EUT_PANDEMIA me percato que solo el primer registro de cada hogar cuenta con el totalidad de las respuestas correspondientes a los hogares, y que además, de analizarlo por persona, duplicaría algunas respuestas, por tanto me voy a quedar con esta primera respuesta. Entiendo que la función distinct() del paquete dplyr sirve para eso.

HOGARES <- EUT_PANDEMIA %>% 
  distinct(HOGAR, .keep_all = TRUE) %>% 
  select(HOGAR, PERSONAS_HOGAR, NINXS_0a3, NINXS_4a5, NINXS_6a12, MAY_65, PERS_DISCAP, DPTO, SERV_DOM)

Ahora, con 7316 observaciones, vuelvo a realizar un summary():

summary(HOGARES)
##      HOGAR        PERSONAS_HOGAR    NINXS_0a3         NINXS_4a5      
##  Min.   :   1.0   Min.   : 1.00   Min.   :0.00000   Min.   :0.00000  
##  1st Qu.: 747.2   1st Qu.: 1.00   1st Qu.:0.00000   1st Qu.:0.00000  
##  Median :1493.5   Median : 2.00   Median :0.00000   Median :0.00000  
##  Mean   :1493.5   Mean   : 2.45   Mean   :0.07937   Mean   :0.05358  
##  3rd Qu.:2239.8   3rd Qu.: 3.00   3rd Qu.:0.00000   3rd Qu.:0.00000  
##  Max.   :2986.0   Max.   :12.00   Max.   :2.00000   Max.   :2.00000  
##    NINXS_6a12         MAY_65        PERS_DISCAP         DPTO          
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.0000   Length:2986       
##  1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:0.0000   Class :character  
##  Median :0.0000   Median :0.0000   Median :0.0000   Mode  :character  
##  Mean   :0.2029   Mean   :0.4745   Mean   :0.1122                     
##  3rd Qu.:0.0000   3rd Qu.:1.0000   3rd Qu.:0.0000                     
##  Max.   :4.0000   Max.   :4.0000   Max.   :3.0000                     
##            SERV_DOM   
##  Todos los días:  65  
##  Por hora      : 191  
##  Con cama      :   6  
##  Sin servicio  :2641  
##  NA's          :  83  
## 

Y voy a crear otro objeto que tenga las respuestas personales, para evaluar dentro de este marco, la distribución de las tareas de cuidados y el impacto de la pandemia en estos términos.

PERSONAS <- EUT_PANDEMIA %>% 
  select(HOGAR, # Mantengo el número de HOGAR para poder cruzarlo con `HOGARES` en caso necesario
         EDAD, 
         DPTO, 
         SEXO, 
         ASC, 
         PAIS_NAC, 
         TNR_alim, 
         TNR_limpia, 
         TNR_ropa, 
         TNR_compras, 
         TNR_repara, 
         TNR_tramita, 
         TNR_total,
         SIT_LAB_PRECOVID, 
         INGR_POSTCOVID, 
         APOYO_ESC_POSTCOVID,
         COLAB_OTROS_POSTCOVID, 
         AYUDA_REC_POSTCOVID)
summary(PERSONAS)
##      HOGAR             EDAD            DPTO               SEXO     
##  Min.   :   1.0   Min.   :  0.00   Length:7316        Hombre:3364  
##  1st Qu.: 753.8   1st Qu.: 21.00   Class :character   Mujer :3952  
##  Median :1519.5   Median : 40.00   Mode  :character                
##  Mean   :1501.0   Mean   : 40.94                                   
##  3rd Qu.:2253.2   3rd Qu.: 60.00                                   
##  Max.   :2986.0   Max.   :104.00                                   
##                                                                    
##      ASC                  PAIS_NAC       TNR_alim          TNR_limpia     
##  Length:7316        Uruguay   :7095   Min.   :    0.00   Min.   :   0.00  
##  Class :character   Inmigrante: 221   1st Qu.:    0.00   1st Qu.:   0.00  
##  Mode  :character                     Median :   30.00   Median :  30.00  
##                                       Mean   :   59.46   Mean   :  62.39  
##                                       3rd Qu.:   90.00   3rd Qu.:  96.50  
##                                       Max.   :12078.00   Max.   :6039.00  
##                                       NA's   :1196       NA's   :1197     
##     TNR_ropa        TNR_compras       TNR_repara       TNR_tramita     
##  Min.   :   0.00   Min.   :   0.0   Min.   :  0.000   Min.   :  0.000  
##  1st Qu.:   0.00   1st Qu.:   0.0   1st Qu.:  0.000   1st Qu.:  0.000  
##  Median :   0.00   Median :   0.0   Median :  0.000   Median :  0.000  
##  Mean   :  17.07   Mean   :  20.6   Mean   :  4.515   Mean   :  3.845  
##  3rd Qu.:  20.00   3rd Qu.:  30.0   3rd Qu.:  0.000   3rd Qu.:  0.000  
##  Max.   :6069.00   Max.   :6039.0   Max.   :600.000   Max.   :240.000  
##  NA's   :1197      NA's   :1197     NA's   :1196      NA's   :1196     
##    TNR_total                    SIT_LAB_PRECOVID       INGR_POSTCOVID
##  Min.   :    0.0   Trabajando           :3267    Aumentó      : 252  
##  1st Qu.:   30.0   Jubilado/Pensionista :1393    Disminuyó    :1546  
##  Median :  120.0   Estudiante           : 640    Incambiado   :3862  
##  Mean   :  167.9   Quehaceres del hogar : 416    Ya no percibe: 461  
##  3rd Qu.:  240.0   Sin trabajo, buscando: 346    NA's         :1195  
##  Max.   :18117.0   (Other)              :  59                        
##  NA's   :1197      NA's                 :1195                        
##  APOYO_ESC_POSTCOVID COLAB_OTROS_POSTCOVID AYUDA_REC_POSTCOVID
##  Aumentó   : 770     Aumentó   : 961       Aumentó   : 620    
##  Disminuyó :  27     Disminuyó :   0       Disminuyó :  83    
##  Incambiado: 524     Incambiado: 123       Incambiado:5418    
##  NA's      :5995     NA's      :6232       NA's      :1195    
##                                                               
##                                                               
## 

Sigue habiendo una cantidad considerable de NAs, principalmente en las variables APOYO_ESC_POSTCOVID y COLAB_OTROS_POSTCOVID. A su vez, existe una cantidad prácticamente igual de NAs para las variables TNR_alim, TNR_limpia, TNR_ropa, TNR_compras, TNR_repara, TNR_tramita, TNR_total, SIT_LAB_PRECOVID, INGR_POSTCOVID y AYUDA_REC_POSTCOVID.

colSums(is.na(PERSONAS))
##                 HOGAR                  EDAD                  DPTO 
##                     0                     0                     0 
##                  SEXO                   ASC              PAIS_NAC 
##                     0                    70                     0 
##              TNR_alim            TNR_limpia              TNR_ropa 
##                  1196                  1197                  1197 
##           TNR_compras            TNR_repara           TNR_tramita 
##                  1197                  1196                  1196 
##             TNR_total      SIT_LAB_PRECOVID        INGR_POSTCOVID 
##                  1197                  1195                  1195 
##   APOYO_ESC_POSTCOVID COLAB_OTROS_POSTCOVID   AYUDA_REC_POSTCOVID 
##                  5995                  6232                  1195

Entiendo que puede deberse a dos causas distintas. Pero en primer lugar, filtraría a los mayores de 14 años, que son los que están en edad de trabajar según la legislatura nacional.

PERSONAS_ADULTAS <- PERSONAS %>% 
  filter(EDAD > 14)

Chequeo que efectivamente esto corresponda a las personas menores a 14.

PERSONAS %>% 
  filter (EDAD <= 14) %>% 
  count()
##      n
## 1 1195
colSums(is.na(PERSONAS_ADULTAS))
##                 HOGAR                  EDAD                  DPTO 
##                     0                     0                     0 
##                  SEXO                   ASC              PAIS_NAC 
##                     0                    58                     0 
##              TNR_alim            TNR_limpia              TNR_ropa 
##                     1                     2                     2 
##           TNR_compras            TNR_repara           TNR_tramita 
##                     2                     1                     1 
##             TNR_total      SIT_LAB_PRECOVID        INGR_POSTCOVID 
##                     2                     0                     0 
##   APOYO_ESC_POSTCOVID COLAB_OTROS_POSTCOVID   AYUDA_REC_POSTCOVID 
##                  4800                  5037                     0

Veo que al hacer esto, la cantidad de NA resulta razonable para las variables SIT_LAB_PRECOVID, INGR_POSTCOVID y AYUDA_REC_POSTCOVID.

En cuanto APOYO_ESC_POSTCOVID (NA_95) y COLAB_OTROS_POSTCOVID (NA_96) resulta que existe una cuarta categoría (“4”) que no está presente en el diccionario de variables y tampoco en el manual de encuesta, por tanto se deberá tener esto cuenta como limitante al analizarlas.

Visualización de datos

Respondentes

Visualicemos primero algunas variables con respecto a los hogares y personas respondentes. Interesa saber, en primer lugar, de qué rangos etarios estamos hablando y teniendo en cuenta especialmente que se trata de una encuesta sobre tareas de cuidados, la diferenciación por sexo. Voy a intentar visualizarlo con una pirámide de edades.

# Tramos de edad
TRAMOS_EDAD <- c("0-14", "15-24", "25-34", "35-44", "45-54", "55-64", "65-74", "75 o más")

# Nueva variable
PERSONAS$TRAMOS_EDAD <- cut(PERSONAS$EDAD, 
                            breaks = c(0, 14, 24, 34, 44, 54, 64, 74, Inf), 
                            labels = TRAMOS_EDAD, 
                            include.lowest = TRUE)

# Tabla de doble entrada
tabla_doble_entrada <- xtabs(~ TRAMOS_EDAD + SEXO, 
                             data = PERSONAS) 

# Como dataframe
tabla_doble_entrada <- as.data.frame(tabla_doble_entrada)  
tabla_pivoteada <- tabla_doble_entrada %>% 
  pivot_wider (names_from = "SEXO", 
               values_from = "Freq")
ggplot(PERSONAS, aes(x = EDAD, fill = SEXO)) +
  geom_bar(data = subset(PERSONAS, SEXO == "Hombre"), aes(y = -after_stat(count)), width = 1) +
  geom_bar(data = subset(PERSONAS, SEXO == "Mujer"), aes(y = after_stat(count)), width = 1) +
  coord_flip() +
  labs(title = "Distribución de edades según sexo",
       subtitle = "",
       x = "",
       y = "",
       tag = "Gráfico 1",
       fill = "", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_y_continuous(breaks = c(0, 50)) +
  scale_x_continuous(breaks = c(0, 15, 25, 35, 45, 55, 65, 75, 85, 95)) +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() +
  theme(legend.position = "top", 
        axis.text.x = element_text(hjust = 1))

De esto tenemos no solo que la cantidad de mujeres que respondió fue mayor sino que hay una tendencia a edades mayores entre las mujeres que respondieron la encuesta.

ggsave(path = "resultados/", 
       filename = "Distribución de edades según sexo.png")

También interesa ver dónde residen estas personas y su ascendencia étnica.

tabla_ASC_DPTO <- PERSONAS %>% 
  group_by(ASC, DPTO) %>% 
  count(ASC, 
        name = "cant_ASC") %>% 
  pivot_wider(names_from = "DPTO", 
              values_from = "cant_ASC")
write.table(tabla_ASC_DPTO, 
            sep = "\t", 
            file = "resultados/Ascendencia por departamento.txt", 
            row.names = FALSE)
PERSONAS %>%
  count(ASC,
        name = "cant_ASC") %>%
  mutate(prop_ASC = round(cant_ASC / sum(cant_ASC)*100, 1))
##        ASC cant_ASC prop_ASC
## 1     Afro      476      6.5
## 2 Asiática      102      1.4
## 3   Blanca     6325     86.5
## 4 Indígena      192      2.6
## 5     Otra      151      2.1
## 6     <NA>       70      1.0
PERSONAS %>%
  count(ASC, 
        name = "cant_ASC") %>% 
  mutate(prop_ASC = round(cant_ASC / sum(cant_ASC)*100, 1)) %>% 
  arrange(desc(prop_ASC)) %>%  # Proporción descendente
  ggplot(aes(x = reorder(ASC, -prop_ASC), y = cant_ASC)) +
    geom_bar(stat = "identity", fill= "#023047", color = "#ffb703") +
    geom_text(aes(label = paste0(prop_ASC, "%")), vjust = -0.5, size = 3.5) +  
    labs(title = "Ascendencia principal",
         subtitle = "",
         x = "",
         y = "",
         tag = "Gráfico 2", 
         caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    theme_minimal() + 
    theme(legend.position = "top", 
          axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Ascendencia principal.png")

Ahora, si observamos la ascendencia por departamento, vemos que la proporción

PERSONAS %>% 
  group_by(ASC, DPTO) %>% 
  count(ASC, 
        name = "cant_ASC") %>% 
  ggplot(aes(x = ASC, y = cant_ASC, fill = DPTO)) +
    geom_bar(stat = "identity", position = "dodge") +
    labs(title = "Ascendencia principal por departamento",
           subtitle = "",
           x = "",
           y = "",
           fill = "",
           tag = "Gráfico 3", 
           caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    scale_fill_manual(values = c("Montevideo" = "#fb8500", "Resto del país" = "#ffb703")) +
    theme_minimal() + 
    theme(legend.position = "right", 
          axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Ascendencia principal por departamento.png")

En cuanto a la composición de los hogares, podemos ver que la mayoría de los hogares están compuestos por tres o menos personas.

HOGARES %>%
  ggplot(aes(x = PERSONAS_HOGAR)) +
  geom_histogram(binwidth = 1, fill= "#023047", color = "#ffb703") +
  labs(title = "Cantidad de personas que componen los hogares",
       subtitle = "",
       x = "Cantidad de Personas",
       y = "",
       fill = "",
       tag = "Gráfico 4", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_x_continuous(breaks = c(1:12)) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Cantidad de personas por hogar.png")

También, que la mayor cantidad de niñxs se concentran en hogares con 3 a 5 personas, y que los adultos mayores a 65 años así como las personas con discapacidad lo hacen en hogares con 3 o menos personas.

tabla_COMPOSICION_HOGARES <- HOGARES %>%
  group_by(PERSONAS_HOGAR) %>%
  summarise(
    CANTIDAD_HOGARES=n(),
    NINXS = sum(NINXS_0a3, NINXS_4a5, NINXS_6a12),
    MAY = sum(MAY_65),
    DISC = sum(PERS_DISCAP))
write.table(tabla_COMPOSICION_HOGARES, 
            sep = "\t", 
            file = "resultados/Composición de los hogares.txt", 
            row.names = FALSE)

Tareas de trabajo no remunerado

Ahora bien, visualicemos las variables de interés, que tienen que ver con el tiempo ocupado en tareas de cuidado y trabajo no remunerado.

PERSONAS_ADULTAS %>% 
  group_by(TNR_total, SEXO) %>% 
  filter(TNR_total < 960) %>% # Para evitar errores de recodificación, 960 equivale a 16 horas hábiles disponibles 
  ggplot(aes(x=HOGAR, y= TNR_total, color=SEXO)) +
  geom_point(size=1.5, alpha=0.7) +
  labs(title = "Tiempo total empleado en trabajo no remunerado, por sexo",
       subtitle = "",
       x = "",
       y = "Tiempo (en minutos)",
       color = "",
       tag = "Gráfico 5", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_color_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en trabajo no remunerado, por sexo.png")
PERSONAS_ADULTAS %>% 
  group_by(TNR_total, SEXO) %>% 
  filter(TNR_total < 960) %>% # Para evitar errores de recodificación, 960 equivale a 16 horas hábiles disponibles 
  ggplot(aes(x=SEXO, y=TNR_total)) +
    geom_boxplot() +
    coord_flip() +
    labs(title = "Tiempo total empleado en trabajo no remunerado, por sexo",
       subtitle = "",
       x = "",
       y = "Tiempo (en minutos)",
       color = "",
       tag = "Gráfico 6", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    theme_minimal() + 
    theme(legend.position = "right", 
          axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en trabajo no remunerado, por sexo (boxplot).png")

Ya en un primer panorama se puede ver que las mujeres dedican mucho más Ahora bien, veámoslo por tareas: cómo se distribuye la carga entre hombres y mujeres de las tareas de alimentación, limpieza, relacionadas al cuidado de la ropa, compras, de reparaciones y trámites.

PERSONAS_ADULTAS %>%
  group_by(TNR_alim, SEXO) %>%
  filter(TNR_total < 1440 & TNR_total > 0,
         TNR_alim < 960 & TNR_alim > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16  
  ggplot(aes(x = TNR_alim)) +
  geom_histogram(aes(fill=SEXO), 
                 colour = "#023047", 
                 alpha = 0.7, 
                 bins = 30) +
  labs(title = "Tiempo total empleado en tareas de alimentación, por sexo",
       subtitle = "",
       x = "Tiempo (en minutos)",
       y = "",
       fill = "",
       tag = "Gráfico 7", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en tareas de alimentación, por sexo.png")
PERSONAS_ADULTAS %>%
  group_by(TNR_limpia, SEXO) %>%
  filter(TNR_total < 1440 & TNR_total > 0,
         TNR_limpia < 960 & TNR_limpia > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16  
  ggplot(aes(x = TNR_limpia)) +
  geom_histogram(aes(fill=SEXO), 
                 colour = "#023047", 
                 alpha = 0.7, 
                 bins = 30) +
  labs(title = "Tiempo total empleado en tareas de limpieza, por sexo",
       subtitle = "",
       x = "Tiempo (en minutos)",
       y = "",
       fill = "",
       tag = "Gráfico 8", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en tareas de limpieza, por sexo.png")
PERSONAS_ADULTAS %>%
  group_by(TNR_ropa, SEXO) %>%
  filter(TNR_total < 1440 & TNR_total > 0,
         TNR_ropa < 960 & TNR_ropa > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16  
  ggplot(aes(x = TNR_ropa)) +
  geom_histogram(aes(fill=SEXO), 
                 colour = "#023047", 
                 alpha = 0.7, 
                 bins = 30) +
  labs(title = "Tiempo total empleado en tareas de limpieza de la ropa, por sexo",
       subtitle = "",
       x = "Tiempo (en minutos)",
       y = "",
       fill = "",
       tag = "Gráfico 9", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en tareas de limpieza de ropa, por sexo.png")
PERSONAS_ADULTAS %>%
  group_by(TNR_compras, SEXO) %>%
  filter(TNR_total < 1440 & TNR_total > 0,
         TNR_compras < 960 & TNR_compras > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16  
  ggplot(aes(x = TNR_compras)) +
  geom_histogram(aes(fill=SEXO), 
                 colour = "#023047", 
                 alpha = 0.7, 
                 bins = 30) +
  labs(title = "Tiempo total empleado en tareas de compras, por sexo",
       subtitle = "",
       x = "Tiempo (en minutos)",
       y = "",
       fill = "",
       tag = "Gráfico 10", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en tareas de compras, por sexo.png")
PERSONAS_ADULTAS %>%
  group_by(TNR_repara, SEXO) %>%
  filter(TNR_total < 1440 & TNR_total > 0,
         TNR_repara < 960 & TNR_repara > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16  
  ggplot(aes(x = TNR_repara)) +
  geom_histogram(aes(fill=SEXO), 
                 colour = "#023047", 
                 alpha = 0.7, 
                 bins = 30) +
  labs(title = "Tiempo total empleado en tareas de reparación, por sexo",
       subtitle = "",
       x = "Tiempo (en minutos)",
       y = "",
       fill = "",
       tag = "Gráfico 11", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en tareas de reparación, por sexo.png")
PERSONAS_ADULTAS %>%
  group_by(TNR_tramita, SEXO) %>%
  filter(TNR_total < 1440 & TNR_total > 0,
         TNR_tramita < 960 & TNR_tramita > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16  
  ggplot(aes(x = TNR_tramita)) +
  geom_histogram(aes(fill=SEXO), 
                 colour = "#023047", 
                 alpha = 0.7, 
                 bins = 30) +
  labs(title = "Tiempo total empleado en trámites, por sexo",
       subtitle = "",
       x = "Tiempo (en minutos)",
       y = "",
       fill = "",
       tag = "Gráfico 12", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Tiempo total empleado en tareas de trámites, por sexo.png")

Con estos últimos gráficos se puede corroborar que efectivamente las tareas de cuidados recaen en mayor medida sobre las mujeres y que estas destinan más tiempo que los varones a realizarlas. En el único caso en que no se pudo apreciar este comportamiento fue en el caso de las tareas de reparación, que están esteriotípicamente asociadas a los varones y por ende, esto reafirma la desigualdad de género.

Efecto de la pandemia por COVID-19

Una primera variable nos indica respecto a la situación laboral de los respondentes previo a la pandemia y confinamiento por COVID-19.

PERSONAS_ADULTAS %>%
  group_by(SIT_LAB_PRECOVID) %>%
  summarise(count=n()) %>%
  ggplot(aes(x = count, y = reorder(SIT_LAB_PRECOVID, count))) +
  geom_col(fill= "#023047", color = "#ffb703") +
  labs(title = "Situación laboral antes de la llegada del coronavirus",
       subtitle = "",
       x = "",
       y = "",
       fill = "",
       tag = "Gráfico 13", 
       caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
  theme_minimal() + 
  theme(legend.position = "right", 
        axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Situación laboral antes de la llegada del coronavirus.png")

Y concretamente a lo que nos interesa:

PERSONAS_ADULTAS %>% 
  select(INGR_POSTCOVID, SEXO) %>% 
  ggplot(aes(x=INGR_POSTCOVID), fill= SEXO) +
    geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
    labs(title = "Situación en los ingresos como resultado de la pandemia",
         subtitle = "",
         x = "",
         y = "",
         fill = "",
         tag = "Gráfico 14", 
         caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    geom_text(aes(label = after_stat(count)),       
              position=position_dodge(0.9),
              vjust= -0.5, 
              size=3, 
              stat = "count") +
    facet_wrap(~ SEXO) +  
    theme_minimal() + 
    theme(legend.position = "right",
          axis.text.x = element_text(hjust = 1, 
                                     angle = 30))

ggsave(path = "resultados/", 
       filename = "Situación en los ingresos como resultado de la pandemia.png")
PERSONAS_ADULTAS %>% 
  select(APOYO_ESC_POSTCOVID, SEXO) %>%
  filter(!is.na(APOYO_ESC_POSTCOVID)) %>% 
  ggplot(aes(x=APOYO_ESC_POSTCOVID), fill= SEXO) +
    geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
    labs(title = "Apoyo en tareas escolares a niñxs del hogar como resultado de la pandemia",
         subtitle = "",
         x = "",
         y = "",
         fill = "",
         tag = "Gráfico 15", 
         caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    geom_text(aes(label = after_stat(count)),       
              position=position_dodge(0.9),
              vjust= -0.5, 
              size=3, 
              stat = "count") +
    facet_wrap(~ SEXO) +  
    theme_minimal() + 
    theme(legend.position = "right",
          axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Apoyo en tareas escolares a niñxs del hogar como resultado de la pandemia.png")
PERSONAS_ADULTAS %>% 
  select(COLAB_OTROS_POSTCOVID, SEXO) %>%
  filter(!is.na(COLAB_OTROS_POSTCOVID)) %>% 
  ggplot(aes(x=COLAB_OTROS_POSTCOVID), fill= SEXO) +
    geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
    labs(title = "Colaboración a otros hogares como resultado de la pandemia",
         subtitle = "",
         x = "",
         y = "",
         fill = "",
         tag = "Gráfico 16", 
         caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    geom_text(aes(label = after_stat(count)),       
              position=position_dodge(0.9),
              vjust= -0.5, 
              size=3, 
              stat = "count") +
    facet_wrap(~ SEXO) +  
    theme_minimal() + 
    theme(legend.position = "right",
          axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Colaboración a otros hogares como resultado de la pandemia.png")
PERSONAS_ADULTAS %>% 
  select(AYUDA_REC_POSTCOVID, SEXO) %>%
  filter(!is.na(AYUDA_REC_POSTCOVID)) %>% 
  ggplot(aes(x=AYUDA_REC_POSTCOVID)) +
    geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
    labs(title = "Ayuda recibida de otros hogares como resultado de la pandemia",
         subtitle = "",
         x = "",
         y = "",
         fill = "",
         tag = "Gráfico 17", 
         caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
    geom_text(aes(label = after_stat(count)),       
              position=position_dodge(0.9),
              vjust= -0.5, 
              size=3, 
              stat = "count") +
    theme_minimal() + 
    theme(legend.position = "right",
          axis.text.x = element_text(hjust = 0.5))

ggsave(path = "resultados/", 
       filename = "Ayuda recibida de otros hogares como resultado de la pandemia.png")
Conclusiones

Estos últimos gráficos nos ayudan a visibilizar que la pandemia en cuanto a tareas de cuidados aumentó la brecha existente entre hombres y mujeres, sumando peso a estas últimas, ante un Estado que estuvo prácticamente ausente.

En cuanto a la percepción de ingresos personales, 278 mujeres -frente a 183 hombres- dejaron de recibirlos. En base a estas preguntas, también podemos ver que el apoyo a las tareas escolares de lxs niñxs del hogar recayó sobre las mujeres en mucho mayor medida que sobre los hombres, y que también fueron estas quienes en mayor medida aumentaron su colaboración en tareas de cuidados de otros hogares, mientras que la ayuda percibida de otros hogares se mantuvo relativamente igual.

A modo de cierre, es preciso recordar que el procesamiento es preliminar y que en estas últimas variables hay algunos problemas de base como categorías que no fueron codificadas y que eso puede alterar los resultados de una manera no deseada.

En cuanto a conclusiones del ámbito personal, esta base me trajo muchos dolores de cabeza -seguramente fruto de la inexperiencia absoluta-, pero, pasando raya, casi un mes después de empezar a trabajarla, disfruté mucho de ir buscando alternativas para resolver los desafíos que se me fueron presentando, más allá de que no siempre encontré las soluciones o quizás las encontradas no fueran las más eficientes. En particular, me gustaría haber resuelto el tema de la codificación con el diccionario de variables. Le dí muchísimas vueltas a eso pero no encontré el camino. Por otro lado, me gustaría que las parte de visualización hubiera sido mejor. Creo que en muchos casos las gráficas elegidas no fueron las mejores para lo que estaba queriendo mostrar. Pero en definitiva, fue un trabajo que disfruté mucho, también porque es un tema de gran interés para mí.