¿Quién nos cuidó? ¿Quién nos alimentó, bañó, entretuvo, consoló…? Si apelamos a nuestros recuerdos de la infancia, sin pensarlo mucho, seguramente las primeras imágenes que se nos aparezcan sean mujeres: madres, abuelas, tías, hermanas, vecinas… Si bien los hombres cada vez más van tomando más protagonismo en estas tareas relacionadas al llamado “trabajo no remunerado”, quienes ponen el cuerpo siguen siendo las mujeres. En 2020 se dio un evento sin precedentes: la pandemia por COVID-19 generó a lo largo y ancho del mundo un confinamiento al interior de los hogares, llevando la presión y carga de esas tareas de cuidados al límite. ¿Quién se hizo cargo de esto?
Hasta hace no mucho tiempo, se daba por sentado que el trabajo relacionado con cuidados y limpieza del hogar era intríseco a las mujeres. Si nos remontamos -un poco- más para atrás, tampoco había un cuestionamiento relativo a la posibilidad este fuera remunerado o considerado como trabajo. “La que nos ayuda en casa”, “la que viene a darle una mano a mamá”, “la que se queda con mi hermano mientras mis padres trabajan”, “la que cuida de mi abuelo”, seguramente sean expresiones que resuenen en quien lee este texto.
El concepto de trabajo no remunerado es reciente y su inclusión en cláusulas de convenios laborales o incluso en la legislación más aún. Las encuestas de uso del tiempo aportan información sobre la forma en que las personas distribuyen su tiempo en función de las actividades que realizan y asimismo, la división del trabajo (remunerado y no remunerado) entre mujeres y hombres y su distribución a la interna del hogar, lo cual resulta imprescindible para poder avanzar hacia una sociedad en la que nos cuidemos entre todxs.
Entre 2021 y 2022,el Instituto Nacional de Estadística y el Ministerio de Desarrollo Social realizaron una nueva edición de la Encuesta de Uso del Tiempo y Trabajo No Remunerado, la segunda en nuestro país. El informe ministerial -incluido en la carpeta “docs”- fue divulgado en marzo de este año y los microdatos utilizados para este informe fueron publicados el 19 de julio de 2023.
Este informe es realizado en el marco de la materia de Ciencia de Datos I del posgrado de Big Data e inteligencia territorial de FLACSO Argentina con el objetivo de interiorizarme en el procesamiento de datos en el software R y, por tanto, los resultados serán a efectos de adentrarme en el procesamiento con este lenguaje y en este sentido, parciales y no exhaustivos.
En primer lugar, levantamos las carpetas y cargamos la librería
tidyverse
.
source("scripts/Estructura_carpetas.R")
#install.packages("tidyverse")
library(tidyverse)
Vamos a cargar también los microdatos correspondientes a la Encuesta de Uso del Tiempo y Trabajo No Remunerado disponible en este link
EUT <- read.csv(file = "data/eut_externa_2021.csv",
header = TRUE,
stringsAsFactors = TRUE,
encoding = "UTF-8")
Analizamos las dimensiones de la matriz y con esto obtenemos que se trata de una encuesta con 7316 observaciones y 351 variables. Paso entonces a observar el nombre de las primeras 20 variables para entender mejor la manera en que está presentada la información.
head(colnames(EUT), n = 20)
## [1] "domanio" "NUMERO" "domdepartamento" "domseccion"
## [5] "domsegmento" "domlocalidad" "w" "PERINFORMANTE"
## [9] "PERNRO" "h1" "h2" "h5"
## [13] "h7" "h8" "h9" "h10"
## [17] "h6" "INSE1_1" "INSE1_2" "INSE1_3"
Dado que resulta difícil interpretar el significado de las variables
por su denominación, paso a importar desde el siguiente link
el diccionario correspondiente a la encuesta. Para esto cargo la
librería readxl
:
#install.packages("readxl")
library(readxl)
dicc_EUT <- read_excel(path = "data/DICCIONARIO EUT2021.xls",
skip= 5)
Como primera idea, se me ocurre realizar un
pivot_longer
, un left_join
y luego un
pivot_wider
para extraer del diccionario una codificación
más acorde al concepto de cada variable y “pegárselo” a la base, pero al
analizar la tabla de excel me encuentro con un documento que a simple
vista no está presentado como para cruzar bases.
No obstante, de este análisis entiendo, en primer lugar, que existen
tres subprocesamientos: uno correspondiente al hogar, otro a la persona
que completó la encuesta y otro a la percepción sobre las actividades en
función del género. También comprendo que el número de ID de esta
encuesta no es por hogar, sino por persona de cada hogar (al parecer, la
variable p01
de EUT
).
Voy a intentar entonces crear una base única de diccionarios para poder realizar los pasos mencionados. Primero, voy a crear una matriz específica para cada una.
dicc_EUT_HOGAR <- read_excel(path = "data/DICCIONARIO EUT2021.xls",
sheet = 1,
skip = 5)
dicc_EUT_PERSONA <- read_excel(path = "data/DICCIONARIO EUT2021.xls",
sheet = 2,
skip = 5)
dicc_EUT_ACT <- read_excel(path = "data/DICCIONARIO EUT2021.xls",
sheet = 3,
skip = 5)
Voy a unir estos diccionarios para ahora sí, tener un diccionario único. Primero, chequeo que tengan las mismas columnas.
names(dicc_EUT_HOGAR)
## [1] "...1" "...2"
## [3] "CÓDIGO" "DESCRIPCIÓN Y OBSERVACIONES"
names(dicc_EUT_PERSONA)
## [1] "...1" "...2"
## [3] "CÓDIGOS" "DESCRIPCIÓN Y OBSERVACIONES"
names(dicc_EUT_ACT)
## [1] "...1" "...2"
## [3] "CÓDIGOS" "DESCRIPCIÓN Y OBSERVACIONES"
Como dicc_EUT_HOGAR
presenta una columna como CÓDIGO,
distinto a CÓDIGOS que presentan tanto dicc_EUT_PERSONA
como dicc_EUT_ACT
, paso a realizar esa homogenización, para
poder unirlos.
dicc_EUT_HOGAR <- dicc_EUT_HOGAR %>%
mutate(CÓDIGOS = CÓDIGO) %>% #La variable está escrita distinta en esta hoja.
select(-CÓDIGO) %>%
select(`...1`, `...2`, "CÓDIGOS", "DESCRIPCIÓN Y OBSERVACIONES")
Ahora, chequeo que todas las columnas sean de la misma clase para poder unirlas, y de lo contrario, las transformo en factores.
dicc_EUT_HOGAR <- dicc_EUT_HOGAR %>%
mutate(CÓDIGOS = factor(CÓDIGOS))
dicc_EUT_PERSONA <- dicc_EUT_PERSONA %>%
mutate(CÓDIGOS = factor(CÓDIGOS))
dicc_EUT_ACT <- dicc_EUT_ACT %>%
mutate(CÓDIGOS = factor(CÓDIGOS))
class(dicc_EUT_ACT$CÓDIGOS)
## [1] "factor"
class(dicc_EUT_PERSONA$CÓDIGOS)
## [1] "factor"
class(dicc_EUT_HOGAR$CÓDIGOS)
## [1] "factor"
dicc_EUT <- bind_rows(dicc_EUT_HOGAR, dicc_EUT_PERSONA, dicc_EUT_ACT)
Ahora, tengo un nuevo dicc_EUT
con 535, 1 observaciones,
por tanto paso a limpiar los NA
.
Nomenclatura_EUT <- dicc_EUT %>%
filter(!is.na(`...2`))
La cantidad de observaciones en Nomenclatura_EUT
(338, 1)
debería ser igual a la cantidad de variables de mi base inicial (7316,
1), sin embargo, son distintas. Por lo que puedo observar, hay ciertas
inconsistencias en la presentación de la información en forma de
diccionario, por tanto voy optar por una base más pequeña en términos de
variables. Específicamente, para este trabajo, me gustaría analizar el
impacto de la pandemia por COVID-19 en términos de cuidados y trabajo no
remunerado en los hogares uruguayos.
EUT_PANDEMIA <- EUT %>%
select(NUMERO, #Número de identificación del hogar
domdepartamento, #Código correlativo del 1 al 19 comenzando por Montevideo y continuando alfabéticamente
h5, h7, h8, h9, h10, h6, #Cantidad de personas en el hogar, a recodificar
INSE6, #Servicio Doméstico - variable por hogar, no por persona
p1, #Edad
p2, #Sexo
p3_1, p3_2, p3_3, p3_4, p3_5, p3_6, #Ascendencia principal, a recodificar
p4, #País de nacimiento (Uruguay/Inmigrante)
B10, B10_1, B10_2, B11, B11_1, B11_2, #Trabajo no remunerado en tareas de alimentación
C13, C13_1, C13_2, C14, C14_1, C14_2, #Trabajo no remunerado en tareas de limpieza
D15, D15_1, D15_2, D16, D16_1, D16_2, #Trabajo no remunerado en tareas relacionadas a la ropa
E17, E17_1, E17_2, E18, E18_1, E18_2, #Trabajo no remunerado en compras
G20, G20_1, G20_2, #Trabajo no remunerado en tareas de reparaciones
H21, H21_1, H21_2, #Trabajo no remunerado en trámites
N_92, # PANDEMIA - Situación laboral pre pandemia
N_94, # PANDEMIA - Ingresos post pandemia
NA_95, # PANDEMIA - Apoyos escolares post pandemia
NA_96, # PANDEMIA - Colaboración otros hogares post pandemia
NA_97, # PANDEMIA - Ayuda recibida post pandemia
)
Ahora, la nueva base, con 7316, 1 variables, voy a recodificar algunas para mejor procesamiento:
La variable domdepartamento
responde al departamento
de residencia del hogar. Me llama la atención que haya solo 18
departamentos cuando Uruguay tiene 19, por tanto elijo tratarlo como una
variable binaria entre la capital del país (Montevideo) donde reside
aproximadamente la mitad de la población y el resto del país.
En cuanto a la variable INSE6
, se trata de la
contratación de servicio doméstico y las respuestas en el diccionario
son: “Sí, todos los días (5 o más días a la semana)”,“Sí, por hora
(menos de 5 días a la semana, independientemente de la forma de pago)”,
“Sí, con cama” y “No”.
En cuanto a la variable p2
responde al sexo de la
persona.
En el caso de la variable p3_1
a p3_5
recoge binariamente la ascendencia y en caso que haya marcado afirmativa
más de una, la variable p3_6
recoge la principal. Entonces,
voy a crear una variable ASC
que resuma la información y
muestre la ascendencia principal.
La variable p4
pregunta sobre el país de nacimiento
con la posibilidad de responder: “Uruguay” u “Otro”.
Las variables B10
, B10_1
,
B10_2
, B11
, B11_1
y
B11_2
cuentan si la persona del hogar dedicó su tiempo -y
si lo hizo, cuánto- en el día de ayer a las tareas de alimentación como
preparado y cocción de alimentos y servir la comida, poner la mesa,
levantar y/o lavar la losa. La primera variable es binaria (Si/No), y en
caso de ser positiva, la segunda recoge las horas y la tercera los
minutos. Por tanto, la variable final, quedará expresada en minutos.
Este procedimiento será el mismo para las siguientes seis
variables.
Las variables C13
, C13_1
,
C13_2
, C14
, C14_1
,
C14_2
cuentan si la persona del hogar dedicó su tiempo -y
si lo hizo, cuánto- en el día de ayer a las tareas de limpieza y cuidado
de las mascotas o jardín y/o lavado del auto.
Las variables D15
, D15_1
,
D15_2
, D16
, D16_1
,
D16_2
cuentan si la persona del hogar dedicó su tiempo -y
si lo hizo, cuánto- en el día de ayer a las tareas de limpieza y cuidado
de la ropa propia o de los miembros del hogar.
Las variables E17
, E17_1
,
E17_2
, E18
, E18_1
,
E18_2
cuentan si la persona del hogar dedicó su tiempo -y
si lo hizo, cuánto- en el día de ayer a las tareas de compras de
artículos para el hogar o el cuidado de sí mismo y/o las personas que
viven en el.
Las variables G20
, G20_1
,
G20_2
cuentan si la persona del hogar dedicó su tiempo -y
si lo hizo, cuánto- en el día de ayer al mantenimiento de la vivienda y
tareas de reparaciones varias como eléctrica, sanitaria y/o albañilería,
entre otras.
Las variables H21
, H21_1
,
H21_2
cuentan si la persona del hogar dedicó su tiempo -y
si lo hizo, cuánto- en el día de ayer a las gestiones externas como
pagar cuentas o realizar algún trámite para el hogar o alguno de sus
integrantes.
Las variables TNR_total
será la suma de todas las
TNR anteriores.
Las siguientes cinco variables refieren específicamente a la coyuntura de emergencia sanitaria a raíz de la pandemia por COVID-19, que es el objetivo de estudio de este informe.
La variable N_92
consulta sobre la situación
personal en tanto al mercado de trabajo previo a la pandemia.
La variable N_94
consulta sobre el efecto de la
pandemia sobre los ingresos personales.
La variable NA_95
recoge información sobre el
impacto de la pandemia en el apoyo personal en tareas escolares a niñxs
del hogar.
La variable NA_96
pregunta sobre la colaboración a
otros hogares a partir de la pandemia.
Y de manera análoga, la variable NA_97
pregunta
sobre la ayuda recibida de otros hogares a raíz de la pandemia.
Ahora sí, paso a renombrar las variables que faltan en la base
filtrada EUT_PANDEMIA
:
EUT_PANDEMIA <- EUT_PANDEMIA %>%
rename(HOGAR = NUMERO,
PERSONAS_HOGAR = h5,
NINXS_0a3 = h7,
NINXS_4a5 = h8,
NINXS_6a12 = h9,
MAY_65 = h10,
PERS_DISCAP = h6,
EDAD = p1,
)
Entonces, paso a realizar un summary para tener una primera vista de lo que voy a analizar.
summary(EUT_PANDEMIA)
## HOGAR PERSONAS_HOGAR NINXS_0a3 NINXS_4a5
## Min. : 1.0 Min. : 1.000 Min. :0.0000 Min. :0.00000
## 1st Qu.: 753.8 1st Qu.: 2.000 1st Qu.:0.0000 1st Qu.:0.00000
## Median :1519.5 Median : 3.000 Median :0.0000 Median :0.00000
## Mean :1501.0 Mean : 3.201 Mean :0.1366 Mean :0.08994
## 3rd Qu.:2253.2 3rd Qu.: 4.000 3rd Qu.:0.0000 3rd Qu.:0.00000
## Max. :2986.0 Max. :12.000 Max. :2.0000 Max. :2.00000
##
## NINXS_6a12 MAY_65 PERS_DISCAP EDAD
## Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. : 0.00
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.: 21.00
## Median :0.0000 Median :0.0000 Median :0.0000 Median : 40.00
## Mean :0.3536 Mean :0.4079 Mean :0.1359 Mean : 40.94
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.: 60.00
## Max. :4.0000 Max. :4.0000 Max. :3.0000 Max. :104.00
##
## DPTO SERV_DOM SEXO ASC
## Length:7316 Todos los días: 68 Hombre:3364 Length:7316
## Class :character Por hora : 199 Mujer :3952 Class :character
## Mode :character Con cama : 6 Mode :character
## Sin servicio :2729
## NA's :4314
##
##
## PAIS_NAC TNR_alim TNR_limpia TNR_ropa
## Uruguay :7095 Min. : 0.00 Min. : 0.00 Min. : 0.00
## Inmigrante: 221 1st Qu.: 0.00 1st Qu.: 0.00 1st Qu.: 0.00
## Median : 30.00 Median : 30.00 Median : 0.00
## Mean : 59.46 Mean : 62.39 Mean : 17.07
## 3rd Qu.: 90.00 3rd Qu.: 96.50 3rd Qu.: 20.00
## Max. :12078.00 Max. :6039.00 Max. :6069.00
## NA's :1196 NA's :1197 NA's :1197
## TNR_compras TNR_repara TNR_tramita TNR_total
## Min. : 0.0 Min. : 0.000 Min. : 0.000 Min. : 0.0
## 1st Qu.: 0.0 1st Qu.: 0.000 1st Qu.: 0.000 1st Qu.: 30.0
## Median : 0.0 Median : 0.000 Median : 0.000 Median : 120.0
## Mean : 20.6 Mean : 4.515 Mean : 3.845 Mean : 167.9
## 3rd Qu.: 30.0 3rd Qu.: 0.000 3rd Qu.: 0.000 3rd Qu.: 240.0
## Max. :6039.0 Max. :600.000 Max. :240.000 Max. :18117.0
## NA's :1197 NA's :1196 NA's :1196 NA's :1197
## SIT_LAB_PRECOVID INGR_POSTCOVID APOYO_ESC_POSTCOVID
## Trabajando :3267 Aumentó : 252 Aumentó : 770
## Jubilado/Pensionista :1393 Disminuyó :1546 Disminuyó : 27
## Estudiante : 640 Incambiado :3862 Incambiado: 524
## Quehaceres del hogar : 416 Ya no percibe: 461 NA's :5995
## Sin trabajo, buscando: 346 NA's :1195
## (Other) : 59
## NA's :1195
## COLAB_OTROS_POSTCOVID AYUDA_REC_POSTCOVID
## Aumentó : 961 Aumentó : 620
## Disminuyó : 0 Disminuyó : 83
## Incambiado: 123 Incambiado:5418
## NA's :6232 NA's :1195
##
##
##
De este summary()
hay, fundamentalmente, dos cosas que
me llaman la atención:
Que el número máximo de hogares (HOGAR
) sea 2986, lo
cual no coincide con el número de observaciones (7316), por tanto no
sirve como variable identificadora.
Que es significativa la cantidad de NA
en la gran
mayoría de las respuestas.
Analizando el diccionario original, el importado desde excel, puedo
ver que hay dos variables que corresponden a “identificación del
informante”: p0
y p01
. p0
es
categórica y representa si la persona está respondiendo por sí misma y
p01
corresponde a un número de registro de persona. Veamos
de qué se trata:
summary(EUT$p01)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 1.000 1.000 1.053 1.000 6.000 3779
No se trata de un número indentificatorio. Voy a agrupar los datos
por HOGAR
, ya que analizando la base
EUT_PANDEMIA
me percato que solo el primer registro de cada
hogar cuenta con el totalidad de las respuestas correspondientes a los
hogares, y que además, de analizarlo por persona, duplicaría algunas
respuestas, por tanto me voy a quedar con esta primera respuesta.
Entiendo que la función distinct()
del paquete
dplyr
sirve para eso.
HOGARES <- EUT_PANDEMIA %>%
distinct(HOGAR, .keep_all = TRUE) %>%
select(HOGAR, PERSONAS_HOGAR, NINXS_0a3, NINXS_4a5, NINXS_6a12, MAY_65, PERS_DISCAP, DPTO, SERV_DOM)
Ahora, con 7316 observaciones, vuelvo a realizar un
summary()
:
summary(HOGARES)
## HOGAR PERSONAS_HOGAR NINXS_0a3 NINXS_4a5
## Min. : 1.0 Min. : 1.00 Min. :0.00000 Min. :0.00000
## 1st Qu.: 747.2 1st Qu.: 1.00 1st Qu.:0.00000 1st Qu.:0.00000
## Median :1493.5 Median : 2.00 Median :0.00000 Median :0.00000
## Mean :1493.5 Mean : 2.45 Mean :0.07937 Mean :0.05358
## 3rd Qu.:2239.8 3rd Qu.: 3.00 3rd Qu.:0.00000 3rd Qu.:0.00000
## Max. :2986.0 Max. :12.00 Max. :2.00000 Max. :2.00000
## NINXS_6a12 MAY_65 PERS_DISCAP DPTO
## Min. :0.0000 Min. :0.0000 Min. :0.0000 Length:2986
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 Class :character
## Median :0.0000 Median :0.0000 Median :0.0000 Mode :character
## Mean :0.2029 Mean :0.4745 Mean :0.1122
## 3rd Qu.:0.0000 3rd Qu.:1.0000 3rd Qu.:0.0000
## Max. :4.0000 Max. :4.0000 Max. :3.0000
## SERV_DOM
## Todos los días: 65
## Por hora : 191
## Con cama : 6
## Sin servicio :2641
## NA's : 83
##
Y voy a crear otro objeto que tenga las respuestas personales, para evaluar dentro de este marco, la distribución de las tareas de cuidados y el impacto de la pandemia en estos términos.
PERSONAS <- EUT_PANDEMIA %>%
select(HOGAR, # Mantengo el número de HOGAR para poder cruzarlo con `HOGARES` en caso necesario
EDAD,
DPTO,
SEXO,
ASC,
PAIS_NAC,
TNR_alim,
TNR_limpia,
TNR_ropa,
TNR_compras,
TNR_repara,
TNR_tramita,
TNR_total,
SIT_LAB_PRECOVID,
INGR_POSTCOVID,
APOYO_ESC_POSTCOVID,
COLAB_OTROS_POSTCOVID,
AYUDA_REC_POSTCOVID)
summary(PERSONAS)
## HOGAR EDAD DPTO SEXO
## Min. : 1.0 Min. : 0.00 Length:7316 Hombre:3364
## 1st Qu.: 753.8 1st Qu.: 21.00 Class :character Mujer :3952
## Median :1519.5 Median : 40.00 Mode :character
## Mean :1501.0 Mean : 40.94
## 3rd Qu.:2253.2 3rd Qu.: 60.00
## Max. :2986.0 Max. :104.00
##
## ASC PAIS_NAC TNR_alim TNR_limpia
## Length:7316 Uruguay :7095 Min. : 0.00 Min. : 0.00
## Class :character Inmigrante: 221 1st Qu.: 0.00 1st Qu.: 0.00
## Mode :character Median : 30.00 Median : 30.00
## Mean : 59.46 Mean : 62.39
## 3rd Qu.: 90.00 3rd Qu.: 96.50
## Max. :12078.00 Max. :6039.00
## NA's :1196 NA's :1197
## TNR_ropa TNR_compras TNR_repara TNR_tramita
## Min. : 0.00 Min. : 0.0 Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.00 1st Qu.: 0.0 1st Qu.: 0.000 1st Qu.: 0.000
## Median : 0.00 Median : 0.0 Median : 0.000 Median : 0.000
## Mean : 17.07 Mean : 20.6 Mean : 4.515 Mean : 3.845
## 3rd Qu.: 20.00 3rd Qu.: 30.0 3rd Qu.: 0.000 3rd Qu.: 0.000
## Max. :6069.00 Max. :6039.0 Max. :600.000 Max. :240.000
## NA's :1197 NA's :1197 NA's :1196 NA's :1196
## TNR_total SIT_LAB_PRECOVID INGR_POSTCOVID
## Min. : 0.0 Trabajando :3267 Aumentó : 252
## 1st Qu.: 30.0 Jubilado/Pensionista :1393 Disminuyó :1546
## Median : 120.0 Estudiante : 640 Incambiado :3862
## Mean : 167.9 Quehaceres del hogar : 416 Ya no percibe: 461
## 3rd Qu.: 240.0 Sin trabajo, buscando: 346 NA's :1195
## Max. :18117.0 (Other) : 59
## NA's :1197 NA's :1195
## APOYO_ESC_POSTCOVID COLAB_OTROS_POSTCOVID AYUDA_REC_POSTCOVID
## Aumentó : 770 Aumentó : 961 Aumentó : 620
## Disminuyó : 27 Disminuyó : 0 Disminuyó : 83
## Incambiado: 524 Incambiado: 123 Incambiado:5418
## NA's :5995 NA's :6232 NA's :1195
##
##
##
Sigue habiendo una cantidad considerable de NAs
,
principalmente en las variables APOYO_ESC_POSTCOVID
y
COLAB_OTROS_POSTCOVID
. A su vez, existe una cantidad
prácticamente igual de NAs
para las variables
TNR_alim
, TNR_limpia
, TNR_ropa
,
TNR_compras
, TNR_repara
,
TNR_tramita
, TNR_total
,
SIT_LAB_PRECOVID
, INGR_POSTCOVID
y
AYUDA_REC_POSTCOVID
.
colSums(is.na(PERSONAS))
## HOGAR EDAD DPTO
## 0 0 0
## SEXO ASC PAIS_NAC
## 0 70 0
## TNR_alim TNR_limpia TNR_ropa
## 1196 1197 1197
## TNR_compras TNR_repara TNR_tramita
## 1197 1196 1196
## TNR_total SIT_LAB_PRECOVID INGR_POSTCOVID
## 1197 1195 1195
## APOYO_ESC_POSTCOVID COLAB_OTROS_POSTCOVID AYUDA_REC_POSTCOVID
## 5995 6232 1195
Entiendo que puede deberse a dos causas distintas. Pero en primer lugar, filtraría a los mayores de 14 años, que son los que están en edad de trabajar según la legislatura nacional.
PERSONAS_ADULTAS <- PERSONAS %>%
filter(EDAD > 14)
Chequeo que efectivamente esto corresponda a las personas menores a 14.
PERSONAS %>%
filter (EDAD <= 14) %>%
count()
## n
## 1 1195
colSums(is.na(PERSONAS_ADULTAS))
## HOGAR EDAD DPTO
## 0 0 0
## SEXO ASC PAIS_NAC
## 0 58 0
## TNR_alim TNR_limpia TNR_ropa
## 1 2 2
## TNR_compras TNR_repara TNR_tramita
## 2 1 1
## TNR_total SIT_LAB_PRECOVID INGR_POSTCOVID
## 2 0 0
## APOYO_ESC_POSTCOVID COLAB_OTROS_POSTCOVID AYUDA_REC_POSTCOVID
## 4800 5037 0
Veo que al hacer esto, la cantidad de NA resulta razonable para las
variables SIT_LAB_PRECOVID
, INGR_POSTCOVID
y
AYUDA_REC_POSTCOVID
.
En cuanto APOYO_ESC_POSTCOVID
(NA_95
) y
COLAB_OTROS_POSTCOVID
(NA_96
) resulta que
existe una cuarta categoría (“4”) que no está presente en el diccionario
de variables y tampoco en el manual de encuesta, por tanto se deberá
tener esto cuenta como limitante al analizarlas.
Respondentes
Visualicemos primero algunas variables con respecto a los hogares y personas respondentes. Interesa saber, en primer lugar, de qué rangos etarios estamos hablando y teniendo en cuenta especialmente que se trata de una encuesta sobre tareas de cuidados, la diferenciación por sexo. Voy a intentar visualizarlo con una pirámide de edades.
# Tramos de edad
TRAMOS_EDAD <- c("0-14", "15-24", "25-34", "35-44", "45-54", "55-64", "65-74", "75 o más")
# Nueva variable
PERSONAS$TRAMOS_EDAD <- cut(PERSONAS$EDAD,
breaks = c(0, 14, 24, 34, 44, 54, 64, 74, Inf),
labels = TRAMOS_EDAD,
include.lowest = TRUE)
# Tabla de doble entrada
tabla_doble_entrada <- xtabs(~ TRAMOS_EDAD + SEXO,
data = PERSONAS)
# Como dataframe
tabla_doble_entrada <- as.data.frame(tabla_doble_entrada)
tabla_pivoteada <- tabla_doble_entrada %>%
pivot_wider (names_from = "SEXO",
values_from = "Freq")
ggplot(PERSONAS, aes(x = EDAD, fill = SEXO)) +
geom_bar(data = subset(PERSONAS, SEXO == "Hombre"), aes(y = -after_stat(count)), width = 1) +
geom_bar(data = subset(PERSONAS, SEXO == "Mujer"), aes(y = after_stat(count)), width = 1) +
coord_flip() +
labs(title = "Distribución de edades según sexo",
subtitle = "",
x = "",
y = "",
tag = "Gráfico 1",
fill = "",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_y_continuous(breaks = c(0, 50)) +
scale_x_continuous(breaks = c(0, 15, 25, 35, 45, 55, 65, 75, 85, 95)) +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "top",
axis.text.x = element_text(hjust = 1))
De esto tenemos no solo que la cantidad de mujeres que respondió fue
mayor sino que hay una tendencia a edades mayores entre las mujeres que
respondieron la encuesta.
ggsave(path = "resultados/",
filename = "Distribución de edades según sexo.png")
También interesa ver dónde residen estas personas y su ascendencia étnica.
tabla_ASC_DPTO <- PERSONAS %>%
group_by(ASC, DPTO) %>%
count(ASC,
name = "cant_ASC") %>%
pivot_wider(names_from = "DPTO",
values_from = "cant_ASC")
write.table(tabla_ASC_DPTO,
sep = "\t",
file = "resultados/Ascendencia por departamento.txt",
row.names = FALSE)
PERSONAS %>%
count(ASC,
name = "cant_ASC") %>%
mutate(prop_ASC = round(cant_ASC / sum(cant_ASC)*100, 1))
## ASC cant_ASC prop_ASC
## 1 Afro 476 6.5
## 2 Asiática 102 1.4
## 3 Blanca 6325 86.5
## 4 Indígena 192 2.6
## 5 Otra 151 2.1
## 6 <NA> 70 1.0
PERSONAS %>%
count(ASC,
name = "cant_ASC") %>%
mutate(prop_ASC = round(cant_ASC / sum(cant_ASC)*100, 1)) %>%
arrange(desc(prop_ASC)) %>% # Proporción descendente
ggplot(aes(x = reorder(ASC, -prop_ASC), y = cant_ASC)) +
geom_bar(stat = "identity", fill= "#023047", color = "#ffb703") +
geom_text(aes(label = paste0(prop_ASC, "%")), vjust = -0.5, size = 3.5) +
labs(title = "Ascendencia principal",
subtitle = "",
x = "",
y = "",
tag = "Gráfico 2",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
theme_minimal() +
theme(legend.position = "top",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Ascendencia principal.png")
Ahora, si observamos la ascendencia por departamento, vemos que la proporción
PERSONAS %>%
group_by(ASC, DPTO) %>%
count(ASC,
name = "cant_ASC") %>%
ggplot(aes(x = ASC, y = cant_ASC, fill = DPTO)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Ascendencia principal por departamento",
subtitle = "",
x = "",
y = "",
fill = "",
tag = "Gráfico 3",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Montevideo" = "#fb8500", "Resto del país" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Ascendencia principal por departamento.png")
En cuanto a la composición de los hogares, podemos ver que la mayoría de los hogares están compuestos por tres o menos personas.
HOGARES %>%
ggplot(aes(x = PERSONAS_HOGAR)) +
geom_histogram(binwidth = 1, fill= "#023047", color = "#ffb703") +
labs(title = "Cantidad de personas que componen los hogares",
subtitle = "",
x = "Cantidad de Personas",
y = "",
fill = "",
tag = "Gráfico 4",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_x_continuous(breaks = c(1:12)) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Cantidad de personas por hogar.png")
También, que la mayor cantidad de niñxs se concentran en hogares con 3 a 5 personas, y que los adultos mayores a 65 años así como las personas con discapacidad lo hacen en hogares con 3 o menos personas.
tabla_COMPOSICION_HOGARES <- HOGARES %>%
group_by(PERSONAS_HOGAR) %>%
summarise(
CANTIDAD_HOGARES=n(),
NINXS = sum(NINXS_0a3, NINXS_4a5, NINXS_6a12),
MAY = sum(MAY_65),
DISC = sum(PERS_DISCAP))
write.table(tabla_COMPOSICION_HOGARES,
sep = "\t",
file = "resultados/Composición de los hogares.txt",
row.names = FALSE)
Tareas de trabajo no remunerado
Ahora bien, visualicemos las variables de interés, que tienen que ver con el tiempo ocupado en tareas de cuidado y trabajo no remunerado.
PERSONAS_ADULTAS %>%
group_by(TNR_total, SEXO) %>%
filter(TNR_total < 960) %>% # Para evitar errores de recodificación, 960 equivale a 16 horas hábiles disponibles
ggplot(aes(x=HOGAR, y= TNR_total, color=SEXO)) +
geom_point(size=1.5, alpha=0.7) +
labs(title = "Tiempo total empleado en trabajo no remunerado, por sexo",
subtitle = "",
x = "",
y = "Tiempo (en minutos)",
color = "",
tag = "Gráfico 5",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_color_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en trabajo no remunerado, por sexo.png")
PERSONAS_ADULTAS %>%
group_by(TNR_total, SEXO) %>%
filter(TNR_total < 960) %>% # Para evitar errores de recodificación, 960 equivale a 16 horas hábiles disponibles
ggplot(aes(x=SEXO, y=TNR_total)) +
geom_boxplot() +
coord_flip() +
labs(title = "Tiempo total empleado en trabajo no remunerado, por sexo",
subtitle = "",
x = "",
y = "Tiempo (en minutos)",
color = "",
tag = "Gráfico 6",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en trabajo no remunerado, por sexo (boxplot).png")
Ya en un primer panorama se puede ver que las mujeres dedican mucho más Ahora bien, veámoslo por tareas: cómo se distribuye la carga entre hombres y mujeres de las tareas de alimentación, limpieza, relacionadas al cuidado de la ropa, compras, de reparaciones y trámites.
PERSONAS_ADULTAS %>%
group_by(TNR_alim, SEXO) %>%
filter(TNR_total < 1440 & TNR_total > 0,
TNR_alim < 960 & TNR_alim > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16
ggplot(aes(x = TNR_alim)) +
geom_histogram(aes(fill=SEXO),
colour = "#023047",
alpha = 0.7,
bins = 30) +
labs(title = "Tiempo total empleado en tareas de alimentación, por sexo",
subtitle = "",
x = "Tiempo (en minutos)",
y = "",
fill = "",
tag = "Gráfico 7",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en tareas de alimentación, por sexo.png")
PERSONAS_ADULTAS %>%
group_by(TNR_limpia, SEXO) %>%
filter(TNR_total < 1440 & TNR_total > 0,
TNR_limpia < 960 & TNR_limpia > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16
ggplot(aes(x = TNR_limpia)) +
geom_histogram(aes(fill=SEXO),
colour = "#023047",
alpha = 0.7,
bins = 30) +
labs(title = "Tiempo total empleado en tareas de limpieza, por sexo",
subtitle = "",
x = "Tiempo (en minutos)",
y = "",
fill = "",
tag = "Gráfico 8",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en tareas de limpieza, por sexo.png")
PERSONAS_ADULTAS %>%
group_by(TNR_ropa, SEXO) %>%
filter(TNR_total < 1440 & TNR_total > 0,
TNR_ropa < 960 & TNR_ropa > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16
ggplot(aes(x = TNR_ropa)) +
geom_histogram(aes(fill=SEXO),
colour = "#023047",
alpha = 0.7,
bins = 30) +
labs(title = "Tiempo total empleado en tareas de limpieza de la ropa, por sexo",
subtitle = "",
x = "Tiempo (en minutos)",
y = "",
fill = "",
tag = "Gráfico 9",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en tareas de limpieza de ropa, por sexo.png")
PERSONAS_ADULTAS %>%
group_by(TNR_compras, SEXO) %>%
filter(TNR_total < 1440 & TNR_total > 0,
TNR_compras < 960 & TNR_compras > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16
ggplot(aes(x = TNR_compras)) +
geom_histogram(aes(fill=SEXO),
colour = "#023047",
alpha = 0.7,
bins = 30) +
labs(title = "Tiempo total empleado en tareas de compras, por sexo",
subtitle = "",
x = "Tiempo (en minutos)",
y = "",
fill = "",
tag = "Gráfico 10",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en tareas de compras, por sexo.png")
PERSONAS_ADULTAS %>%
group_by(TNR_repara, SEXO) %>%
filter(TNR_total < 1440 & TNR_total > 0,
TNR_repara < 960 & TNR_repara > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16
ggplot(aes(x = TNR_repara)) +
geom_histogram(aes(fill=SEXO),
colour = "#023047",
alpha = 0.7,
bins = 30) +
labs(title = "Tiempo total empleado en tareas de reparación, por sexo",
subtitle = "",
x = "Tiempo (en minutos)",
y = "",
fill = "",
tag = "Gráfico 11",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en tareas de reparación, por sexo.png")
PERSONAS_ADULTAS %>%
group_by(TNR_tramita, SEXO) %>%
filter(TNR_total < 1440 & TNR_total > 0,
TNR_tramita < 960 & TNR_tramita > 0) %>% # Para evitar errores de recodificación, 1440 equivale a 24 horas hábiles disponibles y 960 equivale a 16
ggplot(aes(x = TNR_tramita)) +
geom_histogram(aes(fill=SEXO),
colour = "#023047",
alpha = 0.7,
bins = 30) +
labs(title = "Tiempo total empleado en trámites, por sexo",
subtitle = "",
x = "Tiempo (en minutos)",
y = "",
fill = "",
tag = "Gráfico 12",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
scale_fill_manual(values = c("Hombre" = "#219ebc", "Mujer" = "#ffb703")) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Tiempo total empleado en tareas de trámites, por sexo.png")
Con estos últimos gráficos se puede corroborar que efectivamente las tareas de cuidados recaen en mayor medida sobre las mujeres y que estas destinan más tiempo que los varones a realizarlas. En el único caso en que no se pudo apreciar este comportamiento fue en el caso de las tareas de reparación, que están esteriotípicamente asociadas a los varones y por ende, esto reafirma la desigualdad de género.
Efecto de la pandemia por COVID-19
Una primera variable nos indica respecto a la situación laboral de los respondentes previo a la pandemia y confinamiento por COVID-19.
PERSONAS_ADULTAS %>%
group_by(SIT_LAB_PRECOVID) %>%
summarise(count=n()) %>%
ggplot(aes(x = count, y = reorder(SIT_LAB_PRECOVID, count))) +
geom_col(fill= "#023047", color = "#ffb703") +
labs(title = "Situación laboral antes de la llegada del coronavirus",
subtitle = "",
x = "",
y = "",
fill = "",
tag = "Gráfico 13",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Situación laboral antes de la llegada del coronavirus.png")
Y concretamente a lo que nos interesa:
PERSONAS_ADULTAS %>%
select(INGR_POSTCOVID, SEXO) %>%
ggplot(aes(x=INGR_POSTCOVID), fill= SEXO) +
geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
labs(title = "Situación en los ingresos como resultado de la pandemia",
subtitle = "",
x = "",
y = "",
fill = "",
tag = "Gráfico 14",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
geom_text(aes(label = after_stat(count)),
position=position_dodge(0.9),
vjust= -0.5,
size=3,
stat = "count") +
facet_wrap(~ SEXO) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 1,
angle = 30))
ggsave(path = "resultados/",
filename = "Situación en los ingresos como resultado de la pandemia.png")
PERSONAS_ADULTAS %>%
select(APOYO_ESC_POSTCOVID, SEXO) %>%
filter(!is.na(APOYO_ESC_POSTCOVID)) %>%
ggplot(aes(x=APOYO_ESC_POSTCOVID), fill= SEXO) +
geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
labs(title = "Apoyo en tareas escolares a niñxs del hogar como resultado de la pandemia",
subtitle = "",
x = "",
y = "",
fill = "",
tag = "Gráfico 15",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
geom_text(aes(label = after_stat(count)),
position=position_dodge(0.9),
vjust= -0.5,
size=3,
stat = "count") +
facet_wrap(~ SEXO) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Apoyo en tareas escolares a niñxs del hogar como resultado de la pandemia.png")
PERSONAS_ADULTAS %>%
select(COLAB_OTROS_POSTCOVID, SEXO) %>%
filter(!is.na(COLAB_OTROS_POSTCOVID)) %>%
ggplot(aes(x=COLAB_OTROS_POSTCOVID), fill= SEXO) +
geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
labs(title = "Colaboración a otros hogares como resultado de la pandemia",
subtitle = "",
x = "",
y = "",
fill = "",
tag = "Gráfico 16",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
geom_text(aes(label = after_stat(count)),
position=position_dodge(0.9),
vjust= -0.5,
size=3,
stat = "count") +
facet_wrap(~ SEXO) +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Colaboración a otros hogares como resultado de la pandemia.png")
PERSONAS_ADULTAS %>%
select(AYUDA_REC_POSTCOVID, SEXO) %>%
filter(!is.na(AYUDA_REC_POSTCOVID)) %>%
ggplot(aes(x=AYUDA_REC_POSTCOVID)) +
geom_bar(position="dodge", fill="#023047", color = "#ffb703") +
labs(title = "Ayuda recibida de otros hogares como resultado de la pandemia",
subtitle = "",
x = "",
y = "",
fill = "",
tag = "Gráfico 17",
caption ="Fuente: Encuesta de Uso del Tiempo y Trabajo No Remunerado (INE, 2021)") +
geom_text(aes(label = after_stat(count)),
position=position_dodge(0.9),
vjust= -0.5,
size=3,
stat = "count") +
theme_minimal() +
theme(legend.position = "right",
axis.text.x = element_text(hjust = 0.5))
ggsave(path = "resultados/",
filename = "Ayuda recibida de otros hogares como resultado de la pandemia.png")
Estos últimos gráficos nos ayudan a visibilizar que la pandemia en cuanto a tareas de cuidados aumentó la brecha existente entre hombres y mujeres, sumando peso a estas últimas, ante un Estado que estuvo prácticamente ausente.
En cuanto a la percepción de ingresos personales, 278 mujeres -frente a 183 hombres- dejaron de recibirlos. En base a estas preguntas, también podemos ver que el apoyo a las tareas escolares de lxs niñxs del hogar recayó sobre las mujeres en mucho mayor medida que sobre los hombres, y que también fueron estas quienes en mayor medida aumentaron su colaboración en tareas de cuidados de otros hogares, mientras que la ayuda percibida de otros hogares se mantuvo relativamente igual.
A modo de cierre, es preciso recordar que el procesamiento es preliminar y que en estas últimas variables hay algunos problemas de base como categorías que no fueron codificadas y que eso puede alterar los resultados de una manera no deseada.
En cuanto a conclusiones del ámbito personal, esta base me trajo muchos dolores de cabeza -seguramente fruto de la inexperiencia absoluta-, pero, pasando raya, casi un mes después de empezar a trabajarla, disfruté mucho de ir buscando alternativas para resolver los desafíos que se me fueron presentando, más allá de que no siempre encontré las soluciones o quizás las encontradas no fueran las más eficientes. En particular, me gustaría haber resuelto el tema de la codificación con el diccionario de variables. Le dí muchísimas vueltas a eso pero no encontré el camino. Por otro lado, me gustaría que las parte de visualización hubiera sido mejor. Creo que en muchos casos las gráficas elegidas no fueron las mejores para lo que estaba queriendo mostrar. Pero en definitiva, fue un trabajo que disfruté mucho, también porque es un tema de gran interés para mí.