1 Tablas bivariadas

Hasta ahora nos concentramos en conocer como es la distribución de los casos en la categoría de una variable. A partir de este punto vamos a encarar una tarea mucho más interesante. Nos vamos a preguntar: ¿Qué condiciones influencian esta distribución?

Nuestra primera herramienta serán las tablas de contingencia, bivariadas o cruzadas. Esta forma de organizar la información nos permite ver como se distribuye las categorías de una variable sobre otra. Juntando en grupos los casos que cumplan dos condiciones en simultaneo: estar en una categoría de la primera variable y en una categoría de la segunda variable.

El paquete eph nos permite con la función calculate_tabulate poder sumar una segunda variable para armar una tabla bivariada. Simplemente debemos incluir el parametro y para indicarle cual es la segunda variable. Volviendo a las primeras clases, nuestro primero pasos sera activar los paquetes con los que vamos a trabajar y luego descargar la EPH.

Cargamos las librerarias

library("eph")
library("tidyverse")
library("gt")

Cargamos la EPH

eph23_3<-get_microdata(year = 2023, period = 3, type = "individual") %>% 
  organize_labels(.,"individual")

Preguntemonos ahora por dos variables que nos interese averiguar. Podemos pensar si la concidicón de actividad esta influenciada de alguna manera por el sexo. Para esto pongamos la variable “ESTADO” en el parametro x y CH04 en el y de calculate_tabulates. En la x será la variable dependiente que quedará en las filas y en la y la independiente de las columnas. Que podemos concluir?

Estado_Ch04<- eph23_3 %>% 
  calculate_tabulates(x= "ESTADO", y= "CH04", weights = "PONDERA",add.totals = "row", add.percentage = "col")

gt(Estado_Ch04) %>% 
  tab_header( title= "Condición de actividad según sexo", subtitle = "EPH 3 tri. 2023")
Condición de actividad según sexo
EPH 3 tri. 2023
ESTADO/CH04 Varon Mujer
Entrevista individual no realizada (no respuesta al cuestionario individual) 0.2 0.2
Ocupado 52.0 39.2
Desocupado 2.9 2.6
Inactivo 30.4 44.6
Menor de 10 anios. 14.4 13.3
Total 100.0 100.0

Analicemos ahora si el nivel de educación tiene algún efecto sobre la condicion de actividad. Para esto en vez de sexo utilzaremos la variable “NVL_ED” en la y.

Estado_NVLED <- eph23_3 %>% 
  calculate_tabulates(x = "ESTADO", y = "NIVEL_ED", weights = "PONDERA",add.totals = "row", add.percentage = "col")

gt(Estado_NVLED) %>% 
  tab_header( title= "Condición de actividad según Nvl. educativo ", subtitle = "EPH 3 tri. 2023")
Condición de actividad según Nvl. educativo
EPH 3 tri. 2023
ESTADO/NIVEL_ED Primaria incompleta (incluye educacion especial) Primaria completa Secundaria incompleta Secundaria completa Superior universitaria incompleta Superior universitaria completa Sin instruccion
Entrevista individual no realizada (no respuesta al cuestionario individual) 0.2 0.3 0.2 0.3 0.2 0.4 0.1
Ocupado 8.3 48.4 35.9 66.4 56.9 78.9 1.8
Desocupado 0.5 2.1 2.6 5.2 5.1 1.8 0.0
Inactivo 46.1 49.3 61.3 28.1 37.8 18.9 3.6
Menor de 10 anios. 44.8 0.0 0.0 0.0 0.0 0.0 94.5
Total 100.0 100.0 100.0 100.0 100.0 100.0 100.0