# Verificar y crear directorios faltantes
ruta_base <- "D:/ephc_csv/rsconnect/documents/ephctrimestral.Rmd/rpubs.com/rpubs"

# Verificar si la ruta base existe, si no, crearla
if (!dir.exists(ruta_base)) {
  dir.create(ruta_base, recursive = TRUE)
  print(paste("Directorio creado:", ruta_base))
} else {
  print(paste("Directorio ya existe:", ruta_base))
}
## [1] "Directorio ya existe: D:/ephc_csv/rsconnect/documents/ephctrimestral.Rmd/rpubs.com/rpubs"
# Verificar la existencia del archivo final
archivo_final <- file.path(ruta_base, "Document.dcf")

if (!file.exists(archivo_final)) {
  # Intentar crear el archivo final
  file.create(archivo_final)
  print(paste("Archivo creado:", archivo_final))
} else {
  print(paste("Archivo ya existe:", archivo_final))
}
## [1] "Archivo ya existe: D:/ephc_csv/rsconnect/documents/ephctrimestral.Rmd/rpubs.com/rpubs/Document.dcf"

1 Introducción

En la era actual de información y análisis, los microdatos provenientes de encuestas de hogares representan un valioso recurso para comprender diversos aspectos de la sociedad, incluyendo la demografía, el mercado laboral, la educación y la seguridad social. Estas encuestas capturan una vasta gama de información detallada y representativa de las características y comportamientos de los hogares y las personas que los componen. Mediante la explotación de estas fuentes de datos ricas y granulares, es posible generar indicadores precisos y significativos que impulsan la toma de decisiones informada en políticas públicas, investigaciones académicas y la comprensión general de tendencias sociales.

En este contexto, la herramienta R se erige como un pilar fundamental para aprovechar al máximo estos microdatos y traducirlos en información valiosa. R es un software de código abierto y gratuito, altamente flexible y robusto, que brinda una plataforma poderosa para manipular, visualizar y analizar datos de manera efectiva. Su comunidad activa de usuarios y desarrolladores ha creado una amplia gama de paquetes especializados, lo que permite realizar tareas complejas con facilidad. R se destaca por su capacidad para gestionar grandes conjuntos de datos, realizar análisis estadísticos avanzados y generar gráficos y visualizaciones atractivas.

Al emplear R en el análisis de microdatos de encuestas de hogares, los investigadores y analistas pueden identificar patrones y relaciones que son fundamentales para comprender los cambios sociales, económicos y demográficos. Desde la elaboración de perfiles demográficos hasta el estudio de las tendencias de empleo y educación, pasando por el análisis de la inclusión social a través de los programas de seguridad social, R ofrece un abanico de herramientas que facilitan la creación de indicadores precisos y relevantes.

En este documento, exploraremos cómo el uso de microdatos de encuestas de hogares en conjunto con el software R puede enriquecer nuestro entendimiento de la sociedad y proporcionar insights profundos en una variedad de temas. Descubriremos cómo el análisis detallado de estas fuentes de información, impulsado por la versatilidad de R, puede ser instrumental en la toma de decisiones, la planificación de políticas y la generación de conocimiento en campos clave.

2 Fuente de datos

La Encuesta Permanente de Hogares (EPH) es llevado a cabo por el Instituto Nacional de Estadísticas (INE) y tiene como objetivo fundamental la generación de estadísticas que permitan monitorear trimestralmente las características clave del mercado laboral, así como otros aspectos socioeconómicos. Esta encuesta abarca a las personas que residen en hogares particulares ubicados en los departamentos de la Región Oriental y Pte. Hayes.

Para llevar a cabo este propósito, se ha establecido un tamaño muestral de 5,004 hogares por trimestre en el año 2023. La metodología empleada se basa en un enfoque de muestra semi-panel con una rotación del 50% de los hogares durante dos años consecutivos. Esto significa que en dos años seguidos, el 50% de los hogares se solapan entre los mismos trimestres, con el propósito principal de controlar los cambios reales en las características laborales.

La EPH comenzó su ejecución en la segunda semana de enero de 2017 y se ha mantenido en funcionamiento de manera continua hasta la fecha actual. En el anexo, se presentan los resultados correspondientes a veintiséis trimestres, abarcando desde el año 2017 hasta el 2023.

La relevancia de este material radica en su capacidad para proporcionar información sobre los indicadores clave de empleo. Esta información resulta esencial para la formulación, implementación y evaluación de políticas públicas orientadas a mejorar las condiciones de empleo y, por extensión, las condiciones de vida de la población en general.

3 Gestión de los datos

3.1 Transformación de las bases en formato SAV a csv

3.2 Recodificación de variables

##                            
##                             2022Trim1 2022Trim2 2022Trim3 2022Trim4 2023Trim1
##   Cuenta propia                  2518      2582      2567      3172      2267
##   Doméstico/a                     627       567       559       679       570
##   Empleador/patrón                342       347       361       424       340
##   NR                                0         0         1         3         0
##   Obrero privado                 2869      2784      2864      3110      2566
##   Obrero público                  682       828       748       769       702
##   Trabajador fam. no remun.       624       580       604       739       474
##                            
##                             2023Trim2 2023Trim3 2023Trim4
##   Cuenta propia                  2456      2380      2987
##   Doméstico/a                     529       562       664
##   Empleador/patrón                334       347       472
##   NR                                1         0         0
##   Obrero privado                 2663      2752      3179
##   Obrero público                  764       699       779
##   Trabajador fam. no remun.       516       585       748
##                   
##                    2022Trim1 2022Trim2 2022Trim3 2022Trim4 2023Trim1 2023Trim2
##   Cuenta propia         2506      2574      2562      3160      2258      2452
##   Doméstico/a            621       560       555       674       560       519
##   Empleador/patrón       342       347       361       424       340       334
##   Obrero privado        2841      2769      2844      3088      2549      2651
##   Obrero público         682       828       748       769       702       764
##                   
##                    2023Trim3 2023Trim4
##   Cuenta propia         2375      2968
##   Doméstico/a            557       657
##   Empleador/patrón       347       472
##   Obrero privado        2727      3157
##   Obrero público         699       779
categocupa trimestredesc total_people label
Cuenta propia 2022Trim1 946034.8 946.035
Cuenta propia 2022Trim2 938253.0 938.253
Cuenta propia 2022Trim3 934752.6 934.753
Cuenta propia 2022Trim4 957773.0 957.773
Cuenta propia 2023Trim1 894563.4 894.563
Cuenta propia 2023Trim2 958393.9 958.394
Cuenta propia 2023Trim3 928409.7 928.410
Cuenta propia 2023Trim4 937118.4 937.118
Doméstico/a 2022Trim1 242057.6 242.058
Doméstico/a 2022Trim2 216249.4 216.249
Doméstico/a 2022Trim3 223440.0 223.440
Doméstico/a 2022Trim4 235505.7 235.506
Doméstico/a 2023Trim1 230389.3 230.389
Doméstico/a 2023Trim2 229408.0 229.408
Doméstico/a 2023Trim3 244127.7 244.128
Doméstico/a 2023Trim4 248024.7 248.025
Empleador/patrón 2022Trim1 137729.8 137.730
Empleador/patrón 2022Trim2 133664.9 133.665
Empleador/patrón 2022Trim3 142146.9 142.147
Empleador/patrón 2022Trim4 143236.7 143.237
Empleador/patrón 2023Trim1 145555.9 145.556
Empleador/patrón 2023Trim2 136868.8 136.869
Empleador/patrón 2023Trim3 139789.8 139.790
Empleador/patrón 2023Trim4 167212.1 167.212
Obrero privado 2022Trim1 1202607.2 1.202.607
Obrero privado 2022Trim2 1192853.7 1.192.854
Obrero privado 2022Trim3 1207377.5 1.207.378
Obrero privado 2022Trim4 1186463.7 1.186.464
Obrero privado 2023Trim1 1212605.8 1.212.606
Obrero privado 2023Trim2 1243618.3 1.243.618
Obrero privado 2023Trim3 1277186.4 1.277.186
Obrero privado 2023Trim4 1255534.3 1.255.534
Obrero público 2022Trim1 279027.0 279.027
Obrero público 2022Trim2 307518.7 307.519
Obrero público 2022Trim3 291352.8 291.353
Obrero público 2022Trim4 273448.5 273.449
Obrero público 2023Trim1 316604.5 316.605
Obrero público 2023Trim2 305609.8 305.610
Obrero público 2023Trim3 275855.5 275.855
Obrero público 2023Trim4 286698.9 286.699

#install.packages("gganimate")
library(gganimate)
## Warning: package 'gganimate' was built under R version 4.3.3
p <- ggplot(dbephcfil_grouped, aes(x = trimestredesc, y = total_people, fill = categocupa)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = label), vjust = 1.0, size = 2.5, angle = 60, position = position_stack(vjust = 1.5)) +
  labs(title = "Number of People per Trimester and Category of categocupa",
       x = "Trimester",
       y = "Number of People") +
  theme_minimal() +
  scale_x_discrete(labels = stringr::str_wrap(dbephcfil_grouped$trimestredesc, width = 15)) +
  theme(axis.text.x = element_text(angle = 30, hjust = 1),
        legend.position = "none") +
  facet_wrap(~categocupa, nrow = 1) +
  transition_states(trimestredesc, transition_length = 2, state_length = 1) +
  shadow_trail(trail_length = 1)

animate(plot = p, fps = 10)

trimestredesc categocupa total_people label pct total_pct
2022Trim1 Cuenta propia 946034.8 946.035 33.7 99.9
2022Trim1 Doméstico/a 242057.6 242.058 8.6 99.9
2022Trim1 Empleador/patrón 137729.8 137.730 4.9 99.9
2022Trim1 Obrero privado 1202607.2 1.202.607 42.8 99.9
2022Trim1 Obrero público 279027.0 279.027 9.9 99.9
2022Trim2 Cuenta propia 938253.0 938.253 33.6 100.0
2022Trim2 Doméstico/a 216249.4 216.249 7.8 100.0
2022Trim2 Empleador/patrón 133664.9 133.665 4.8 100.0
2022Trim2 Obrero privado 1192853.7 1.192.854 42.8 100.0
2022Trim2 Obrero público 307518.7 307.519 11.0 100.0
2022Trim3 Cuenta propia 934752.6 934.753 33.4 100.0
2022Trim3 Doméstico/a 223440.0 223.440 8.0 100.0
2022Trim3 Empleador/patrón 142146.9 142.147 5.1 100.0
2022Trim3 Obrero privado 1207377.5 1.207.378 43.1 100.0
2022Trim3 Obrero público 291352.8 291.353 10.4 100.0
2022Trim4 Cuenta propia 957773.0 957.773 34.2 99.9
2022Trim4 Doméstico/a 235505.7 235.506 8.4 99.9
2022Trim4 Empleador/patrón 143236.7 143.237 5.1 99.9
2022Trim4 Obrero privado 1186463.7 1.186.464 42.4 99.9
2022Trim4 Obrero público 273448.5 273.449 9.8 99.9
2023Trim1 Cuenta propia 894563.4 894.563 32.0 100.0
2023Trim1 Doméstico/a 230389.3 230.389 8.2 100.0
2023Trim1 Empleador/patrón 145555.9 145.556 5.2 100.0
2023Trim1 Obrero privado 1212605.8 1.212.606 43.3 100.0
2023Trim1 Obrero público 316604.5 316.605 11.3 100.0
2023Trim2 Cuenta propia 958393.9 958.394 33.3 100.0
2023Trim2 Doméstico/a 229408.0 229.408 8.0 100.0
2023Trim2 Empleador/patrón 136868.8 136.869 4.8 100.0
2023Trim2 Obrero privado 1243618.3 1.243.618 43.3 100.0
2023Trim2 Obrero público 305609.8 305.610 10.6 100.0
2023Trim3 Cuenta propia 928409.7 928.410 32.4 100.0
2023Trim3 Doméstico/a 244127.7 244.128 8.5 100.0
2023Trim3 Empleador/patrón 139789.8 139.790 4.9 100.0
2023Trim3 Obrero privado 1277186.4 1.277.186 44.6 100.0
2023Trim3 Obrero público 275855.5 275.855 9.6 100.0
2023Trim4 Cuenta propia 937118.4 937.118 32.4 100.1
2023Trim4 Doméstico/a 248024.7 248.025 8.6 100.1
2023Trim4 Empleador/patrón 167212.1 167.212 5.8 100.1
2023Trim4 Obrero privado 1255534.3 1.255.534 43.4 100.1
2023Trim4 Obrero público 286698.9 286.699 9.9 100.1

## Variaciones intermensuales

categocupa trimestredesc total_people label pct total_pct pct_change
Cuenta propia 2022Trim2 938253.0 938.253 12.5 100.0 -0.8
Cuenta propia 2022Trim3 934752.6 934.753 12.5 100.0 -0.4
Cuenta propia 2022Trim4 957773.0 957.773 12.8 100.0 2.5
Cuenta propia 2023Trim1 894563.4 894.563 11.9 100.0 -6.6
Cuenta propia 2023Trim2 958393.9 958.394 12.8 100.0 7.1
Cuenta propia 2023Trim3 928409.7 928.410 12.4 100.0 -3.1
Cuenta propia 2023Trim4 937118.4 937.118 12.5 100.0 0.9
Doméstico/a 2022Trim2 216249.4 216.249 11.6 100.1 -10.7
Doméstico/a 2022Trim3 223440.0 223.440 12.0 100.1 3.3
Doméstico/a 2022Trim4 235505.7 235.506 12.6 100.1 5.4
Doméstico/a 2023Trim1 230389.3 230.389 12.3 100.1 -2.2
Doméstico/a 2023Trim2 229408.0 229.408 12.3 100.1 -0.4
Doméstico/a 2023Trim3 244127.7 244.128 13.1 100.1 6.4
Doméstico/a 2023Trim4 248024.7 248.025 13.3 100.1 1.6
Empleador/patrón 2022Trim2 133664.9 133.665 11.7 100.0 -3.0
Empleador/patrón 2022Trim3 142146.9 142.147 12.4 100.0 6.3
Empleador/patrón 2022Trim4 143236.7 143.237 12.5 100.0 0.8
Empleador/patrón 2023Trim1 145555.9 145.556 12.7 100.0 1.6
Empleador/patrón 2023Trim2 136868.8 136.869 11.9 100.0 -6.0
Empleador/patrón 2023Trim3 139789.8 139.790 12.2 100.0 2.1
Empleador/patrón 2023Trim4 167212.1 167.212 14.6 100.0 19.6
Obrero privado 2022Trim2 1192853.7 1.192.854 12.2 99.9 -0.8
Obrero privado 2022Trim3 1207377.5 1.207.378 12.3 99.9 1.2
Obrero privado 2022Trim4 1186463.7 1.186.464 12.1 99.9 -1.7
Obrero privado 2023Trim1 1212605.8 1.212.606 12.4 99.9 2.2
Obrero privado 2023Trim2 1243618.3 1.243.618 12.7 99.9 2.6
Obrero privado 2023Trim3 1277186.4 1.277.186 13.1 99.9 2.7
Obrero privado 2023Trim4 1255534.3 1.255.534 12.8 99.9 -1.7
Obrero público 2022Trim2 307518.7 307.519 13.2 100.1 10.2
Obrero público 2022Trim3 291352.8 291.353 12.5 100.1 -5.3
Obrero público 2022Trim4 273448.5 273.449 11.7 100.1 -6.1
Obrero público 2023Trim1 316604.5 316.605 13.6 100.1 15.8
Obrero público 2023Trim2 305609.8 305.610 13.1 100.1 -3.5
Obrero público 2023Trim3 275855.5 275.855 11.8 100.1 -9.7
Obrero público 2023Trim4 286698.9 286.699 12.3 100.1 3.9

3.3 Variaciones interanuales

categocupa trimestredesc total_people label pct total_pct pct_change
Cuenta propia 2023Trim1 894563.4 894.563 11.9 100.0 -5.4
Cuenta propia 2023Trim2 958393.9 958.394 12.8 100.0 2.1
Cuenta propia 2023Trim3 928409.7 928.410 12.4 100.0 -0.7
Cuenta propia 2023Trim4 937118.4 937.118 12.5 100.0 -2.2
Doméstico/a 2023Trim1 230389.3 230.389 12.3 100.1 -4.8
Doméstico/a 2023Trim2 229408.0 229.408 12.3 100.1 6.1
Doméstico/a 2023Trim3 244127.7 244.128 13.1 100.1 9.3
Doméstico/a 2023Trim4 248024.7 248.025 13.3 100.1 5.3
Empleador/patrón 2023Trim1 145555.9 145.556 12.7 100.0 5.7
Empleador/patrón 2023Trim2 136868.8 136.869 11.9 100.0 2.4
Empleador/patrón 2023Trim3 139789.8 139.790 12.2 100.0 -1.7
Empleador/patrón 2023Trim4 167212.1 167.212 14.6 100.0 16.7
Obrero privado 2023Trim1 1212605.8 1.212.606 12.4 99.9 0.8
Obrero privado 2023Trim2 1243618.3 1.243.618 12.7 99.9 4.3
Obrero privado 2023Trim3 1277186.4 1.277.186 13.1 99.9 5.8
Obrero privado 2023Trim4 1255534.3 1.255.534 12.8 99.9 5.8
Obrero público 2023Trim1 316604.5 316.605 13.6 100.1 13.5
Obrero público 2023Trim2 305609.8 305.610 13.1 100.1 -0.6
Obrero público 2023Trim3 275855.5 275.855 11.8 100.1 -5.3
Obrero público 2023Trim4 286698.9 286.699 12.3 100.1 4.8

library(gganimate)

p <- ggplot(dbephcfil_grouped, aes(x = trimestredesc, y = pct_change, fill = categocupa)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Percentage of People per Trimester and Category of categocupa",
       x = "Trimester",
       y = "Percentage of People") +
  theme_minimal() +
        geom_text(aes(label = pct_change), vjust = 1.0, size = 3, angle = 30, position = position_stack(vjust = 0.5)) +

  scale_x_discrete(labels = stringr::str_wrap(dbephcfil_grouped$trimestredesc, width = 15)) +
  theme(axis.text.x = element_text(angle = 30, hjust = 1),
        legend.position = "none") +
  facet_wrap(~categocupa, ncol = 1) +
  transition_states(trimestredesc, transition_length = 2, state_length = 1) +
  shadow_trail(trail_length = 1)

animate(plot = p, fps = 10)