# Verificar y crear directorios faltantes
ruta_base <- "D:/ephc_csv/rsconnect/documents/ephctrimestral.Rmd/rpubs.com/rpubs"
# Verificar si la ruta base existe, si no, crearla
if (!dir.exists(ruta_base)) {
dir.create(ruta_base, recursive = TRUE)
print(paste("Directorio creado:", ruta_base))
} else {
print(paste("Directorio ya existe:", ruta_base))
}
## [1] "Directorio ya existe: D:/ephc_csv/rsconnect/documents/ephctrimestral.Rmd/rpubs.com/rpubs"
# Verificar la existencia del archivo final
archivo_final <- file.path(ruta_base, "Document.dcf")
if (!file.exists(archivo_final)) {
# Intentar crear el archivo final
file.create(archivo_final)
print(paste("Archivo creado:", archivo_final))
} else {
print(paste("Archivo ya existe:", archivo_final))
}
## [1] "Archivo ya existe: D:/ephc_csv/rsconnect/documents/ephctrimestral.Rmd/rpubs.com/rpubs/Document.dcf"
En la era actual de información y análisis, los microdatos provenientes de encuestas de hogares representan un valioso recurso para comprender diversos aspectos de la sociedad, incluyendo la demografía, el mercado laboral, la educación y la seguridad social. Estas encuestas capturan una vasta gama de información detallada y representativa de las características y comportamientos de los hogares y las personas que los componen. Mediante la explotación de estas fuentes de datos ricas y granulares, es posible generar indicadores precisos y significativos que impulsan la toma de decisiones informada en políticas públicas, investigaciones académicas y la comprensión general de tendencias sociales.
En este contexto, la herramienta R se erige como un pilar fundamental para aprovechar al máximo estos microdatos y traducirlos en información valiosa. R es un software de código abierto y gratuito, altamente flexible y robusto, que brinda una plataforma poderosa para manipular, visualizar y analizar datos de manera efectiva. Su comunidad activa de usuarios y desarrolladores ha creado una amplia gama de paquetes especializados, lo que permite realizar tareas complejas con facilidad. R se destaca por su capacidad para gestionar grandes conjuntos de datos, realizar análisis estadísticos avanzados y generar gráficos y visualizaciones atractivas.
Al emplear R en el análisis de microdatos de encuestas de hogares, los investigadores y analistas pueden identificar patrones y relaciones que son fundamentales para comprender los cambios sociales, económicos y demográficos. Desde la elaboración de perfiles demográficos hasta el estudio de las tendencias de empleo y educación, pasando por el análisis de la inclusión social a través de los programas de seguridad social, R ofrece un abanico de herramientas que facilitan la creación de indicadores precisos y relevantes.
En este documento, exploraremos cómo el uso de microdatos de encuestas de hogares en conjunto con el software R puede enriquecer nuestro entendimiento de la sociedad y proporcionar insights profundos en una variedad de temas. Descubriremos cómo el análisis detallado de estas fuentes de información, impulsado por la versatilidad de R, puede ser instrumental en la toma de decisiones, la planificación de políticas y la generación de conocimiento en campos clave.
La Encuesta Permanente de Hogares (EPH) es llevado a cabo por el Instituto Nacional de Estadísticas (INE) y tiene como objetivo fundamental la generación de estadísticas que permitan monitorear trimestralmente las características clave del mercado laboral, así como otros aspectos socioeconómicos. Esta encuesta abarca a las personas que residen en hogares particulares ubicados en los departamentos de la Región Oriental y Pte. Hayes.
Para llevar a cabo este propósito, se ha establecido un tamaño muestral de 5,004 hogares por trimestre en el año 2023. La metodología empleada se basa en un enfoque de muestra semi-panel con una rotación del 50% de los hogares durante dos años consecutivos. Esto significa que en dos años seguidos, el 50% de los hogares se solapan entre los mismos trimestres, con el propósito principal de controlar los cambios reales en las características laborales.
La EPH comenzó su ejecución en la segunda semana de enero de 2017 y se ha mantenido en funcionamiento de manera continua hasta la fecha actual. En el anexo, se presentan los resultados correspondientes a veintiséis trimestres, abarcando desde el año 2017 hasta el 2023.
La relevancia de este material radica en su capacidad para proporcionar información sobre los indicadores clave de empleo. Esta información resulta esencial para la formulación, implementación y evaluación de políticas públicas orientadas a mejorar las condiciones de empleo y, por extensión, las condiciones de vida de la población en general.
##
## 2022Trim1 2022Trim2 2022Trim3 2022Trim4 2023Trim1
## Cuenta propia 2518 2582 2567 3172 2267
## Doméstico/a 627 567 559 679 570
## Empleador/patrón 342 347 361 424 340
## NR 0 0 1 3 0
## Obrero privado 2869 2784 2864 3110 2566
## Obrero público 682 828 748 769 702
## Trabajador fam. no remun. 624 580 604 739 474
##
## 2023Trim2 2023Trim3 2023Trim4
## Cuenta propia 2456 2380 2987
## Doméstico/a 529 562 664
## Empleador/patrón 334 347 472
## NR 1 0 0
## Obrero privado 2663 2752 3179
## Obrero público 764 699 779
## Trabajador fam. no remun. 516 585 748
##
## 2022Trim1 2022Trim2 2022Trim3 2022Trim4 2023Trim1 2023Trim2
## Cuenta propia 2506 2574 2562 3160 2258 2452
## Doméstico/a 621 560 555 674 560 519
## Empleador/patrón 342 347 361 424 340 334
## Obrero privado 2841 2769 2844 3088 2549 2651
## Obrero público 682 828 748 769 702 764
##
## 2023Trim3 2023Trim4
## Cuenta propia 2375 2968
## Doméstico/a 557 657
## Empleador/patrón 347 472
## Obrero privado 2727 3157
## Obrero público 699 779
categocupa | trimestredesc | total_people | label |
---|---|---|---|
Cuenta propia | 2022Trim1 | 946034.8 | 946.035 |
Cuenta propia | 2022Trim2 | 938253.0 | 938.253 |
Cuenta propia | 2022Trim3 | 934752.6 | 934.753 |
Cuenta propia | 2022Trim4 | 957773.0 | 957.773 |
Cuenta propia | 2023Trim1 | 894563.4 | 894.563 |
Cuenta propia | 2023Trim2 | 958393.9 | 958.394 |
Cuenta propia | 2023Trim3 | 928409.7 | 928.410 |
Cuenta propia | 2023Trim4 | 937118.4 | 937.118 |
Doméstico/a | 2022Trim1 | 242057.6 | 242.058 |
Doméstico/a | 2022Trim2 | 216249.4 | 216.249 |
Doméstico/a | 2022Trim3 | 223440.0 | 223.440 |
Doméstico/a | 2022Trim4 | 235505.7 | 235.506 |
Doméstico/a | 2023Trim1 | 230389.3 | 230.389 |
Doméstico/a | 2023Trim2 | 229408.0 | 229.408 |
Doméstico/a | 2023Trim3 | 244127.7 | 244.128 |
Doméstico/a | 2023Trim4 | 248024.7 | 248.025 |
Empleador/patrón | 2022Trim1 | 137729.8 | 137.730 |
Empleador/patrón | 2022Trim2 | 133664.9 | 133.665 |
Empleador/patrón | 2022Trim3 | 142146.9 | 142.147 |
Empleador/patrón | 2022Trim4 | 143236.7 | 143.237 |
Empleador/patrón | 2023Trim1 | 145555.9 | 145.556 |
Empleador/patrón | 2023Trim2 | 136868.8 | 136.869 |
Empleador/patrón | 2023Trim3 | 139789.8 | 139.790 |
Empleador/patrón | 2023Trim4 | 167212.1 | 167.212 |
Obrero privado | 2022Trim1 | 1202607.2 | 1.202.607 |
Obrero privado | 2022Trim2 | 1192853.7 | 1.192.854 |
Obrero privado | 2022Trim3 | 1207377.5 | 1.207.378 |
Obrero privado | 2022Trim4 | 1186463.7 | 1.186.464 |
Obrero privado | 2023Trim1 | 1212605.8 | 1.212.606 |
Obrero privado | 2023Trim2 | 1243618.3 | 1.243.618 |
Obrero privado | 2023Trim3 | 1277186.4 | 1.277.186 |
Obrero privado | 2023Trim4 | 1255534.3 | 1.255.534 |
Obrero público | 2022Trim1 | 279027.0 | 279.027 |
Obrero público | 2022Trim2 | 307518.7 | 307.519 |
Obrero público | 2022Trim3 | 291352.8 | 291.353 |
Obrero público | 2022Trim4 | 273448.5 | 273.449 |
Obrero público | 2023Trim1 | 316604.5 | 316.605 |
Obrero público | 2023Trim2 | 305609.8 | 305.610 |
Obrero público | 2023Trim3 | 275855.5 | 275.855 |
Obrero público | 2023Trim4 | 286698.9 | 286.699 |
#install.packages("gganimate")
library(gganimate)
## Warning: package 'gganimate' was built under R version 4.3.3
p <- ggplot(dbephcfil_grouped, aes(x = trimestredesc, y = total_people, fill = categocupa)) +
geom_bar(stat = "identity") +
geom_text(aes(label = label), vjust = 1.0, size = 2.5, angle = 60, position = position_stack(vjust = 1.5)) +
labs(title = "Number of People per Trimester and Category of categocupa",
x = "Trimester",
y = "Number of People") +
theme_minimal() +
scale_x_discrete(labels = stringr::str_wrap(dbephcfil_grouped$trimestredesc, width = 15)) +
theme(axis.text.x = element_text(angle = 30, hjust = 1),
legend.position = "none") +
facet_wrap(~categocupa, nrow = 1) +
transition_states(trimestredesc, transition_length = 2, state_length = 1) +
shadow_trail(trail_length = 1)
animate(plot = p, fps = 10)
trimestredesc | categocupa | total_people | label | pct | total_pct |
---|---|---|---|---|---|
2022Trim1 | Cuenta propia | 946034.8 | 946.035 | 33.7 | 99.9 |
2022Trim1 | Doméstico/a | 242057.6 | 242.058 | 8.6 | 99.9 |
2022Trim1 | Empleador/patrón | 137729.8 | 137.730 | 4.9 | 99.9 |
2022Trim1 | Obrero privado | 1202607.2 | 1.202.607 | 42.8 | 99.9 |
2022Trim1 | Obrero público | 279027.0 | 279.027 | 9.9 | 99.9 |
2022Trim2 | Cuenta propia | 938253.0 | 938.253 | 33.6 | 100.0 |
2022Trim2 | Doméstico/a | 216249.4 | 216.249 | 7.8 | 100.0 |
2022Trim2 | Empleador/patrón | 133664.9 | 133.665 | 4.8 | 100.0 |
2022Trim2 | Obrero privado | 1192853.7 | 1.192.854 | 42.8 | 100.0 |
2022Trim2 | Obrero público | 307518.7 | 307.519 | 11.0 | 100.0 |
2022Trim3 | Cuenta propia | 934752.6 | 934.753 | 33.4 | 100.0 |
2022Trim3 | Doméstico/a | 223440.0 | 223.440 | 8.0 | 100.0 |
2022Trim3 | Empleador/patrón | 142146.9 | 142.147 | 5.1 | 100.0 |
2022Trim3 | Obrero privado | 1207377.5 | 1.207.378 | 43.1 | 100.0 |
2022Trim3 | Obrero público | 291352.8 | 291.353 | 10.4 | 100.0 |
2022Trim4 | Cuenta propia | 957773.0 | 957.773 | 34.2 | 99.9 |
2022Trim4 | Doméstico/a | 235505.7 | 235.506 | 8.4 | 99.9 |
2022Trim4 | Empleador/patrón | 143236.7 | 143.237 | 5.1 | 99.9 |
2022Trim4 | Obrero privado | 1186463.7 | 1.186.464 | 42.4 | 99.9 |
2022Trim4 | Obrero público | 273448.5 | 273.449 | 9.8 | 99.9 |
2023Trim1 | Cuenta propia | 894563.4 | 894.563 | 32.0 | 100.0 |
2023Trim1 | Doméstico/a | 230389.3 | 230.389 | 8.2 | 100.0 |
2023Trim1 | Empleador/patrón | 145555.9 | 145.556 | 5.2 | 100.0 |
2023Trim1 | Obrero privado | 1212605.8 | 1.212.606 | 43.3 | 100.0 |
2023Trim1 | Obrero público | 316604.5 | 316.605 | 11.3 | 100.0 |
2023Trim2 | Cuenta propia | 958393.9 | 958.394 | 33.3 | 100.0 |
2023Trim2 | Doméstico/a | 229408.0 | 229.408 | 8.0 | 100.0 |
2023Trim2 | Empleador/patrón | 136868.8 | 136.869 | 4.8 | 100.0 |
2023Trim2 | Obrero privado | 1243618.3 | 1.243.618 | 43.3 | 100.0 |
2023Trim2 | Obrero público | 305609.8 | 305.610 | 10.6 | 100.0 |
2023Trim3 | Cuenta propia | 928409.7 | 928.410 | 32.4 | 100.0 |
2023Trim3 | Doméstico/a | 244127.7 | 244.128 | 8.5 | 100.0 |
2023Trim3 | Empleador/patrón | 139789.8 | 139.790 | 4.9 | 100.0 |
2023Trim3 | Obrero privado | 1277186.4 | 1.277.186 | 44.6 | 100.0 |
2023Trim3 | Obrero público | 275855.5 | 275.855 | 9.6 | 100.0 |
2023Trim4 | Cuenta propia | 937118.4 | 937.118 | 32.4 | 100.1 |
2023Trim4 | Doméstico/a | 248024.7 | 248.025 | 8.6 | 100.1 |
2023Trim4 | Empleador/patrón | 167212.1 | 167.212 | 5.8 | 100.1 |
2023Trim4 | Obrero privado | 1255534.3 | 1.255.534 | 43.4 | 100.1 |
2023Trim4 | Obrero público | 286698.9 | 286.699 | 9.9 | 100.1 |
## Variaciones intermensuales
categocupa | trimestredesc | total_people | label | pct | total_pct | pct_change |
---|---|---|---|---|---|---|
Cuenta propia | 2022Trim2 | 938253.0 | 938.253 | 12.5 | 100.0 | -0.8 |
Cuenta propia | 2022Trim3 | 934752.6 | 934.753 | 12.5 | 100.0 | -0.4 |
Cuenta propia | 2022Trim4 | 957773.0 | 957.773 | 12.8 | 100.0 | 2.5 |
Cuenta propia | 2023Trim1 | 894563.4 | 894.563 | 11.9 | 100.0 | -6.6 |
Cuenta propia | 2023Trim2 | 958393.9 | 958.394 | 12.8 | 100.0 | 7.1 |
Cuenta propia | 2023Trim3 | 928409.7 | 928.410 | 12.4 | 100.0 | -3.1 |
Cuenta propia | 2023Trim4 | 937118.4 | 937.118 | 12.5 | 100.0 | 0.9 |
Doméstico/a | 2022Trim2 | 216249.4 | 216.249 | 11.6 | 100.1 | -10.7 |
Doméstico/a | 2022Trim3 | 223440.0 | 223.440 | 12.0 | 100.1 | 3.3 |
Doméstico/a | 2022Trim4 | 235505.7 | 235.506 | 12.6 | 100.1 | 5.4 |
Doméstico/a | 2023Trim1 | 230389.3 | 230.389 | 12.3 | 100.1 | -2.2 |
Doméstico/a | 2023Trim2 | 229408.0 | 229.408 | 12.3 | 100.1 | -0.4 |
Doméstico/a | 2023Trim3 | 244127.7 | 244.128 | 13.1 | 100.1 | 6.4 |
Doméstico/a | 2023Trim4 | 248024.7 | 248.025 | 13.3 | 100.1 | 1.6 |
Empleador/patrón | 2022Trim2 | 133664.9 | 133.665 | 11.7 | 100.0 | -3.0 |
Empleador/patrón | 2022Trim3 | 142146.9 | 142.147 | 12.4 | 100.0 | 6.3 |
Empleador/patrón | 2022Trim4 | 143236.7 | 143.237 | 12.5 | 100.0 | 0.8 |
Empleador/patrón | 2023Trim1 | 145555.9 | 145.556 | 12.7 | 100.0 | 1.6 |
Empleador/patrón | 2023Trim2 | 136868.8 | 136.869 | 11.9 | 100.0 | -6.0 |
Empleador/patrón | 2023Trim3 | 139789.8 | 139.790 | 12.2 | 100.0 | 2.1 |
Empleador/patrón | 2023Trim4 | 167212.1 | 167.212 | 14.6 | 100.0 | 19.6 |
Obrero privado | 2022Trim2 | 1192853.7 | 1.192.854 | 12.2 | 99.9 | -0.8 |
Obrero privado | 2022Trim3 | 1207377.5 | 1.207.378 | 12.3 | 99.9 | 1.2 |
Obrero privado | 2022Trim4 | 1186463.7 | 1.186.464 | 12.1 | 99.9 | -1.7 |
Obrero privado | 2023Trim1 | 1212605.8 | 1.212.606 | 12.4 | 99.9 | 2.2 |
Obrero privado | 2023Trim2 | 1243618.3 | 1.243.618 | 12.7 | 99.9 | 2.6 |
Obrero privado | 2023Trim3 | 1277186.4 | 1.277.186 | 13.1 | 99.9 | 2.7 |
Obrero privado | 2023Trim4 | 1255534.3 | 1.255.534 | 12.8 | 99.9 | -1.7 |
Obrero público | 2022Trim2 | 307518.7 | 307.519 | 13.2 | 100.1 | 10.2 |
Obrero público | 2022Trim3 | 291352.8 | 291.353 | 12.5 | 100.1 | -5.3 |
Obrero público | 2022Trim4 | 273448.5 | 273.449 | 11.7 | 100.1 | -6.1 |
Obrero público | 2023Trim1 | 316604.5 | 316.605 | 13.6 | 100.1 | 15.8 |
Obrero público | 2023Trim2 | 305609.8 | 305.610 | 13.1 | 100.1 | -3.5 |
Obrero público | 2023Trim3 | 275855.5 | 275.855 | 11.8 | 100.1 | -9.7 |
Obrero público | 2023Trim4 | 286698.9 | 286.699 | 12.3 | 100.1 | 3.9 |
categocupa | trimestredesc | total_people | label | pct | total_pct | pct_change |
---|---|---|---|---|---|---|
Cuenta propia | 2023Trim1 | 894563.4 | 894.563 | 11.9 | 100.0 | -5.4 |
Cuenta propia | 2023Trim2 | 958393.9 | 958.394 | 12.8 | 100.0 | 2.1 |
Cuenta propia | 2023Trim3 | 928409.7 | 928.410 | 12.4 | 100.0 | -0.7 |
Cuenta propia | 2023Trim4 | 937118.4 | 937.118 | 12.5 | 100.0 | -2.2 |
Doméstico/a | 2023Trim1 | 230389.3 | 230.389 | 12.3 | 100.1 | -4.8 |
Doméstico/a | 2023Trim2 | 229408.0 | 229.408 | 12.3 | 100.1 | 6.1 |
Doméstico/a | 2023Trim3 | 244127.7 | 244.128 | 13.1 | 100.1 | 9.3 |
Doméstico/a | 2023Trim4 | 248024.7 | 248.025 | 13.3 | 100.1 | 5.3 |
Empleador/patrón | 2023Trim1 | 145555.9 | 145.556 | 12.7 | 100.0 | 5.7 |
Empleador/patrón | 2023Trim2 | 136868.8 | 136.869 | 11.9 | 100.0 | 2.4 |
Empleador/patrón | 2023Trim3 | 139789.8 | 139.790 | 12.2 | 100.0 | -1.7 |
Empleador/patrón | 2023Trim4 | 167212.1 | 167.212 | 14.6 | 100.0 | 16.7 |
Obrero privado | 2023Trim1 | 1212605.8 | 1.212.606 | 12.4 | 99.9 | 0.8 |
Obrero privado | 2023Trim2 | 1243618.3 | 1.243.618 | 12.7 | 99.9 | 4.3 |
Obrero privado | 2023Trim3 | 1277186.4 | 1.277.186 | 13.1 | 99.9 | 5.8 |
Obrero privado | 2023Trim4 | 1255534.3 | 1.255.534 | 12.8 | 99.9 | 5.8 |
Obrero público | 2023Trim1 | 316604.5 | 316.605 | 13.6 | 100.1 | 13.5 |
Obrero público | 2023Trim2 | 305609.8 | 305.610 | 13.1 | 100.1 | -0.6 |
Obrero público | 2023Trim3 | 275855.5 | 275.855 | 11.8 | 100.1 | -5.3 |
Obrero público | 2023Trim4 | 286698.9 | 286.699 | 12.3 | 100.1 | 4.8 |
library(gganimate)
p <- ggplot(dbephcfil_grouped, aes(x = trimestredesc, y = pct_change, fill = categocupa)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Percentage of People per Trimester and Category of categocupa",
x = "Trimester",
y = "Percentage of People") +
theme_minimal() +
geom_text(aes(label = pct_change), vjust = 1.0, size = 3, angle = 30, position = position_stack(vjust = 0.5)) +
scale_x_discrete(labels = stringr::str_wrap(dbephcfil_grouped$trimestredesc, width = 15)) +
theme(axis.text.x = element_text(angle = 30, hjust = 1),
legend.position = "none") +
facet_wrap(~categocupa, ncol = 1) +
transition_states(trimestredesc, transition_length = 2, state_length = 1) +
shadow_trail(trail_length = 1)
animate(plot = p, fps = 10)