FORMATEO DE LA BASE ENAHO 2023 (queremos que este más delimitada): Jovenes de 15-29 años Solo las variables utilizadas en el trabajo Creacion de 2 variables: ID_UNICO, EDAD, 4 modulos: caracteristcas de los miembros del hogar, salud, educacion y empleo e ingresos

setwd("C:/Users/Adriana/Desktop/INDICE DE DESARROLLO JUVENIL/")
library(haven)
data_EDUCACION <- read_sav("906-Modulo03-EDUCACION/Enaho01A-2023-300.sav")
data_SALUD <- read_sav("906-Modulo04-SALUD/Enaho01A-2023-400.sav")
data_EMPLEO_INGRESOS <- read_sav("906-Modulo05-EMPLEO E INGRESOS/Enaho01a-2023-500.sav")
data_CARACTERISTICAS <- read_sav("C:/Users/Adriana/Desktop/INDICE DE DESARROLLO JUVENIL/906-Modulo02_caracteristicasdemiembros/Enaho01-2023-200.sav")

Crear el ID unico por persona

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Crear ID en cada base
data_EDUCACION <- data_EDUCACION %>% mutate(ID_UNICO = paste(CONGLOME, VIVIENDA, HOGAR, CODPERSO, sep = "_"))
data_SALUD <- data_SALUD %>% mutate(ID_UNICO = paste(CONGLOME, VIVIENDA, HOGAR, CODPERSO, sep = "_"))
data_EMPLEO_INGRESOS <- data_EMPLEO_INGRESOS %>% mutate(ID_UNICO = paste(CONGLOME, VIVIENDA, HOGAR, CODPERSO, sep = "_"))
data_CARACTERISTICAS<- data_CARACTERISTICAS %>% mutate(ID_UNICO = paste(CONGLOME, VIVIENDA, HOGAR, CODPERSO, sep = "_"))

Agregar variable EDAD usando el año de nacimiento

data_SALUD$P400A3=as.numeric(data_SALUD$P400A3)
data_SALUD <- data_SALUD %>% mutate(EDAD = 2023 - data_SALUD$P400A3)
str(data_SALUD$EDAD)
##  num [1:112530] 44 42 10 8 61 60 39 31 30 8 ...
data_SALUD_JOVENES <- data_SALUD %>% filter(EDAD >= 15 & EDAD <= 29)

# Merge 1: unir EDUCACION con SALUD
base_educacion_salud <- inner_join(data_SALUD_JOVENES, data_EDUCACION, by = "ID_UNICO")

# Merge 2: unir el resultado anterior con EMPLEO_INGRESOS
base_final_jovenes <- inner_join(base_educacion_salud, data_EMPLEO_INGRESOS, by = "ID_UNICO")
BASE_MODELO <- inner_join(base_final_jovenes, data_CARACTERISTICAS, by = "ID_UNICO")

# Instalar y cargar el paquete necesario
if (!require("haven")) install.packages("haven")
library(haven)

# Seleccionar las variables
vars <- c("ID_UNICO", "EDAD", "P207.y.y", "P301A", "P314A", "OCUPINF", "P524E1", "P530A", "P523", "DOMINIO.x", "P513A1", "P4191", "P4192", "P4193", "P4194", "P4195", "P4196", "P4197", "P4198")

# Crear la sub base (asumiendo que 'base_jovenes' es tu base principal)
sub_base <- BASE_MODELO[, vars]

# Guardar como archivo SPSS (.sav)
write_sav(sub_base, "sub_base_7variables.sav")