1 La base de datos

1.1 La encuesta de hogares

1.2 Gestión de datos

1.2.1 Las variables de la base de datos

1.2.2 Variable sexo

Requiere de una recodificación

Tabla de frecuencia

tabla1=tab1(baseEPH2020$P06)

1.2.3 Variable area de residencia

baseEPH2020$AREA <- factor(baseEPH2020$AREA, labels = c("Urbana", "Rural"))
tabla2=tab1(baseEPH2020$AREA)

1.2.4 Variable nivel de estudios

summary(baseEPH2020$añoest)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00    4.00    7.00    7.86   12.00   99.00    1447
tabla4=tab1(baseEPH2020$añoest)

tabla4
## baseEPH2020$añoest : 
##         Frequency   %(NA+)   %(NA-)
## 0            1265      7.2      7.8
## 1             558      3.2      3.5
## 2             772      4.4      4.8
## 3             974      5.5      6.0
## 4             905      5.1      5.6
## 5             891      5.1      5.5
## 6            2471     14.1     15.3
## 7             700      4.0      4.3
## 8             692      3.9      4.3
## 9            1088      6.2      6.7
## 10            503      2.9      3.1
## 11            524      3.0      3.2
## 12           2096     11.9     13.0
## 13            296      1.7      1.8
## 14            445      2.5      2.8
## 15            539      3.1      3.3
## 16            727      4.1      4.5
## 17            448      2.5      2.8
## 18            229      1.3      1.4
## 99             12      0.1      0.1
## <NA>         1447      8.2      0.0
##   Total     17582    100.0    100.0

1.2.5 Quintiles de ingreso para el total país

tabla5=tab1(baseEPH2020$quintili)

tabla5
## baseEPH2020$quintili : 
##         Frequency   %(NA+)   %(NA-)
## 1            3774     21.5     21.5
## 2            3664     20.8     20.9
## 3            3390     19.3     19.3
## 4            3277     18.6     18.7
## 5            3437     19.5     19.6
## <NA>           40      0.2      0.0
##   Total     17582    100.0    100.0

Tarea: Crear una variable que permita clasificar a las personas en quienes tienen o no un titulo universitario

1.2.6 Categoría de ocupación

tabla6=tab1(baseEPH2020$CATE_PEA)

tabla6
## baseEPH2020$CATE_PEA : 
##         Frequency   %(NA+)   %(NA-)
## 1             825      4.7      9.0
## 2            3065     17.4     33.4
## 3             421      2.4      4.6
## 4            3226     18.3     35.1
## 5            1007      5.7     11.0
## 6             633      3.6      6.9
## 9               8      0.0      0.1
## <NA>         8397     47.8      0.0
##   Total     17582    100.0    100.0
baseEPH2020$CATE_PEA <- factor(baseEPH2020$CATE_PEA, 
                        labels = c("Empleado / obrero público",
                                   "Empleado / obrero privado","Empleador o patrón","Trabajador por cuenta propia",
                                   "Trabajador familiar no remunerado","Empleado doméstico", "NR"))
tabla6=tab1(baseEPH2020$CATE_PEA)

tabla6
## baseEPH2020$CATE_PEA : 
##                                   Frequency   %(NA+)   %(NA-)
## Empleado / obrero público               825      4.7      9.0
## Empleado / obrero privado              3065     17.4     33.4
## Empleador o patrón                      421      2.4      4.6
## Trabajador por cuenta propia           3226     18.3     35.1
## Trabajador familiar no remunerado      1007      5.7     11.0
## Empleado doméstico                      633      3.6      6.9
## NR                                        8      0.0      0.1
## NA's                                   8397     47.8      0.0
##   Total                               17582    100.0    100.0