Volveremos a usar el paquete summarytools ahora para tablas que muestren frecuencias conjuntas de dos variables
library(summarytools)
Para generar la tabla se estado por sexo, primero volvemos ambas factores y las rotulamos
eph.4.22$ESTADO<-as.factor(eph.4.22$ESTADO)
levels(eph.4.22$ESTADO)<-c(NA, "ocupade", "desocupade", "inactive", NA)
eph.4.22$sexo<-as.factor(eph.4.22$CH04)
levels(eph.4.22$sexo)<-c("varones", "mujeres")
ctable(eph.4.22$ESTADO, eph.4.22$sexo)
## Cross-Tabulation, Row Proportions
## ESTADO * sexo
## Data Frame: eph.4.22
##
## ------------ ------ --------------- --------------- ----------------
## sexo varones mujeres Total
## ESTADO
## ocupade 11769 (55.5%) 9433 (44.5%) 21202 (100.0%)
## desocupade 615 (51.1%) 588 (48.9%) 1203 (100.0%)
## inactive 7532 (37.9%) 12339 (62.1%) 19871 (100.0%)
## <NA> 3207 (51.2%) 3062 (48.8%) 6269 (100.0%)
## Total 23123 (47.6%) 25422 (52.4%) 48545 (100.0%)
## ------------ ------ --------------- --------------- ----------------
Nuevamente tenemos en esta salida presentes los casos perdidos cuyo reporte no incluiremos, pero su exclusión se pide un modo diferente
ctable(eph.4.22$ESTADO, eph.4.22$sexo, useNA = "no")
## Cross-Tabulation, Row Proportions
## ESTADO * sexo
## Data Frame: eph.4.22
##
## ------------ ------ --------------- --------------- ----------------
## sexo varones mujeres Total
## ESTADO
## ocupade 11769 (55.5%) 9433 (44.5%) 21202 (100.0%)
## desocupade 615 (51.1%) 588 (48.9%) 1203 (100.0%)
## inactive 7532 (37.9%) 12339 (62.1%) 19871 (100.0%)
## Total 19916 (47.1%) 22360 (52.9%) 42276 (100.0%)
## ------------ ------ --------------- --------------- ----------------
El argumento para controlar los casos perdidos no es lógico como en freq, sino de carácter, por lo que debe indicarse entre comillas. El pedido de ayuda con ?ctable, nos recuerda esto cuando lo olvidamos.
La tabla muestra frecuencias absolutas y además entre paréntesis, las relativas por filas, ese es el modo de cálculo por defecto. La lectura de una de estas frecuencias es, por ejemplo
El 48.9% de las personas desocupadas son mujeres
Si nos interesan las frecuencias relativas al total usamos
ctable(eph.4.22$ESTADO, eph.4.22$sexo, useNA = "no", prop = "t")
## Cross-Tabulation, Total Proportions
## ESTADO * sexo
## Data Frame: eph.4.22
##
## ------------ ------ --------------- --------------- ----------------
## sexo varones mujeres Total
## ESTADO
## ocupade 11769 (27.8%) 9433 (22.3%) 21202 ( 50.2%)
## desocupade 615 ( 1.5%) 588 ( 1.4%) 1203 ( 2.8%)
## inactive 7532 (17.8%) 12339 (29.2%) 19871 ( 47.0%)
## Total 19916 (47.1%) 22360 (52.9%) 42276 (100.0%)
## ------------ ------ --------------- --------------- ----------------
El argumento prop también es de carácter por lo que la
opción va entre comillas.
La lectura de la misma celda es ahora
El 1.4% del total de personas, son mujeres desocupadas
Las posibilidades para solicitar frecuencias relativas son “r” (filas, la opción por defecto), “c” (columnas), “t” (total), o “n” (ninguna).
Para el caso de relativas por columnas
ctable(eph.4.22$ESTADO, eph.4.22$sexo, useNA = "no", prop = "c")
## Cross-Tabulation, Column Proportions
## ESTADO * sexo
## Data Frame: eph.4.22
##
## ------------ ------ ---------------- ---------------- ----------------
## sexo varones mujeres Total
## ESTADO
## ocupade 11769 ( 59.1%) 9433 ( 42.2%) 21202 ( 50.2%)
## desocupade 615 ( 3.1%) 588 ( 2.6%) 1203 ( 2.8%)
## inactive 7532 ( 37.8%) 12339 ( 55.2%) 19871 ( 47.0%)
## Total 19916 (100.0%) 22360 (100.0%) 42276 (100.0%)
## ------------ ------ ---------------- ---------------- ----------------
La lectura de la misma delda de antes es que
El 2.6% de las mujeres está desocupada
Si nos interesa calcular tasas de desocupación, cuya definición en la proporción de personas desocupadas respecto de la población económicamente activa, debemos tomar un subconjunto de la base, que contenga solo esa población. Se llaman económicamente activas aquellaspersonas que están ocupadas o desocupadas, por lo que nuestra nueva base “actives” retendrá solo las filas en que ESTDO sea ocupade o inactive, y mantendrá intactas todas las columnas
actives<-eph.4.22[eph.4.22$ESTADO=="ocupade" |eph.4.22$ESTADO=="desocupade",]
Verificamos
table(actives$ESTADO)
##
## ocupade desocupade inactive
## 21202 1203 0
Y descartamos la categoría ausente, descartando los niveles no usados, con la instrucción droplevels
actives$ESTADO<- droplevels(actives$ESTADO)
Nuevamente, la tabla
table(actives$ESTADO)
##
## ocupade desocupade
## 21202 1203
Ahora podemos ocmparar las tasas de desocupación entre varones y mujeres, teniuendo en cuata los factores de ponderación
ctable(actives$ESTADO, actives$sexo, useNA = "no", prop = "c", weights = actives$PONDERA)
## Warning in ctable(actives$ESTADO, actives$sexo, useNA = "no", prop = "c", :
## missing values on weight variable have been detected and were treated as zeroes
## Cross-Tabulation, Column Proportions
## ESTADO * sexo
## Data Frame: actives
##
## ------------ ------ -------------------- -------------------- ---------------------
## sexo varones mujeres Total
## ESTADO
## ocupade 7338953.0 ( 94.0%) 5722149.0 ( 93.3%) 13061102.0 ( 93.7%)
## desocupade 467516.0 ( 6.0%) 407952.0 ( 6.7%) 875468.0 ( 6.3%)
## Total 7806469.0 (100.0%) 6130101.0 (100.0%) 13936570.0 (100.0%)
## ------------ ------ -------------------- -------------------- ---------------------
La lectura de este resultado es que
La tasa de desocupación en el cuarto trimestre de 2022 era del
6.3% para el total de la población. Entre los varones alcanzó el 6%,
mientras que entre las mujeres, el 6.7%.
De manera equivalente puede hacerse para grupos de edad, niveles de educación, etc.